2026-04-27 08:07:21

刚刚发现了一件一直在悄悄重塑整个AI基础设施格局的事情，说实话，少有人在谈论它，真是疯狂。

多年来，我们一直迷恋GPU稀缺——那是计算发生的地方，对吧？但事实是：我们一直看错了问题。真正的限制不再是推理，而是CPU。我是认真的——当你需要协调复杂的代理工作流程、处理API调用、管理数据库，以及应对无法全部装入GPU内存的大型上下文窗口时，你的处理器就变成了瓶颈，而昂贵的GPU就在那里等待。

让我拆解一下市场上到底发生了什么。AMD的CEO Lisa Su基本确认了这种转变是真实的。他们的数据显示中心收入在上个季度达到了54亿美元，同比增长39%。第五代EPYC处理器单独占据了超过一半的服务器CPU收入，我们也看到运行EPYC的云实例增长超过50%。这是AMD首次占据超过40%的服务器CPU市场份额。这不是偶然——那是因为每个人突然意识到，他们需要强大的CPU算力，才能大规模运行AI代理。

与此同时，英特尔一直在努力，但也在聪明地应对。他们刚刚与谷歌签订了多年的协议，专门部署至强（Xeon）处理器到AI数据中心。宣传点是：CPU和专用加速器现在才是真正的性能驱动力，而不仅仅是配角。甚至Elon Musk也为他的Terafab项目定制了英特尔的芯片——这是一个巨大的信号，表明基础设施的未来方向。

这为什么重要：代理工作负载与聊天机器人根本不同。用代理时，你不仅仅是在生成Token——你还在进行多步推理、协调API、管理状态、读写数据库。去年Georgia Tech的一篇论文显示，CPU端的工具处理可以占到总延迟的50%到90%。GPU已经准备就绪，但CPU还在等待工具响应。再加上现在的上下文窗口已经超过一百万Token，突然之间，你需要巨大的CPU内存和带宽，只为了存储那些装不下GPU的KV缓存。

NVIDIA的回应很有意思。他们的Grace CPU只有72核，而AMD的有128核，英特尔的阵容也更大。但这其实是有意为之——他们在优化CPU和GPU之间的效率，而不是追求核数的绝对数量。他们强调CPU实际上是一个协调中心，而不是通用处理器。凭借NVLink互联技术达到1.8 TB/s的带宽，CPU可以直接访问GPU内存，这彻底改变了你管理这些庞大KV缓存的方式。

市场信号非常明确。美国银行预测，到2030年，CPU市场可能会从$27 十亿翻倍到$60 十亿，几乎全部由AI驱动。而且你听着——在亚马逊与OpenAI的$38 十亿合作中，他们明确计划部署数千万个CPU。这才是新的指标。我们不再只是谈几百个GPU，而是在构建完整的CPU协调基础设施层。

真正发生的事情是，我们正从GPU受限的时代，转向系统级效率的时代。那些懂得如何平衡CPU-GPU协作、管理庞大内存层级、高效处理复杂代理工作流程的公司，才是赢家。现在不再是单个组件的问题，而是整个系统的协同工作。如果你在2026年还没有考虑你的CPU策略，那你已经落后了。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
WCTC交易王PK
32.09万热度
#
加密市场小幅下跌
22.1万热度
#
Polymarket每日热点
65.55万热度
#
Solana发布量子路线图
1274.8万热度
#
GateCard一拍即付
1.27万热度

刚刚发现了一件一直在悄悄重塑整个AI基础设施格局的事情，说实话，少有人在谈论它，真是疯狂。

热门话题

WCTC交易王PK

加密市场小幅下跌

Polymarket每日热点

Solana发布量子路线图

GateCard一拍即付

置顶