🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
刚刚发现了一件一直在悄悄重塑整个AI基础设施格局的事情,说实话,少有人在谈论它,真是疯狂。
多年来,我们一直迷恋GPU稀缺——那是计算发生的地方,对吧?但事实是:我们一直看错了问题。真正的限制不再是推理,而是CPU。我是认真的——当你需要协调复杂的代理工作流程、处理API调用、管理数据库,以及应对无法全部装入GPU内存的大型上下文窗口时,你的处理器就变成了瓶颈,而昂贵的GPU就在那里等待。
让我拆解一下市场上到底发生了什么。AMD的CEO Lisa Su基本确认了这种转变是真实的。他们的数据显示中心收入在上个季度达到了54亿美元,同比增长39%。第五代EPYC处理器单独占据了超过一半的服务器CPU收入,我们也看到运行EPYC的云实例增长超过50%。这是AMD首次占据超过40%的服务器CPU市场份额。这不是偶然——那是因为每个人突然意识到,他们需要强大的CPU算力,才能大规模运行AI代理。
与此同时,英特尔一直在努力,但也在聪明地应对。他们刚刚与谷歌签订了多年的协议,专门部署至强(Xeon)处理器到AI数据中心。宣传点是:CPU和专用加速器现在才是真正的性能驱动力,而不仅仅是配角。甚至Elon Musk也为他的Terafab项目定制了英特尔的芯片——这是一个巨大的信号,表明基础设施的未来方向。
这为什么重要:代理工作负载与聊天机器人根本不同。用代理时,你不仅仅是在生成Token——你还在进行多步推理、协调API、管理状态、读写数据库。去年Georgia Tech的一篇论文显示,CPU端的工具处理可以占到总延迟的50%到90%。GPU已经准备就绪,但CPU还在等待工具响应。再加上现在的上下文窗口已经超过一百万Token,突然之间,你需要巨大的CPU内存和带宽,只为了存储那些装不下GPU的KV缓存。
NVIDIA的回应很有意思。他们的Grace CPU只有72核,而AMD的有128核,英特尔的阵容也更大。但这其实是有意为之——他们在优化CPU和GPU之间的效率,而不是追求核数的绝对数量。他们强调CPU实际上是一个协调中心,而不是通用处理器。凭借NVLink互联技术达到1.8 TB/s的带宽,CPU可以直接访问GPU内存,这彻底改变了你管理这些庞大KV缓存的方式。
市场信号非常明确。美国银行预测,到2030年,CPU市场可能会从$27 十亿翻倍到$60 十亿,几乎全部由AI驱动。而且你听着——在亚马逊与OpenAI的$38 十亿合作中,他们明确计划部署数千万个CPU。这才是新的指标。我们不再只是谈几百个GPU,而是在构建完整的CPU协调基础设施层。
真正发生的事情是,我们正从GPU受限的时代,转向系统级效率的时代。那些懂得如何平衡CPU-GPU协作、管理庞大内存层级、高效处理复杂代理工作流程的公司,才是赢家。现在不再是单个组件的问题,而是整个系统的协同工作。如果你在2026年还没有考虑你的CPU策略,那你已经落后了。