谷歌刚刚在拉斯维加斯的Cloud Next大会上采取了一个非常战略性的动作。同步推出了两款第八代新型TPU处理器,这标志着公司对AI市场看法的一个重要转变。



谷歌首次完全区分了训练和推理的芯片。拥有专注于训练AI模型的TPU 8t,以及优化用于在生产中运行这些模型的TPU 8i。这是一个明确的战术变化——他们认识到这两项任务的需求截然不同。

性能数字非常有趣。TPU 8t相比上一代每瓦效率提升124%,而TPU 8i则提升了117%。与去年11月推出的Ironwood相比,TPU 8t在价格相同的情况下提供了2.8倍的性能,而8i的能效提升了80%。这些提升都不是微不足道的。

TPU 8t最引人注目的是其在单一系统中扩展到9600个单元的能力。谷歌非常清楚,在如此规模的设施中,能源已成为数据中心的关键限制因素。因此,能效成为了最高优先级。

而TPU 8i则采取了不同的策略。每个芯片配备了384MB的SRAM——是Ironwood的三倍。这在推理中非常合理,因为芯片需要处理多个推理步骤,而不必频繁外部存取数据。非常适合运行复杂的AI代理。

这两款处理器预计将在2026年底上市。Alphabet的CEO桑达尔·皮查伊明确表示,这一架构是为了“经济高效地同时运行数百万个代理”。这才是重点——不仅仅是拥有更好的芯片,而是要在预算范围内实现。

在软件方面,谷歌推出了Gemini Enterprise Agent Platform,新增了多项功能。Memory Bank和Memory Profile允许代理记住与用户的过去交互——解决了旧工具的一个实际问题。还有Agent Simulation,用于在发布前进行更好的测试。

该平台的Projects整合了Workspace、OneDrive和企业聊天的数据,为代理提供上下文。此外,还推出了面向普通员工的Gemini Enterprise,定位为“每个人的AI助手”,无需编写代码。

这一切都是硬件和软件的双重攻势——针对Nvidia、OpenAI和Anthropic。谷歌非常清楚,硅谷的工程师经常在Anthropic的Claude和OpenAI的Codex之间切换,进行AI开发,很少考虑谷歌的工具。这显然让领导层感到不满。

TPU的采用正在加速。Citadel Securities已经在其软件中使用了谷歌的TPU。美国能源部的17个国家实验室也在使用基于TPU的协作工具。Meta签署了长期协议,使用谷歌的TPU,Anthropic承诺提供以吉瓦为规模的计算能力。

DA Davidson的分析师估计,去年九月,谷歌的TPU和DeepMind业务的总价值超过9000亿美元。

值得注意的是,谷歌没有直接将新TPU与Nvidia的产品进行比较。与此同时,Nvidia正准备推出一条新系列,融合了以20亿美元收购的Groq技术,专注于超低延迟推理。Nvidia的黄仁勋表示,超过20%的AI负载可以由这种芯片更好地处理。

谷歌正在测试在客户数据中心部署TPU,并推动与第三方工具的兼容性。但供应链瓶颈以及模型快速迭代与芯片开发周期长达数年的不匹配,仍然是扩大规模的实际挑战。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言