所以关于英伟达在推理领域的战略动作,有一些有趣的Groq新闻在流传。事实证明,黄仁勋刚刚揭示了他们最初为何追逐Groq背后的真正思考。



去年十二月,英伟达投入$20 十亿美元收购Groq的推理芯片业务。创始人Jonathan Ross和他的核心团队加入了英伟达,但事情是——Groq仍然独立运营。然后在今年三月的GTC上,他们展示了基于三星4纳米工艺制造的Groq 3 LPU芯片。性能数据相当惊人:在万亿参数模型上,每兆瓦推理吞吐量比英伟达的Blackwell NVL72高出35倍。

但真正引起我注意的是黄仁勋对市场动态的解释。他谈到推理市场正逐渐分裂成不同的细分市场。多年来,大家都专注于一件事:最大化吞吐量。但这种情况正在改变。代币经济学发生了巨大变化。不同的用户现在对响应速度的价值认知不同,他们愿意为此支付相应的价格。

黄仁勋说得很清楚:如果你能为开发者提供响应更快的代币,让他们的生产力更高,他们就会为这种能力支付溢价。这是一个相对较新的市场,最近才出现。它本质上是在扩展帕累托前沿——在现有的高吞吐解决方案旁边,增加了一个低延迟、更高每代币定价的细分市场。

这就是Groq的LPU架构的用武之地。它是为确定性低延迟而设计的,这几乎与GPU优化的目标相反。GPU在吞吐量方面表现出色。因此,Groq的收购基本上弥补了英伟达产品策略中的一个空白。你可以用两种不同的方式运行相同的模型:在GPU上最大化吞吐,或者使用Groq的LPU实现超低延迟。不同的定价模型适用于不同的用例。

这里的Groq新闻真正突显了AI推理市场正逐步成熟,不再仅仅依赖原始计算能力。这关乎理解不同客户的实际需求,并为每个细分市场打造合适的工具。如果你问我,这是一个相当聪明的举措。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论