去年十二月，英伟达投入$20 十亿美元收购Groq的推理芯片业务。创始人Jonathan Ross和他的核心团队加入了英伟达，但事情是——Groq仍然独立运营。然后在今年三月的GTC上，他们展示了基于三星4纳米工艺制造的Groq 3 LPU芯片。性能数据相当惊人：在万亿参数模型上，每兆瓦推理吞吐量比英伟达的Blackwell NVL72高出35倍。

但真正引起我注意的是黄仁勋对市场动态的解释。他谈到推理市场正逐渐分裂成不同的细分市场。多年来，大家都专注于一件事：最大化吞吐量。但这种情况正在改变。代币经济学发生了巨大变化。不同的用户现在对响应速度的价值认知不同，他们愿意为此支付相应的价格。

黄仁勋说得很清楚：如果你能为开发者提供响应更快的代币，让他们的生产力更高，他们就会为这种能力支付溢价。这是一个相对较新的市场，最近才出现。它本质上是在扩展帕累托前沿——在现有的高吞吐解决方案旁边，增加了一个低延迟、更高每代币定价的细分市场。

这就是Groq的LPU架构的用武之地。它是为确定性低延迟而设计的，这几乎与GPU优化的目标相反。GPU在吞吐量方面表现出色。因此，Groq的收购基本上弥补了英伟达产品策略中的一个空白。你可以用两种不同的方式运行相同的模型：在GPU上最大化吞吐，或者使用Groq的LPU实现超低延迟。不同的定价模型适用于不同的用例。

这里的Groq新闻真正突显了AI推理市场正逐步成熟，不再仅仅依赖原始计算能力。这关乎理解不同客户的实际需求，并为每个细分市场打造合适的工具。如果你问我，这是一个相当聪明的举措。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

请输入评论内容

暂无评论

热门话题
查看更多
#
WCTC交易王PK
18.41万热度
#
加密市场行情震荡
24.45万热度
#
rsETH攻击事件后续进展
8.11万热度
#
美伊谈判陷入僵局
19.35万热度
#
ETH链Meme币FLORK拉升
4.38万热度

所以关于英伟达在推理领域的战略动作，有一些有趣的Groq新闻在流传。事实证明，黄仁勋刚刚揭示了他们最初为何追逐Groq背后的真正思考。

热门话题

WCTC交易王PK

加密市场行情震荡

rsETH攻击事件后续进展

美伊谈判陷入僵局

ETH链Meme币FLORK拉升

置顶