OpenAI 员工公开指责 xAI 最新 AI 模型 Grok3 的基准测试结果具有误导性

摘要生成中

ChainCatcher 消息，据金十报道，OpenAI 的一名员工公开指责马斯克旗下的xAI公司，称其发布的最新 AI 模型 Grok3 的基准测试结果具有误导性。对此，xAI 的联合创始人伊戈尔・巴布什金（Igor Babushkin）则坚称公司并无不当。 xAI 的图表显示，Grok3 的两个版本——Grok3 Reasoning Beta 和 Grok3 mini Reasoning——在 AIME 2025 上的表现超过了 OpenAI 当前最强的可用模型 o3-mini-high。然而，OpenAI 的员工很快在 X 平台上指出，xAI的图表并未包含 o3-mini-high 在“cons@64”条件下的 AIME 2025 得分。巴布什金在 X 平台上辩称，OpenAI 过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

XAI0.19%

GROK-3.57%

查看原文

本页面内容仅供参考，非招揽或要约，也不提供投资、税务或法律咨询。详见声明了解更多风险披露。

1人点赞了这条动态

赞赏
1
评论
分享

0/400

暂无评论

话题
#BTC#
192k 帖子
#ETH#
120k 帖子
#PI#
94k 帖子
4#GateioInto11#
76k 帖子
5#ContentStar#
64k 帖子
6#BOME#
59k 帖子
7#GT#
56k 帖子
8#DOGE#
53k 帖子
9#MAGA#
52k 帖子
10#SLERF#
51k 帖子