# technology

298.19万
💀 R.I.P. ChatGPT: Grok 4 刚刚打破了每个 AI 基准 💀
xAI刚刚发布了有史以来最强大的AI模型!
经过几个月的期待,埃隆·马斯克的团队正式发布了Grok 4,基准数据绝对疯狂。它是新的SOTA大型语言模型。
Grok 4 提供了超越其他模型的最新能力:
🧠 人类最后的考试掌握 - 在有史以来最具挑战性的学术基准上取得了45%的准确率,而其他顶尖模型勉强达到25%。它在每个学术领域都超越了人类的专业知识。
🏆 人工分析第 #1 - 正式被认定为顶级 AI 模型,智力指数达到 73 分,超越了所有在推理、知识和解决问题能力方面的竞争对手。
🎯 ARC-AGI 冠军 - 在视觉模式识别中得分16.2%,几乎是Claude Opus 4表现的两倍。这个基准测量纯粹的智力和推理能力。
💻 编码主宰 - Grok 4 Code 变体在 SWE-Bench 上达到了 75%,在实际软件工程任务中超越了其他所有模型。直接集成到开发环境中。
⚡ 多智能体智能 - Grok 4 Heavy 利用协作 AI 代理解决复杂问题,使准确性超越任何单一模型所能达到的水平。
🔮 实时知识 - 与静态模型不同,Grok 4 访问来自 X 的实时数据,提供当前的信息和上下文,而其他 AI 则无法匹配。
🚀 经济天才 - 在商业模拟测试中超越了人类和所有 AI 模型,创造了
GROK-2.25%
JST0.29%
EVERY-3.6%
XAI-0.57%
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
加载更多

加入 4000万 人汇聚的头部社区

⚡️ 与 4000万 人一起参与加密货币热潮讨论
💬 与喜爱的头部博主互动
👍 查看感兴趣的内容
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)