Os funcionários da OpenAI criticaram publicamente os resultados enganosos dos testes de Referência do novo modelo de IA Grok3 da xAI

Geração do resumo em andamento

A ChainCatcher reporta que um funcionário da OpenAI acusou publicamente a empresa xAI, pertencente a Musk, de lançar resultados enganosos nos testes de Referência do seu mais recente modelo de IA, Grok3. Igor Babushkin, co-fundador da xAI, insistiu que a empresa não agiu de forma inadequada. O gráfico da XAI mostra que as duas versões do Grok3 - Grok3 Reasoning Beta e Grok3 mini Reasoning - superaram o modelo atualmente mais poderoso da OpenAI, o o3-mini-high, na AIME 2025. No entanto, os funcionários da OpenAI logo apontaram na plataforma X que o gráfico da XAI não incluía a pontuação AIME 2025 do o3-mini-high sob a condição 'cons@64'. Bobushkin afirmou na plataforma X que a OpenAI também publicou gráficos de teste Referência enganosos no passado, embora esses gráficos fossem utilizados para comparar o desempenho dos seus próprios modelos.

XAI-0.1%

GROK-3.3%

Ver original

O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.

1 Curtidas

Recompensa
1
Comentário
Compartilhar

Comentário

0/400

Sem comentários

Tema
#BTC#
192k Postagens
#ETH#
120k Postagens
#PI#
94k Postagens
4#GateioInto11#
76k Postagens
5#ContentStar#
64k Postagens
6#BOME#
59k Postagens
7#GT#
56k Postagens
8#DOGE#
53k Postagens
9#MAGA#
52k Postagens
10#SLERF#
51k Postagens

Marcar

sitemap