Los empleados de OpenAI criticaron públicamente los resultados de la prueba del último modelo de IA Grok3 de xAI como Indicador de referencia, diciendo que son engañosos.
ChainCatcher informa, según informes de Jinshi, un empleado de OpenAI acusó públicamente a xAI, una empresa bajo el liderazgo de Musk, de tener resultados engañosos en la prueba del último modelo de IA, Grok3, del Indicador de referencia. Igor Babushkin, cofundador de xAI, afirmó firmemente que la empresa no ha actuado de manera inapropiada.
El gráfico de XAI muestra que las dos versiones de Grok3 - Grok3 Reasoning Beta y Grok3 mini Reasoning - superan el rendimiento del modelo más fuerte actualmente disponible de OpenAI, o3-mini-high, en AIME 2025. Sin embargo, los empleados de OpenAI señalaron rápidamente en la plataforma X que el gráfico de XAI no incluía la puntuación de AIME 2025 de o3-mini-high bajo la condición "cons@64".
巴布什金在 X 平台上辩称,OpenAI 过去也曾发布过类似的误导性Indicador de referencia测试图表。尽管这些图表是用于比较其自身模型的表现。
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
Los empleados de OpenAI criticaron públicamente los resultados de la prueba del último modelo de IA Grok3 de xAI como Indicador de referencia, diciendo que son engañosos.
ChainCatcher informa, según informes de Jinshi, un empleado de OpenAI acusó públicamente a xAI, una empresa bajo el liderazgo de Musk, de tener resultados engañosos en la prueba del último modelo de IA, Grok3, del Indicador de referencia. Igor Babushkin, cofundador de xAI, afirmó firmemente que la empresa no ha actuado de manera inapropiada. El gráfico de XAI muestra que las dos versiones de Grok3 - Grok3 Reasoning Beta y Grok3 mini Reasoning - superan el rendimiento del modelo más fuerte actualmente disponible de OpenAI, o3-mini-high, en AIME 2025. Sin embargo, los empleados de OpenAI señalaron rápidamente en la plataforma X que el gráfico de XAI no incluía la puntuación de AIME 2025 de o3-mini-high bajo la condición "cons@64". 巴布什金在 X 平台上辩称,OpenAI 过去也曾发布过类似的误导性Indicador de referencia测试图表。尽管这些图表是用于比较其自身模型的表现。