موظفو OpenAI ينتقدون علنًا أن نتائج اختبار Grok3 الخاصة بالمعيار لديها طابع مضلل

GoldenOctober2024

إنشاء الملخص قيد التقدم

أكد موظف في OpenAI مؤخرًا في تقرير البيانات الاقتصادية المالية ليوم 23 فبراير أن شركة xAI التابعة لإيلون ماسك قد أصدرت نتائج الاختبار الأساسي الخاص بنموذج الذكاء الاصطناعي الجديد Grok3 بشكل مضلل. وفي هذا الصدد، أكد إيغور بابوشكين، المؤسس المشارك لشركة xAI، أن الشركة لم ترتكب أي تصرف غير لائق. وتُظهر رسوم بيانية لـ xAI أن أداء نموذج Grok3 في اثنين من الإصدارات - Grok3 Reasoning Beta و Grok3 mini Reasoning - كان أفضل من النموذج القوي الحالي o3-mini-high في AIME 2025. ومع ذلك، لاحظ موظفو OpenAI بسرعة على منصة X أن رسوم بيانية xAI لم تشمل أداء o3-mini-high في AIME 2025 تحت شرط "cons@64". ودافع بابوشكين على منصة X بأن OpenAI سبق وأن أصدرت رسوم بيانية مضللة مماثلة في اختبارات الأداء الأساسية. على الرغم من أن هذه الرسوم البيانية تستخدم لمقارنة أداء نماذجها الخاصة.

GROK-2.54%

XAI-0.61%

شاهد النسخة الأصلية

المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.

تسجيلات الإعجاب 3

أعجبني
3
2
مشاركة

تعليق

0/400

لا توجد تعليقات

الموضوع
#BTC#
192k المنشورات
#ETH#
120k المنشورات
#PI#
94k المنشورات
4#GateioInto11#
76k المنشورات
5#ContentStar#
64k المنشورات
6#BOME#
59k المنشورات
7#GT#
56k المنشورات
8#DOGE#
53k المنشورات
9#MAGA#
52k المنشورات
10#SLERF#
51k المنشورات

تثبيت

خريطة الموقع