أكد موظف في OpenAI مؤخرًا في تقرير البيانات الاقتصادية المالية ليوم 23 فبراير أن شركة xAI التابعة لإيلون ماسك قد أصدرت نتائج الاختبار الأساسي الخاص بنموذج الذكاء الاصطناعي الجديد Grok3 بشكل مضلل. وفي هذا الصدد، أكد إيغور بابوشكين، المؤسس المشارك لشركة xAI، أن الشركة لم ترتكب أي تصرف غير لائق. وتُظهر رسوم بيانية لـ xAI أن أداء نموذج Grok3 في اثنين من الإصدارات - Grok3 Reasoning Beta و Grok3 mini Reasoning - كان أفضل من النموذج القوي الحالي o3-mini-high في AIME 2025. ومع ذلك، لاحظ موظفو OpenAI بسرعة على منصة X أن رسوم بيانية xAI لم تشمل أداء o3-mini-high في AIME 2025 تحت شرط "cons@64". ودافع بابوشكين على منصة X بأن OpenAI سبق وأن أصدرت رسوم بيانية مضللة مماثلة في اختبارات الأداء الأساسية. على الرغم من أن هذه الرسوم البيانية تستخدم لمقارنة أداء نماذجها الخاصة.
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
موظفو OpenAI ينتقدون علنًا أن نتائج اختبار Grok3 الخاصة بالمعيار لديها طابع مضلل
أكد موظف في OpenAI مؤخرًا في تقرير البيانات الاقتصادية المالية ليوم 23 فبراير أن شركة xAI التابعة لإيلون ماسك قد أصدرت نتائج الاختبار الأساسي الخاص بنموذج الذكاء الاصطناعي الجديد Grok3 بشكل مضلل. وفي هذا الصدد، أكد إيغور بابوشكين، المؤسس المشارك لشركة xAI، أن الشركة لم ترتكب أي تصرف غير لائق. وتُظهر رسوم بيانية لـ xAI أن أداء نموذج Grok3 في اثنين من الإصدارات - Grok3 Reasoning Beta و Grok3 mini Reasoning - كان أفضل من النموذج القوي الحالي o3-mini-high في AIME 2025. ومع ذلك، لاحظ موظفو OpenAI بسرعة على منصة X أن رسوم بيانية xAI لم تشمل أداء o3-mini-high في AIME 2025 تحت شرط "cons@64". ودافع بابوشكين على منصة X بأن OpenAI سبق وأن أصدرت رسوم بيانية مضللة مماثلة في اختبارات الأداء الأساسية. على الرغم من أن هذه الرسوم البيانية تستخدم لمقارنة أداء نماذجها الخاصة.