حسنًا - هذا هو السبب في أنه لا ينبغي أبدًا الوثوق بمعايير الذكاء الاصطناعي.


دراسة حديثة قارنت بين Opus 4.6 (أحدث نموذج Claude) مقابل Opus 4.5 عبر 165 مهمة مختلفة.
توصل البحث العميق إلى أن Opus 4.6 لم يتفوق على النموذج السابق.
لكن Opus 4.6 حقق ذلك بتكلفة أقل بنسبة 50% ووقت جدار أقل بنسبة 50%.
لا تزال تحسينات هائلة، فقط كن حذرًا من عناوين معايير الأداء.
أفضل طريقة لتحديد ما إذا كان النموذج أفضل من الإصدارات السابقة هي اختباره لاحتياجاتك الخاصة.
على أي حال، عمل رائع لفريق Anthropic على هذا التخفيض الكبير في التكلفة ووقت الجدار.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.39Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.43Kعدد الحائزين:2
    0.09%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.38Kعدد الحائزين:1
    0.00%
  • تثبيت