2026-02-10 22:32:31

حسنًا - هذا هو السبب في أنه لا ينبغي أبدًا الوثوق بمعايير الذكاء الاصطناعي.

دراسة حديثة قارنت بين Opus 4.6 (أحدث نموذج Claude) مقابل Opus 4.5 عبر 165 مهمة مختلفة.
توصل البحث العميق إلى أن Opus 4.6 لم يتفوق على النموذج السابق.
لكن Opus 4.6 حقق ذلك بتكلفة أقل بنسبة 50% ووقت جدار أقل بنسبة 50%.
لا تزال تحسينات هائلة، فقط كن حذرًا من عناوين معايير الأداء.
أفضل طريقة لتحديد ما إذا كان النموذج أفضل من الإصدارات السابقة هي اختباره لاحتياجاتك الخاصة.
على أي حال، عمل رائع لفريق Anthropic على هذا التخفيض الكبير في التكلفة ووقت الجدار.

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.