OpenAI تطلق مراقبة CoT لوقف السلوك الضار للنماذج الكبيرة

إنشاء الملخص قيد التقدم

ذكرت شركة Golden Finance أن OpenAI أصدرت أحدث الأبحاث ، باستخدام مراقبة CoT (سلسلة الفكر) ، يمكنها منع السلوكيات الخبيثة مثل النماذج الكبيرة التي تتحدث عن الهراء وتخفي النوايا الحقيقية ، وهي أيضا واحدة من الأدوات الفعالة للإشراف على النماذج الفائقة. يستخدم OpenAI الطراز المتطور الذي تم إصداره حديثا o3-mini ككائن مراقب ، وطراز GPT-4o الأضعف كشاشة. بيئة الاختبار هي مهمة ترميز تتطلب من الذكاء الاصطناعي تنفيذ الوظائف في قاعدة التعليمات البرمجية لاجتياز اختبارات الوحدة. أظهرت النتائج أن جهاز مراقبة CoT كان أداؤه جيدا في اكتشاف سلوك "قرصنة المكافآت" المنهجي ، بمعدل استدعاء يصل إلى 95٪ ، يتجاوز بكثير 60٪ من السلوكيات التي تم مراقبتها فقط.

O33.56%

GPT-32.12%

شاهد النسخة الأصلية

المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.

أعجبني
إعجاب
تعليق
مشاركة

تعليق

0/400

لا توجد تعليقات

الموضوع
#BTC#
192k المنشورات
#ETH#
120k المنشورات
#PI#
93k المنشورات
4#GateioInto11#
76k المنشورات
5#ContentStar#
64k المنشورات
6#BOME#
59k المنشورات
7#GT#
56k المنشورات
8#DOGE#
53k المنشورات
9#MAGA#
52k المنشورات
10#SLERF#
51k المنشورات

تثبيت

خريطة الموقع