نماذج اللغة الكبيرة ستُدخل تفضيلاتها الخاصة أثناء التقطير

أخبار مارس للتمويل: في 16 أبريل، أظهرت دراسة نشرت في مجلة “طبيعة” يوم 15 أن النماذج اللغوية الكبيرة (LLM) قد تقوم بنقل تفضيلاتها الخاصة “مخلوطة” إلى خوارزميات أخرى، حتى بعد إزالة الميزات الأصلية من بيانات التدريب، حيث لا تزال هذه الميزات غير المرغوب فيها موجودة بشكل مستمر. في حالة واحدة، بدا أن نموذجًا ما ينقل تفضيله للبوم إلى نماذج أخرى من خلال إشارات ضمنية في البيانات. تشير نتائج الدراسة إلى أنه عند تطوير النماذج اللغوية الكبيرة، يجب إجراء فحوصات أمان أكثر شمولاً. (صحيفة العلوم والتكنولوجيا)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت