بعد أن أصبح الذكاء الاصطناعي أداة قياسية في الشركات، فإن ظاهرة كان يُنظر إليها في الماضي على أنها «مسألة إحساس» تظهر بسرعة على السطح: إن نماذج اللغات الكبيرة LLM (Large Language Models) أصبحت «أغبى». أشار مستخدم الإنترنت Wisely Chen إلى أن ما يُسمى بـ «هبوط ذكاء LLM» ليس مجرد حكاية متداولة في المدينة، بل يمكن تتبعه باستمرار عبر البيانات، وهو ما يسبب بالفعل تأثيرًا ملموسًا على سير عمل الشركات.
واستخدم مثالًا من تجربته الشخصية، ففي 15 أبريل، حدثت عملية تدهور شاملة في خدمات سلسلة Claude التابعة لـ Anthropic، بما في ذلك claude.ai وAPI وClaude Code، حيث تظهر جميعها عبارة «Degraded Performance». ولا يتعلق الأمر بمجرد بطء أو أخطاء عارضة، بل إن جودة الاستجابة تنهار بوضوح، بل وحتى تظهر حالات لا يمكن فيها استخدام الخدمة بشكل طبيعي، ما أدى إلى تأجيل جميع مهام التطوير الثلاث في ذلك اليوم.
قد تكون هذه الظروف بالنسبة للمطورين الأفراد مجرد انخفاض في الكفاءة، لكن بالنسبة لفرق تكنولوجيا المعلومات في الشركات فإن الأثر يتضاعف. عندما يعتمد فريق يضم عدة مهندسين على أدوات الذكاء الاصطناعي لإجراء البرمجة وكتابة المستندات وأتمتة العمليات، فإن أي تدهور في النموذج يعني أن الإنتاجية الإجمالية تتراجع بشكل جماعي في الوقت نفسه، وهو ما يتحول إلى خسائر ملموسة في الوقت والتكلفة.
هل شعرت أن الذكاء الاصطناعي أصبح «أغبى»؟ تؤكد البيانات أنه تم «تدهوره» منذ وقت طويل
أشار Wisely Chen إلى أن مثل «GPT أصبح أغبى» و«Claude ليس كما كان من قبل» قد انتشرت في المجتمع منذ فترة طويلة، لكن ظلّت تفتقر إلى دعم بيانات موضوعية لفترة طويلة. وحتى ظهور منصات بدأت في الآونة الأخيرة بالمراقبة المستمرة لجودة النماذج، لم تتمكن هذه الظاهرة من أن تُقاس لأول مرة بشكل كمي.
ضمن ذلك، أجرى StupidMeter اختبارات آلية على مدار 24 ساعة على نماذج شائعة تشمل OpenAI وAnthropic وGoogle وغيرها، وتتبع مؤشرات مثل الدقة وقدرات الاستدلال والثبات. وبخلاف اختبارات benchmark التقليدية لمرة واحدة، فإن مثل هذه الأنظمة تكون أقرب إلى طريقة مراقبة واجهات برمجة التطبيقات أو قابلية خدمات التشغيل في الشركات، إذ تراقب تقلب أداء النموذج في بيئات الاستخدام الفعلية.
والنتائج واضحة جدًا: حاليًا، توجد أغلبية النماذج الرئيسية في حالة تحذير أو حالة تدهور، ولا تحافظ سوى قلة قليلة من النماذج على وضعها الطبيعي. وهذا يعني أن جودة النماذج غير مستقرة، وليست مشكلة تخص منتجًا واحدًا فقط، بل ظاهرة شائعة على مستوى الصناعة بأكملها.
LLM يهبط تدريجيًا في الذكاء، ويؤثر على استقرار سير عمل الذكاء الاصطناعي للشركات
بالنسبة للشركات، تعني هذه التغييرات أن الذكاء الاصطناعي انتقل من «أداة لتحسين الكفاءة» إلى «متغير يؤثر على الاستقرار». إذا كانت العمليات اليومية في الشركة، من كتابة البرامج إلى إجراء مراجعات الكود وصولًا إلى إنتاج المستندات وتقارير التحليل، تعتمد بالفعل بشكل كبير على LLM. ففي حال ظهرت في يومٍ ما تراجع في قدرات الاستدلال أو هبوط في جودة الإجابات لدى النموذج، فلن تظهر هذه المشكلات كما في عيوب البرمجيات التقليدية بشكل جزئي في مكان واحد، بل ستتسرب في الوقت نفسه إلى جميع مراحل استخدام الذكاء الاصطناعي.
والأكثر أهمية هو أن هذا النوع من التذبذب غالبًا ما يكون صعبًا على التنبؤ، وصعبًا أيضًا اكتشافه في الوقت المناسب. لا تمتلك معظم الشركات آليات لمراقبة جودة النماذج بشكل مستمر؛ وعادة ما يكتشفون المشكلة بعد أن تكون النتائج غير طبيعية، أو بعد أن تنخفض كفاءة الفريق، فيلاحظون أن السبب يعود إلى النموذج نفسه. في مثل هذا السياق، لم يعد «هبوط الذكاء» مجرد إحساس ذاتي لدى المستخدمين، بل أصبح خطرًا منهجيًا يؤثر مباشرة على إيقاع تشغيل الشركة.
عندما يصبح الذكاء الاصطناعي مثل الكهرباء والمياه، تصبح الاستقرارية مؤشرًا أساسيًا جديدًا
شبه Wisely Chen دور LLM بمقولة «كهرباء ومياه الشركات الحديثة». عندما يتغلغل الذكاء الاصطناعي في العمليات اليومية ويصبح قدرة أساسية لا غنى عنها، تزداد أهمية استقراريته تبعًا لذلك.
في الماضي، عند تقييم أدوات الذكاء الاصطناعي، كانت الشركات تركز على قدرات النموذج والسعر والوظائف. لكن مع بروز ظاهرة «هبوط الذكاء»، يظهر مؤشر أكثر أهمية، وهو الاستقرارية. عندما يمكن أن تتغير جودة النموذج دون إشعار، فإن الشركات لم تعد تقتصر على «استخدام الذكاء الاصطناعي»، بل يتعين عليها تحمل نوع جديد من مخاطر البنية التحتية. والأكثر يأسًا هو أنه إذا ركزت فقط على نماذج اللغات الكبيرة المتقدمة، ففي الأساس، ما دامت مشكلة القدرة الحاسوبية غير محلولة، فمن المحتمل أن يستمر حدوث ذلك.
هذه المقالة أُول مرة ظهرت في 鏈新聞 ABMedia.
مقالات ذات صلة
روبوت هونر Lightning يفوز بماراثون نصف الروبوتات البشرية في بكين 2026 بوقت 50:26
سهم Meta يرتفع بنسبة 1.73% بينما تخطط الشركة لتسريح 8,000 وظيفة بدءًا من 20 مايو
يذكر تقرير Google السنوي أن Gemini يحقق اعتراضًا في أجزاء من الثانية، ويمنع 99% من إعلانات الاحتيال
إيلون ماسك يدفع نحو “شيكات الدخل المرتفع الشامل” باعتبارها الحل النهائي لبطالة وظائف الذكاء الاصطناعي
يُقال إن DeepSeek يطلق أول جولة لجمع تمويل خارجي، ويستهدف تقييمًا بقيمة 10 مليارات دولار+ و300 مليون دولار+