الزلزال القادم في الذكاء الاصطناعي: لماذا الخطر الحقيقي ليس قاتل SaaS، بل ثورة الحوسبة؟

robot
إنشاء الملخص قيد التقدم

كتبها: برويس

مؤخرًا، يركز جميع أفراد صناعة التكنولوجيا ودوائر الاستثمار على نفس الشيء: كيف تقتل تطبيقات الذكاء الاصطناعي الطرق التقليدية لبرمجيات SaaS. منذ أن عرضت @AnthropicAI مع Claude Cowork كيف يمكنها بسهولة مساعدتك في كتابة البريد الإلكتروني، إعداد عروض تقديمية، وتحليل جداول Excel، بدأ الذعر من فكرة أن “البرمجيات قد ماتت” ينتشر بسرعة. هذا الأمر مخيف حقًا، لكن إذا توقفت عند هذا الحد، فربما تفوتك الزلزال الحقيقي.

إنه مثل أن نرفع أعيننا لننظر إلى معركة الطائرات بدون طيار في السماء، دون أن نلاحظ أن القارة التي تحت أقدامنا تتغير بهدوء. العاصفة الحقيقية، مخفية تحت السطح، في زاوية لا يراها الكثيرون: الأساس الذي يدعم عالم الذكاء الاصطناعي، وهو يشهد ثورة “صامتة” تحدث في عمق الحوسبة.

وهذه الثورة قد تنهي حفلة NVIDIA @nvidia، التي نظمتها بعناية، قبل أن يتوقع الجميع.

طريقان يتقاطعان في الثورة

هذه الثورة ليست حدثًا واحدًا، بل هي نتيجة تداخل مسارين تقنيين يبدو أنهما مستقلان. كأنهما جيشان يحيطان ببعضهما، يشنان هجومًا محكمًا على هيمنة وحدات معالجة الرسوميات (GPU) من NVIDIA.

المسار الأول هو ثورة تبسيط الخوارزميات.

هل فكرت يومًا أن عقلًا فائقًا في التفكير يحتاج فعلاً إلى تفعيل جميع خلايا الدماغ؟ من الواضح أنه لا يحتاج. شركة DeepSeek أدركت ذلك، وابتكرت بنية MoE (نموذج الخبراء المختلط).

يمكنك تصورها كشركة توظف مئات الخبراء في مجالات مختلفة. لكن عند حل مشكلة، لا تحتاج إلى استدعاء الجميع، بل فقط اثنين أو ثلاثة من الأكثر صلة. هذه هي عبقرية MoE: فهي تجعل النموذج الضخم ينشط جزءًا صغيرًا فقط من “الخبراء” في كل عملية حساب، مما يوفر بشكل كبير في استهلاك الحوسبة.

ماذا ستكون النتيجة؟ نموذج DeepSeek-V2، الذي يُقال إنه يضم 236 مليار “خبير” (معامل)، لكنه عند العمل ينشط فقط 21 مليار، أي أقل من 10% من الإجمالي. ومع ذلك، أداؤه يقارب أداء GPT-4 الذي يحتاج إلى تشغيل كامل قدراته. ماذا يعني هذا؟ لقد انفصلت قدرة الذكاء الاصطناعي عن استهلاك الحوسبة!

في السابق، كنا نعتقد أن كلما زادت قوة الذكاء الاصطناعي، زاد استهلاك البطاقة الرسومية. الآن، تقول لنا DeepSeek إنه من خلال خوارزميات ذكية، يمكن تحقيق نفس النتائج بتكلفة أقل بعشر مرات. هذا يضع علامة استفهام كبيرة على الحاجة الملحة لبطاقات NVIDIA.

المسار الثاني هو ثورة “تغيير المسار” في الأجهزة

العمل بالذكاء الاصطناعي يتكون من مرحلتين: التدريب والاستنتاج. التدريب يشبه الذهاب إلى المدرسة، حيث تحتاج لقراءة آلاف الكتب، وهنا تكون بطاقات GPU ذات الحوسبة الموازية القوية مفيدة جدًا. لكن الاستنتاج، وهو ما نستخدمه يوميًا، يركز أكثر على سرعة الاستجابة.

تواجه وحدات GPU مشكلة طبيعية أثناء الاستنتاج: الذاكرة (HBM) خارجية، وتؤدي البيانات ذهابًا وإيابًا إلى تأخير. كأنك طباخ، المكونات مخزنة في ثلاجة في غرفة مجاورة، وكل مرة تريد أن تطبخ، عليك أن تذهب وتأتي، حتى لو كانت السرعة عالية. شركات مثل Cerebras وGroq ابتكرت شرائح استنتاج مخصصة، حيث يتم لحام الذاكرة (SRAM) مباشرة على الشريحة، مما يتيح وصولًا “بدون تأخير” للبيانات.

السوق أظهر تصويتًا عمليًا بالمال. شركة OpenAI تشتكي من ضعف استنتاج GPU من NVIDIA، وفي نفس الوقت وقعت عقدًا بقيمة مليار دولار مع Cerebras لاستئجار خدمات استنتاجهم. NVIDIA نفسها بدأت تقلق، ودفعت 20 مليار دولار لشراء شركة Groq، لتضمن عدم التخلف عن الركب في هذا المسار الجديد.

عندما يلتقي المساران: انهيار التكاليف

الآن، نضع هذين الأمرين معًا: نموذج DeepSeek الذي تم تبسيطه باستخدام خوارزمية MoE، يعمل على شريحة Cerebras التي توفر استجابة “بدون تأخير”.

ماذا سيحدث؟

انهيار في التكاليف.

أولًا، النموذج المبسط صغير جدًا، ويمكن تحميله بالكامل في ذاكرة الشريحة المدمجة. ثانيًا، مع عدم وجود عنق زجاجة في الذاكرة الخارجية، ستكون سرعة استجابة الذكاء الاصطناعي مذهلة. النتيجة النهائية: تقل تكلفة التدريب بنسبة 90% بفضل بنية MoE، وتقل تكلفة الاستنتاج بمضاعفات بفضل الأجهزة المخصصة والحوسبة المتناثرة. الحسابات تشير إلى أن التكلفة الإجمالية لتشغيل وبناء ذكاء اصطناعي من مستوى عالمي قد تكون فقط 10-15% من تكلفة الحلول التقليدية باستخدام GPU.

هذه ليست مجرد تحسين، بل هي انتقال نمطي.

نقطة NVIDIA تتعرض للانتزاع بهدوء

الآن، يجب أن تفهم لماذا هذا أكثر خطورة من “هلع العمل المشترك”.

القيمة السوقية الحالية لشركة NVIDIA، التي تقدر بعشرات التريليونات، مبنية على قصة بسيطة: أن الذكاء الاصطناعي هو المستقبل، وأن مستقبل الذكاء الاصطناعي يعتمد على بطاقاتي GPU. لكن الآن، أساس هذه القصة يتعرض للتهديد.

في سوق التدريب، حتى لو استمرت NVIDIA في الاحتكار، إذا استطاع العملاء إنجاز العمل بعشر البطاقة، فسيقل حجم السوق بشكل كبير.

وفي سوق الاستنتاج، وهو أكبر بعشرة أضعاف، NVIDIA لا تملك ميزة مطلقة، بل تواجه هجمات من شركات مثل Google وCerebras. وحتى أكبر عملائها، OpenAI، بدأت تتخلى عنها.

بمجرد أن تدرك وول ستريت أن “المعول” الخاص بـ NVIDIA لم يعد الخيار الوحيد، أو حتى الأفضل، فكيف ستكون التقييمات المبنية على “احتكار دائم”؟ الجميع يعرف الإجابة.

لذا، ربما يكون أكبر حدث غير متوقع في الأشهر الستة القادمة ليس أن تطبيقًا معينًا للذكاء الاصطناعي أزال آخر، بل خبر تقني بسيط: مثل ورقة بحث جديدة عن كفاءة خوارزمية MoE، أو تقرير يُظهر زيادة حصة السوق الخاصة بشرائح الاستنتاج المخصصة، يعلن بشكل غير مباشر أن حرب الحوسبة دخلت مرحلة جديدة.

عندما لم تعد أدوات “البائع” الوحيدة، قد تنتهي حقبة الذهب الخاصة به.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت