لقد لاحظت شيئًا مثيرًا للاهتمام في استراتيجية NVIDIA في الوقت الحالي. الأسبوع الماضي، شرح جينسين هوانغ بالتفصيل لماذا استثمرت NVIDIA 20 مليار دولار لشراء شركة Groq، وبصراحة، إنها قرار استراتيجي رائع يُظهر كيف يتغير سوق الاستدلال.



إذن إليك السياق: لفترة طويلة، كان الجميع يركز على مقياس واحد فقط - معدل البيانات. لكن شركة Groq فهمت شيئًا فات على الآخرين. مهندسو البرمجيات مستعدون الآن لدفع المزيد مقابل استجابات أسرع. إنها تقسيم سوق جديد تمامًا. كما قال هوانغ، إذا استطعنا تقديم رموز مع زمن استجابة منخفض جدًا، مما يجعل المطورين أكثر إنتاجية، فسيدفعون مقابل ذلك. إنه سوق لم يظهر بعد بشكل كامل.

وهنا تأتي شركة Groq في الصورة. تملأ هذه الاستحواذ فجوة كبيرة في ترسانة NVIDIA للاستدلال. بينما تهيمن NVIDIA على قطاع معدل البيانات العالي بحلولها التقليدية، تقدم Groq شيئًا مختلفًا تمامًا: بنية معمارية LPU معروفة بزمن استجابة حتمي منخفض بشكل استثنائي. في مارس، في مؤتمر GTC، عرضت NVIDIA الـ Groq 3 LPU، المصنوع بتقنية 4 نانومتر من سامسونج. الأرقام مثيرة للإعجاب - 35 مرة أكثر استدلالًا لكل ميغاواط على نماذج تحتوي على تريليونات من المعلمات مقارنة بـ Blackwell NVL72.

إنها بشكل كبير امتداد لمنحنى باريتو في السوق. بدلاً من الاختيار بين معدل بيانات مرتفع أو زمن استجابة منخفض، تخلق NVIDIA الآن قطاعين مميزين. تظل شركة Groq تعمل ككيان مستقل، وانضم جوناثان روس وفريقه إلى NVIDIA. يمكن تسعير النموذج نفسه بشكل مختلف حسب زمن الاستجابة - أقل معدل بيانات، لكن السعر لكل وحدة يعوض ذلك بشكل كبير. إنه عبقرية تجارية خالصة، ويُظهر كيف يتطور سوق الذكاء الاصطناعي. ستتعايش النهجين، وسيختار العملاء بناءً على احتياجاتهم الحقيقية.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت