عندما يتعلق الأمر بنشر نماذج اللغة في سيناريوهات العالم الحقيقي، فإن التوازن بين الأجهزة والأداء مهم بقدر القدرات الخام.
OSS120B يقدم استدلالًا محليًا رائعًا ولكنه يأتي بتكلفة—أنت بحاجة إلى حوالي 120 جيجابايت من الذاكرة العشوائية فقط لتشغيله بسلاسة. هذا ليس محمولًا تمامًا. OSS20B يحقق التوازن المثالي لمعظم الحالات؛ تحصل على أداء قوي دون الحاجة إلى مركز بيانات في قبو منزلك.
يعمل Mistral-7B بشكل رائع للمهام الحوارية، على الرغم من أنه يواجه صعوبة في التثبيت على المستندات ويميل إلى الهلوسة إذا قدمت له معلومات لم يتم تدريبه عليها بشكل صريح. لاما، بصراحة؟ يبدو أقل إثارة مقارنة بالبدائل المفتوحة المصدر الأحدث ذات الأحجام المماثلة. لقد تحرك النظام البيئي بسرعة، وبعض اللاعبين الجدد يفعلون ذلك بشكل أفضل.
الدروس الحقيقية: الحجم ليس كل شيء. السياق، جودة بيانات التدريب، والكفاءة العملية أهم مما تعتقد.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 12
أعجبني
12
3
إعادة النشر
مشاركة
تعليق
0/400
MEVictim
· منذ 7 س
OSS120B تعمل ذاكرة 120 جيجابايت؟ استيقظ يا صديقي، هذا ليس نشر محلي بل مركز بيانات محلي
أو عطر OSS20B، الحل الأمثل للبيئة الإنتاجية الحقيقية
ميسترال، هذه مشكلة الهلوسة مزعجة حقا... بمجرد أن تزود ببيانات غير مألوفة، تبدأ في اختلاق القصص
لاما كان بالفعل سحقه المبتدئون، وكانت البيئة قاسية جدا
مع ذلك، حجم النموذج ليس مهما جدا، جودة بيانات التدريب > كل شيء، وهذا هو النقطة العالقة الحقيقية
شاهد النسخة الأصليةرد0
GasFeeCrybaby
· منذ 7 س
ذاكرة 120 جيجابايت تعمل ب 120 بايت؟ خادم من هذا؟ جهازي المكسور معطل مباشرة هاها
OSS20B بالفعل مذهل وفعال من حيث التكلفة. بعبارة أخرى، لاما بالفعل أصبح مشدودا قليلا الآن، والشيء الجديد يقضي عليه في ثوان
هذه هي الحقيقة، ليست مجرد كومة من المعايير
شاهد النسخة الأصليةرد0
StealthDeployer
· منذ 7 س
120GB跑本地模型؟ ضحكت، لازم أبيع الكمبيوتر المتهالك في بيتي
---
OSS20B فعلاً رائع، لكن المشكلة الحقيقية تكمن في جودة البيانات
---
Llama الآن فعلاً أصبح ضعيف، النماذج الجديدة تتفوق عليه بشكل كبير
---
لا تركز فقط على عدد المعلمات، نافذة السياق وكفاءة الاستنتاج هما الإنتاجية الحقيقية
---
مشكلة هلوسة mistral تزعجني، هذا الشيء غير مناسب للإنتاج البيئي
---
من يتحمل تكلفة 120GB، بصراحة الفرق الصغيرة والمتوسطة لا تستطيع تحمله
---
هذا هو السبب في أنني الآن أركز على حلول التكميم، لتوفير نصف الذاكرة
عندما يتعلق الأمر بنشر نماذج اللغة في سيناريوهات العالم الحقيقي، فإن التوازن بين الأجهزة والأداء مهم بقدر القدرات الخام.
OSS120B يقدم استدلالًا محليًا رائعًا ولكنه يأتي بتكلفة—أنت بحاجة إلى حوالي 120 جيجابايت من الذاكرة العشوائية فقط لتشغيله بسلاسة. هذا ليس محمولًا تمامًا. OSS20B يحقق التوازن المثالي لمعظم الحالات؛ تحصل على أداء قوي دون الحاجة إلى مركز بيانات في قبو منزلك.
يعمل Mistral-7B بشكل رائع للمهام الحوارية، على الرغم من أنه يواجه صعوبة في التثبيت على المستندات ويميل إلى الهلوسة إذا قدمت له معلومات لم يتم تدريبه عليها بشكل صريح. لاما، بصراحة؟ يبدو أقل إثارة مقارنة بالبدائل المفتوحة المصدر الأحدث ذات الأحجام المماثلة. لقد تحرك النظام البيئي بسرعة، وبعض اللاعبين الجدد يفعلون ذلك بشكل أفضل.
الدروس الحقيقية: الحجم ليس كل شيء. السياق، جودة بيانات التدريب، والكفاءة العملية أهم مما تعتقد.