توسيع نفيديا لقدرات ASR على ريفا مع نماذج Whisper و Canary

robot
إنشاء الملخص قيد التقدم

ريبيكا موين

21 فبراير 2025 10:54

تعزز NVIDIA Riva ASR الخاصة بها بإمكانيات جديدة متعددة اللغات باستخدام نماذج Whisper و Canary ، مدمجة مع ميزات متقدمة للترجمة الصوتية غير المتصلة والتلقائية.

! [NVIDIA توسع قدرات Riva ASR مع نماذج Whisper و Canary] (https://img.gateio.im/social/moments-640ea0fcb3b5ee18827a1ee3ad912a1a)

قامت NVIDIA باتخاذ خطوات هامة في تقدم نظم التعرف التلقائي على الكلام (ASR) الخاصة بها من خلال إضافة قدرات محسنة من خلال حاوية Riva 2.18.0 و SDK. تعتبر هذه التطورات جزءًا من الجهود المستمرة لدى NVIDIA لتحسين خدماتها الدقيقة لتسريع معالجة الرسومات GPU والذكاء الاصطناعي للترجمة الصوتية، كما هو موضح من قبل سفين تشيلتون في مدونة مطوري NVIDIA.

تكامل النماذج الجديدة

آخر تحديث لـ Riva يتضمن دعم لهندسة Parakeet، التي تسهل تدفق ASR متعدد اللغات، ونماذج Whisper و Canary لتحويل الكلام الآلي والترجمة التلقائية (AST). Whisper، المطورة من قبل OpenAI، ونماذج Distil-Whisper من HuggingFace، أصبحت الآن جزءًا لا يتجزأ من قدرات Riva لتحويل الكلام الآلي في وضع عدم الاتصال، مما يسمح بتحويل التسجيلات الصوتية وترجمتها في العديد من اللغات مباشرة إلى الإنجليزية.

توسع نماذج كاناري مزيدًا من وظائف ريفا من خلال دعم ASR و AST دون الاتصال عبر الإنترنت بتركيبات لغوية متعددة، بما في ذلك الترجمة من أي لغة إلى الإنجليزية، ومن الإنجليزية إلى أي لغة، ومن أي لغة إلى أي لغة. تتلبي هذه النماذج احتياجات لغوية متنوعة، مقدمة دعمًا قويًا لمهام الكشف عن اللغة والترجمة.

إيقاف ترجمة الشبكة العصبية العميقة الانتقائية

تتمثل إحدى الميزات البارزة التي تم تقديمها في هذا التحديث في القدرة على إلغاء تنشيط أجزاء من عملية (NMT) الترجمة الآلية العصبية بشكل انتقائي باستخدام علامة SSML. تتيح هذه الميزة للمستخدمين تحديد مقاطع نصية لا ينبغي ترجمتها ، مما يوفر تحكما أكبر في مخرجات الترجمة. بالإضافة إلى ذلك ، يتيح قاموس DNT الجديد تحديد كيفية ترجمة كلمات أو عبارات معينة ، مما يعزز تخصيص عمليات الترجمة.

النشر والاستخدام

يتم تبسيط نشر هذه القدرات الجديدة من خلال مجلد موارد بدء التشغيل السريع لمهارات Riva ، الذي يتضمن النصوص النصية وملفات التكوين اللازمة لإعداد خادم Riva مع وظائف Whisper و Canary. يمكن للمستخدمين اختيار نماذج Whisper و Canary استنادًا إلى احتياجاتهم الخاصة لتحويل الكلام الآلي ، مستخدمين النصوص المقدمة لتحسين نشر النموذج وفقًا لبنية GPU الخاصة بهم.

يتضح التزام NVIDIA بتوسيع النطاق اللغوي والوظيفي لأنظمة ASR الخاصة بها في تكامل هذه النماذج والميزات المتقدمة. من خلال دعم مجموعة واسعة من اللغات وتقديم ضوابط ترجمة محسنة ، تواصل ريفا وضع معايير الصناعة في التعرف على الكلام وتكنولوجيا الترجمة.

لمزيد من المعلومات حول أحدث تطورات ASR من NVIDIA ، تفضل بزيارة مدونة مطوري NVIDIA.

مصدر الصورة: شترستوك

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت