NVIDIA розширює можливості ASR Riva за допомогою моделей Whisper та Canary

robot
Генерація анотацій у процесі

Ребека Моен

21 лютого 2025 року 10:54

NVIDIA покращує свій Riva ASR за допомогою нових багатомовних можливостей з використанням моделей Whisper та Canary, інтегруючи передові функції для автономного та автоматичного перекладу мовлення.

! NVIDIA розширює можливості Riva ASR за допомогою моделей Whisper і Canary

NVIDIA досягла значних успіхів у вдосконаленні своїх систем автоматичного розпізнавання мови (ASR), представивши розширені можливості за допомогою контейнера Riva 2.18.0 і SDK. Ці розробки є частиною поточних зусиль NVIDIA щодо вдосконалення своїх мікросервісів зі штучним інтелектом мовлення та перекладу з прискоренням GPU, як докладно описав Свен Чілтон у блозі розробників NVIDIA.

Інтеграція нових моделей

Остання ітерація Riva включає підтримку архітектури Parakeet, яка сприяє потоковому багатомовному ASR, а також моделей Whisper і Canary для автономного ASR та автоматичного перекладу мовлення (AST). Whisper, розроблений OpenAI, та моделі Distil-Whisper від HuggingFace тепер є невід’ємною частиною можливостей автономного ASR Riva, що дозволяє транскрибувати та перекладати аудіозаписи на численних мовах безпосередньо на англійську.

Моделі канарок додатково розширюють функціональність Riva, підтримуючи автономний розпізнавання мови і синтез мови в різних комбінаціях мов, включаючи будь-яку англійську, англійську-будь-яку та будь-яку-будь-яку переклади. Ці моделі відповідають різноманітним лінгвістичним потребам, пропонуючи надійну підтримку для завдань виявлення мови та перекладу.

Вибіркове деактивація NMT

Одна з помітних функцій, введених у цному оновленні, - це можливість вибірково деактивувати частини процесу машинного перекладу (NMT), використовуючи тег SSML. Ця функція дозволяє користувачам вказувати текстові сегменти, які не повинні бути перекладені, забезпечуючи більший контроль над результатами перекладу. Крім того, новий словник DNT дозволяє вказати, як деякі слова або фрази мають бути перекладені, підвищуючи настроюваність процесів перекладу.

Розгортання та використання

Розгортання цих нових можливостей здійснюється через папку ресурсів Riva Skills Quick Start, яка включає сценарії та конфігураційні файли, необхідні для налаштування сервера Riva з можливостями Whisper та Canary. Користувачі можуть вибрати між моделями Whisper та Canary на основі їх конкретних потреб у ASR, використовуючи надані сценарії для оптимізації розгортання моделі згідно з архітектурою їх GPU.

Зобов'язання NVIDIA розширювати мовний та функціональний обсяг своїх систем ASR очевидно в інтеграції цих передових моделей та функцій. Підтримуючи ширший спектр мов та пропонуючи покращені контрольні можливості перекладу, Riva продовжує встановлювати стандарти промисловості в технології розпізнавання мови та перекладу.

Для отримання додаткової інформації про останні досягнення компанії NVIDIA в галузі ASR відвідайте блог розробників NVIDIA.

Джерело зображення: Shutterstock

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити