Babbitt News, le 16 juin, Meta a annoncé la sortie du modèle d’IA de génération de parole “Voicebox”, qui prend en charge la génération de parole à partir de texte, peut faire correspondre des styles audio basés sur des échantillons qui ne durent que deux secondes et convertir des échantillons de texte dans une autre langue, À partir d’échantillons de parole individuels, il lit le texte traduit dans la voix originale de l’orateur, actuellement en six langues : anglais, français, allemand, espagnol, polonais et portugais.
Meta a déclaré que Voicebox peut également faire en sorte que les assistants virtuels et les personnages non-joueurs du métaverse produisent des voix naturelles, et cela peut permettre aux malvoyants d’entendre des messages écrits d’amis que l’IA lit dans leur voix, offrant aux créateurs de nouveaux outils pour facilement Créer et éditez des pistes audio pour des vidéos et plus encore.