Babbitt News, 16 червня Meta оголосила про випуск моделі штучного інтелекту для генерації мовлення «Voicebox», яка підтримує генерацію мовлення з тексту, може зіставляти аудіостилі на основі зразків тривалістю лише дві секунди та перетворювати зразки тексту на іншу мову, З урахуванням окремих зразків мовлення він читає перекладений текст оригінальним голосом мовця, наразі шістьма мовами: англійською, французькою, німецькою, іспанською, польською та португальською.
Meta сказав, що Voicebox також може змусити віртуальних помічників і неігрових персонажів у метавсесвіті видавати природні голоси, і це може дозволити людям із вадами зору чути письмові повідомлення від друзів, які ШІ читає їхніми голосами, надаючи творцям нові інструменти для легкого створення та редагувати звукові доріжки для відео тощо.