2026-04-17 06:13:36
Google Ra Mắt Gemini 3.1 Flash TTS với Khả Năng Thể Hiện Cảm Xúc Nâng Cao và Hỗ Trợ Nhiều Người Nói
Google đã ra mắt Gemini 3.1 Flash TTS, một mô hình chuyển văn bản thành giọng nói nâng cao với khả năng thể hiện cảm xúc và khả năng kiểm soát được cải thiện. Các tính năng bao gồm thẻ âm thanh theo ngôn ngữ tự nhiên, Chế độ Giám đốc (Director Mode) để tạo ra đầu ra tinh tế hơn và khả năng nhiều người nói để tạo các cuộc trò chuyện chân thực. Hỗ trợ hơn 70 ngôn ngữ và được thiết kế cho hiệu quả, nó nhằm nâng cao nội dung do AI tạo ra và giải quyết tin giả. Việc ra mắt cho thấy mức độ cạnh tranh ngày càng tăng trong công nghệ giọng nói, đặc biệt từ OpenAI và Meta.