2026-04-17 06:13:36
Google、感情表現を強化しマルチ話者に対応したGemini 3.1 Flash TTSを発表
Googleは、感情表現と制御が向上した先進のテキスト読み上げモデルであるGemini 3.1 Flash TTSをリリースしました。主な機能には、自然言語ベースの音声タグ、ニュアンスのある出力を行うためのDirector Mode、そして現実的な会話を可能にするマルチ話者対応があります。70以上の言語に対応し、効率性を重視して設計されていることから、AIが生成したコンテンツの強化と、誤情報への対処を目指しています。この発表は、音声技術分野での競争が拡大していることを示しており、とりわけOpenAIやMetaからの追い上げが背景にあります。