Google 推出 Gemini 3.1 Flash TTS:支持 70 种语言与场景导演,AI 语音更自然

鏈新聞abmedia

Google AI 开发者关系负责人 Logan Kilpatrick 于 4 月 15 日宣布推出 Gemini 3.1 Flash TTS——Google 最新的文字转语音模型。这款模型支持 70 种语言、场景导演(scene direction)、说话者级别的精细控制与音频标签,目前已在 Google AI Studio 的音频 playground 和 Gemini API 中开放使用。

四大核心功能

Gemini 3.1 Flash TTS 相较于前代有四项显著升级:

场景导演(Scene Direction)—— 可以为语音设置情境,例如“在嘈杂的咖啡厅中低声说话”或“兴奋地宣布好消息”,模型会根据场景调整语调、语速和情绪

说话者级别控制(Speaker-Level Specificity)—— 在多角色对话中,可以为每个角色设置不同的声音特征

音频标签(Audio Tags)—— 支持在文本中插入音效指令,控制停顿、语气变化等细节

70 种语言支持—— 大幅扩展多语言覆盖,包含中文

更自然、更有表现力的声音

Google 强调这款模型在语音自然度上的进步。传统 TTS 模型的输出常被批评为“听起来像 AI”,Gemini 3.1 Flash TTS 试图通过更丰富的韵律变化和情绪表达来缩小与人类语音的差距。Kilpatrick 指出,从 Gemini 2.5 到 3.1 的进步“非常显著”。

开发者如何使用

开发者可通过两种方式使用:

Google AI Studio 音频 Playground—— 直接在网页界面中测试和预览语音效果

Gemini API—— 整合至应用程序中,用于语音助理、有声书、Podcast 自动生成、多语言客服等场景

Gemini 产品线持续扩张

Flash TTS 是 Gemini 3.1 系列近期密集发布的一环。此前 Google 已推出 Gemini Robotics ER 1.6(机器人视觉推理)、Tab Tab Tab(Vibe Coding prompt 补全)和设计预览等功能。Google 正在将 Gemini 从“聊天模型”扩展为涵盖文字、语音、视觉、机器人的全模态 AI 平台。

这篇文章 Google 推出 Gemini 3.1 Flash TTS:支持 70 种语言与场景导演,AI 语音更自然 最早出现在 链新闻 ABMedia。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Pi 网络创办人 5 月 7 日在 Consensus 2026 讨论 AI 时代的人类身份识别

Pi Network 创办人 Nicolas Kokkalis 将于 5 月 7 日出席在迈阿密举行的 Consensus 2026 大会,加入一个就人工智能(AI)时代线上人类身份识别议题展开讨论的专家小组。根据官方活动安排,本次小组讨论将汇聚身份、隐私与数字信任领域的专家。

Market Whisper16 分钟前

DeepX 与现代汽车集团开发面向机器人的低功耗 AI 芯片平台

韩国 DeepX 与现代汽车集团的机器人实验室正在合作,开发面向实时机器人应用的低功耗 AI 计算平台。该合作将利用 DeepX 的 DX-M2 芯片,旨在以更低成本和更低功耗优化机器人,反映出行业正朝着专用芯片的趋势发展。

GateNews25 分钟前

Playdate 禁止 AI 生成的艺术、音乐和文本;编程助理仍可使用

Panic Inc. 宣布禁止其 Playdate 掌机主机上的生成式 AI 工具用于艺术、音乐、写作和游戏对话。获准使用 AI 编程助理,但需进行披露。该决定是在一款由 AI 开发的游戏引发强烈反对之后做出的。

GateNews35 分钟前

亚马逊追加50亿投资Anthropic,10年AWS协议锁定千亿算力

亚马逊于 4 月 20 日宣布向 Anthropic 追加 50 亿美元投资,使自 2023 年以来的累计承诺投资总额达到 130 亿美元,并为未来最高 200 亿美元的商业里程碑挂钩追加资金留有空间。作为回报,Anthropic 承诺未来十年在 AWS 基础设施上投入逾 1,000 亿美元,换取 5 吉瓦的运算资源。

Market Whisper51 分钟前

纽约州议员提出“AI 红利”以应对失业潮,高盛预计每月损失 1.6 万个工作岗位

纽约州议员兼国会候选人 Alex Bores 周日宣布“AI 红利”计划,旨在当人工智能显著取代美国工人时,向美国公民直接支付款项。该计划发布的背景是,高盛报告显示 AI 普及已导致美国每月约 1.6 万个工作机会流失,亚马逊、Meta、英特尔和微软等科技巨头已相继宣布大规模裁员。

Market Whisper56 分钟前

腾讯 QClaw 海外版开启内测,日赠 700 美元 Token 抢先入场

腾讯电脑管家团队旗下 AI 智能体产品 QClaw 于 4 月 20 日宣布海外版正式开启内测,首批覆盖美国、加拿大、新加坡和韩国,支持中、英、法、西、韩等多语言。内测期间每日赠送 4,000 万 Token,同时开放首批 20,000 个“创始龙虾(Founding Claw)”名额,先到先得。

Market Whisper1小时前
评论
0/400
暂无评论