O responsável pelas relações com programadores da Google para IA, Logan Kilpatrick, anunciou a disponibilização do Gemini 3.1 Flash TTS no dia 15 de abril — o modelo mais recente de texto-para-voz da Google. Este modelo suporta 70 línguas, controlo pormenorizado ao nível de cenários (scene direction) e do tipo de orador, bem como etiquetas de áudio; atualmente, já está disponível para utilização no audio playground da Google AI Studio e na Gemini API.

Quatro funcionalidades centrais

O Gemini 3.1 Flash TTS, em comparação com a geração anterior, tem quatro melhorias evidentes:

Direção de cena (Scene Direction) — permite definir o contexto para a voz, por exemplo, “falar baixinho num café barulhento” ou “anunciar entusiasmado uma boa notícia”; o modelo ajusta o tom, a velocidade de fala e a emoção de acordo com o cenário

Controlo ao nível do orador (Speaker-Level Specificity) — em conversas com múltiplos intervenientes, pode definir características de voz diferentes para cada personagem

Etiquetas de áudio (Audio Tags) — permite inserir instruções de efeitos sonoros no texto, controlando detalhes como pausas e variações de entoação

Suporte a 70 línguas — expande significativamente a cobertura multilingue, incluindo chinês

Uma voz mais natural e expressiva

A Google sublinha os progressos deste modelo na naturalidade da voz. Os modelos tradicionais de TTS são frequentemente criticados por produzirem uma saída que “soa como IA”; o Gemini 3.1 Flash TTS procura reduzir a distância para a voz humana através de variações de prosódia e expressão emocional mais ricas. Kilpatrick aponta que a evolução “é bastante significativa” de Gemini 2.5 para 3.1.

Como os programadores podem usar

Os programadores podem utilizá-lo de duas formas:

Google AI Studio Audio Playground — testar e pré-visualizar diretamente os efeitos de voz na interface Web

Gemini API — integrá-lo nas aplicações, para cenários como assistentes de voz, audiolivros, geração automática de Podcast, apoio ao cliente multilingue, entre outros

A linha de produtos da Gemini continua a expandir-se

O Flash TTS faz parte do conjunto de lançamentos recentes e intensos da série Gemini 3.1. Anteriormente, a Google já tinha apresentado o Gemini Robotics ER 1.6 (raciocínio visual para robôs), Tab Tab Tab (preenchimento de prompt de Vibe Coding) e funções como design preview. A Google está a expandir a Gemini, de “modelo de conversação”, para uma plataforma de IA multimodal completa que abrange texto, voz, visão e robôs.

Este artigo “A Google lança o Gemini 3.1 Flash TTS: suporta 70 línguas e direção de cena; voz de IA mais natural” surgiu pela primeira vez em Cadeia de notícias ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Hong Kong vai anunciar amanhã a sexta lista de principais empresas

Notícias da indústria de IA

O Secretário Financeiro de Hong Kong, Paul Chan, anunciou a apresentação de uma nova lista de principais empresas, atraindo mais de 100 negócios avaliados acima de 100 mil milhões de HKD em sectores como as ciências da vida, a IA e a fintech, realçando o atractivo de Hong Kong para o investimento internacional.

GateNews51m atrás

O robô Lightning da Honor vence a Meia-Maratona de Robôs Humanoides de Pequim 2026 com 50:26

Notícias da indústria de IA

O robô humanoide "Lightning" da Honor estabeleceu um novo recorde na Meia-Maratona de Robôs Humanoides de Yizhuang em Pequim 2026, concluindo a corrida em 50 minutos e 26 segundos, superando o recorde mundial humano.

GateNews4h atrás

As acções da Meta sobem 1,73% enquanto a empresa planeia um despedimento de 8.000 trabalhadores com início a 20 de maio

Ações Notícias da indústria de IA

A Meta Platforms planeia cortar cerca de 8.000 empregos, ou 10% da sua força de trabalho, a partir de 20 de maio, apesar da subida dos preços das acções. A empresa, com mais de $200 mil milhões de receitas, está a concentrar-se em investimentos em IA no meio de uma reestruturação significativa, alinhando-se pelas tendências da indústria de despedimentos.

GateNews11h atrás

O relatório anual do Google afirma que o Gemini implementou bloqueio em milissegundos, impedindo 99% dos anúncios fraudulentos

Notícias da indústria de IA

O artigo discute como a Google reforçou a segurança da publicidade através do seu sistema de inteligência artificial generativa Gemini; o relatório indica que a sua velocidade de deteção de anúncios em incumprimento foi reduzida para milissegundos, com uma taxa de deteção de 99%. No ano passado, a Google removeu 8,3 mil milhões de anúncios e suspendeu 24,9 milhões de contas, o que mostra um aumento acentuado do número de anúncios fraudulentos. Os especialistas apontam que se trata de um confronto entre inteligência artificial e inteligência artificial e que, no futuro, ainda será necessário enfrentar os desafios das ações legais e ilegais trazidas pela IA.

ChainNewsAbmedia13h atrás

Cofundador da Ethereum Lubin: A IA será o ponto de viragem crítico para as criptomoedas, mas o monopólio das gigantes da tecnologia coloca um risco sistémico

ethereum news Agente de IA Notícias da indústria de IA

O cofundador da Ethereum, Joseph Lubin, destacou o potencial transformador da IA para o sector das criptomoedas, ao mesmo tempo que alertou para os riscos da centralização entre grandes empresas de tecnologia. Ele imagina transacções autónomas impulsionadas por IA na blockchain e sublinha a convergência das finanças tradicionais com a DeFi.

GateNews15h atrás

Elon Musk promove cheques de “Rendimento Elevado Universal” como solução definitiva para o desemprego causado pela IA

Notícias da indústria de IA

Elon Musk defende um Rendimento Universal Elevado para combater o desemprego provocado pela IA, imaginando um futuro com abundantes bens e inflação zero. Em contraste, especialistas como Sam Altman levantam preocupações sobre a perda de empregos e propõem medidas de proteção para os trabalhadores.

Coinpedia15h atrás

Comentar

0/400

Nenhum comentário