A OpenAI anunciou oficialmente na terça-feira a chegada do ChatGPT Images 2.0, não só melhorando substancialmente a precisão na geração de texto, como também a estética de design em cartazes e retratos. O modelo introduz também pela primeira vez um “modo de pensamento”, que permite que a geração de imagens tenha capacidades de pesquisa na web e de saída em lote de várias imagens, aproximando-se de forma abrangente de cenários de aplicação comerciais.
(A Canva anuncia integração profunda com o Claude, permitindo transformar rascunhos de IA em peças de design prontas)
Do nada até um menu perfeito: a IA finalmente aprendeu a soletrar
Ao recordar há dois anos, os pontos fracos dos modelos de geração de imagens por IA na geração de texto são praticamente do conhecimento geral. Desde que o pedido inclua necessidades de texto, o resultado costuma estar cheio de erros de ortografia absurdos e até de invenções. Isto é ainda mais grave em línguas como o japonês, coreano e chinês, que não são inglês.
Imagem ilustrativa do cartaz oficial em coreano
Agora, o ChatGPT Images 2.0 já consegue gerar um cartaz de divulgação que pode ser usado diretamente pelos operadores, com texto nítido e preciso. Nos últimos anos, os investigadores têm explorado activamente novas arquiteturas como modelos de auto-retroalimentação (Autoregressive Models), e a lógica de funcionamento, a compreensão do texto, as capacidades de geração e de verificação melhoraram de forma significativa.
Modo de pensamento em funcionamento: pesquisa online e consistência na composição, tudo bem resolvido
A actualização mais central do ChatGPT Images 2.0 está no “modo de pensamento (Thinking Capabilities)”, que actualmente está disponível para utilizadores pagantes do ChatGPT Plus, Pro, da versão comercial e da versão empresarial. Após activação, o modelo consegue pesquisar informações na web em tempo real para auxiliar a geração de imagens; também consegue criar descrições visuais correspondentes a partir dos ficheiros enviados pelo utilizador e, antes da saída final, realiza uma auto-revisão e optimização do conteúdo das imagens.
Na geração em lote, no modo de pensamento, com um único pedido é possível produzir até oito imagens de uma só vez, e entre as imagens consegue manter consistentemente as características do personagem, o estilo dos objectos e o estilo global. Isto é adequado para painéis de histórias em quadrinhos, séries de imagens e texto em redes sociais, e até para diagramas de planeamento de espaços em design de interiores de vários ambientes.
Imagem ilustrativa dos painéis de histórias em quadrinhos do anúncio oficial
Em termos de resolução, o novo modelo suporta uma saída máxima de 2K e adiciona várias opções de proporção de aspecto de 3:1 a 1:3, satisfazendo ainda melhor diversas necessidades comerciais.
Línguas asiáticas optimizadas de forma significativa: utilizadores de japonês, chinês e coreano, têm sorte!
Além do inglês, a OpenAI destacou especialmente grandes optimizações do Images 2.0 para textos asiáticos: japonês, coreano e chinês, entre outras, mostram melhorias evidentes.
Um artigo de testes divulgado há alguns dias em comunidades tecnológicas chinesas também confirmou esta notícia. Vários criadores no Zhihu realizaram na altura comparações de testes práticos entre GPT-Image-2 e o concorrente Google Nano Banana Pro, incluindo múltiplos cenários como design de cartazes em chinês, imagens de capas para e-commerce, interfaces de redes sociais e gráficos e tabelas de dados.
Teste do artigo do Zhihu ao GPT-Image 2.0
Os resultados dos testes mostram que o GPT-Image-2 supera claramente o concorrente em beleza da tipografia chinesa, níveis de paginação e sensação geral de design. Os cartazes gerados têm um estilo mais próximo de materiais comerciais reais, em vez de uma saída do tipo “modelo” com um “toque de IA” claramente perceptível. O artigo também aponta que o GPT-Image-2, na reprodução de (como cenas de jogos ou capturas de ecrã de software de comunicação) e na fidelidade de cenários com retratos reais, demonstra também uma maior precisão de detalhes.
ChatGPT Images 2.0 totalmente disponibilizado, API em sincronização
Neste momento, o ChatGPT Images 2.0 já está, desde esta terça-feira, a ser disponibilizado gratuitamente a todos os utilizadores do ChatGPT e do Codex para funcionalidades base. Os utilizadores pagantes podem desbloquear efeitos de saída mais avançados. Ao mesmo tempo, a OpenAI disponibiliza também a API do GPT-Image-2. Os preços são calculados por escalões consoante a qualidade de saída e a resolução, oferecendo flexibilidade de integração para empresas e programadores.
Importa notar que a data-limite de conhecimento do novo modelo é dezembro de 2025. Para pedidos de geração de imagens que envolvam acontecimentos noticiosos recentes, a precisão pode ser limitada até certo ponto. Além disso, a velocidade de geração de composições complexas também não consegue ser tão imediata como uma conversa normal com perguntas e respostas de texto, mas ainda assim bastam apenas alguns minutos.
Este artigo “ChatGPT Images 2.0 em destaque! A precisão da geração de texto melhora bastante, produz com facilidade cartazes de marketing” surge primeiro em 鏈新聞 ABMedia.
Related Articles
A ASMPT regista um forte 2.º trimestre à medida que a procura de IA impulsiona a receita para 540M–600M
O Claude Mythos descobre 271 vulnerabilidades no Firefox; os defensores esperam alcançar uma vantagem decisiva
Aviso de IPO da SpaceX: são questionáveis a viabilidade comercial e a adequação de dados de IA da sua unidade espacial de Musk
O Claude Code está a retirar a oferta Pro e será necessário subscrever o Max para o utilizar! Um executivo da Anthropic afirmou que ainda está em fase de testes
A OpenAI compromete-se com um investimento de até $1,5B num novo empreendimento conjunto de private equity
O GPT-5.5 aparece no selector do OpenAI Codex, mas devolve erro 400; actualmente indisponível