Imagens do ChatGPT 2.0 chegaram! A precisão na geração de texto melhora significativamente, permitindo criar facilmente cartazes de marketing

A OpenAI anunciou oficialmente na terça-feira a chegada do ChatGPT Images 2.0, não só melhorando substancialmente a precisão na geração de texto, como também a estética de design em cartazes e retratos. O modelo introduz também pela primeira vez um “modo de pensamento”, que permite que a geração de imagens tenha capacidades de pesquisa na web e de saída em lote de várias imagens, aproximando-se de forma abrangente de cenários de aplicação comerciais.

(A Canva anuncia integração profunda com o Claude, permitindo transformar rascunhos de IA em peças de design prontas)

Do nada até um menu perfeito: a IA finalmente aprendeu a soletrar

Ao recordar há dois anos, os pontos fracos dos modelos de geração de imagens por IA na geração de texto são praticamente do conhecimento geral. Desde que o pedido inclua necessidades de texto, o resultado costuma estar cheio de erros de ortografia absurdos e até de invenções. Isto é ainda mais grave em línguas como o japonês, coreano e chinês, que não são inglês.

Imagem ilustrativa do cartaz oficial em coreano

Agora, o ChatGPT Images 2.0 já consegue gerar um cartaz de divulgação que pode ser usado diretamente pelos operadores, com texto nítido e preciso. Nos últimos anos, os investigadores têm explorado activamente novas arquiteturas como modelos de auto-retroalimentação (Autoregressive Models), e a lógica de funcionamento, a compreensão do texto, as capacidades de geração e de verificação melhoraram de forma significativa.

Modo de pensamento em funcionamento: pesquisa online e consistência na composição, tudo bem resolvido

A actualização mais central do ChatGPT Images 2.0 está no “modo de pensamento (Thinking Capabilities)”, que actualmente está disponível para utilizadores pagantes do ChatGPT Plus, Pro, da versão comercial e da versão empresarial. Após activação, o modelo consegue pesquisar informações na web em tempo real para auxiliar a geração de imagens; também consegue criar descrições visuais correspondentes a partir dos ficheiros enviados pelo utilizador e, antes da saída final, realiza uma auto-revisão e optimização do conteúdo das imagens.

Na geração em lote, no modo de pensamento, com um único pedido é possível produzir até oito imagens de uma só vez, e entre as imagens consegue manter consistentemente as características do personagem, o estilo dos objectos e o estilo global. Isto é adequado para painéis de histórias em quadrinhos, séries de imagens e texto em redes sociais, e até para diagramas de planeamento de espaços em design de interiores de vários ambientes.

Imagem ilustrativa dos painéis de histórias em quadrinhos do anúncio oficial

Em termos de resolução, o novo modelo suporta uma saída máxima de 2K e adiciona várias opções de proporção de aspecto de 3:1 a 1:3, satisfazendo ainda melhor diversas necessidades comerciais.

Línguas asiáticas optimizadas de forma significativa: utilizadores de japonês, chinês e coreano, têm sorte!

Além do inglês, a OpenAI destacou especialmente grandes optimizações do Images 2.0 para textos asiáticos: japonês, coreano e chinês, entre outras, mostram melhorias evidentes.

Um artigo de testes divulgado há alguns dias em comunidades tecnológicas chinesas também confirmou esta notícia. Vários criadores no Zhihu realizaram na altura comparações de testes práticos entre GPT-Image-2 e o concorrente Google Nano Banana Pro, incluindo múltiplos cenários como design de cartazes em chinês, imagens de capas para e-commerce, interfaces de redes sociais e gráficos e tabelas de dados.

Teste do artigo do Zhihu ao GPT-Image 2.0

Os resultados dos testes mostram que o GPT-Image-2 supera claramente o concorrente em beleza da tipografia chinesa, níveis de paginação e sensação geral de design. Os cartazes gerados têm um estilo mais próximo de materiais comerciais reais, em vez de uma saída do tipo “modelo” com um “toque de IA” claramente perceptível. O artigo também aponta que o GPT-Image-2, na reprodução de (como cenas de jogos ou capturas de ecrã de software de comunicação) e na fidelidade de cenários com retratos reais, demonstra também uma maior precisão de detalhes.

ChatGPT Images 2.0 totalmente disponibilizado, API em sincronização

Neste momento, o ChatGPT Images 2.0 já está, desde esta terça-feira, a ser disponibilizado gratuitamente a todos os utilizadores do ChatGPT e do Codex para funcionalidades base. Os utilizadores pagantes podem desbloquear efeitos de saída mais avançados. Ao mesmo tempo, a OpenAI disponibiliza também a API do GPT-Image-2. Os preços são calculados por escalões consoante a qualidade de saída e a resolução, oferecendo flexibilidade de integração para empresas e programadores.

Importa notar que a data-limite de conhecimento do novo modelo é dezembro de 2025. Para pedidos de geração de imagens que envolvam acontecimentos noticiosos recentes, a precisão pode ser limitada até certo ponto. Além disso, a velocidade de geração de composições complexas também não consegue ser tão imediata como uma conversa normal com perguntas e respostas de texto, mas ainda assim bastam apenas alguns minutos.

Este artigo “ChatGPT Images 2.0 em destaque! A precisão da geração de texto melhora bastante, produz com facilidade cartazes de marketing” surge primeiro em 鏈新聞 ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

A ASMPT regista um forte 2.º trimestre à medida que a procura de IA impulsiona a receita para 540M–600M

A ASMPT eleva a orientação de receita do 2.º trimestre para 540–600 milhões de dólares impulsionada pela procura orientada por IA; a receita do 1.º trimestre foi de 507,9 milhões de dólares com registos recordes. Crescimento a partir de TCB e HBM4, fotónica, ligação por fio/die bonding e procura de SMT orientada por IA; opções do segmento SMT em análise. A ASMPT anunciou uma perspectiva de receita do segundo trimestre mais elevada de $540 milhões para $600 milhões, impulsionada pela procura de semicondutores relacionada com IA, após a receita do primeiro trimestre de 507,9 milhões de dólares e registos recordes. O crescimento é liderado por ferramentas de Thermo-Compression Bonding para chips de lógica, módulos de HBM4 e fotónica para data centers, com contribuições da ligação por fio/die bonding e da procura de SMT orientada por IA. A empresa informou que não houve impacto material do conflito no Irão e está a avaliar opções estratégicas para o seu Segmento de Soluções SMT, para se concentrar no Segmento de Soluções de Semicondutores com maior crescimento.

GateNews39m atrás

O Claude Mythos descobre 271 vulnerabilidades no Firefox; os defensores esperam alcançar uma vantagem decisiva

A Mozilla anunciou na terça-feira que uma versão inicial do modelo de IA Claude Mythos da Anthropic identificou 271 vulnerabilidades de segurança no navegador Firefox durante testes internos, estando todas as falhas já corrigidas nesta semana. No meio do seu choque, a Mozilla também afirmou que os resultados sugerem que poderá estar a ocorrer uma mudança fundamental no domínio da segurança na web, e que os defensores poderão em breve estar a reduzir a vantagem que os atacantes têm mantido ao longo dos anos.

MarketWhisper44m atrás

Aviso de IPO da SpaceX: são questionáveis a viabilidade comercial e a adequação de dados de IA da sua unidade espacial de Musk

Segundo a Reuters, a 22 de abril, a SpaceX, no projecto de formulário S-1 que está prestes a submeter, emitiu um aviso a potenciais investidores, indicando que os seus planos para desenvolver centros de dados de IA no espaço e para a industrialização do sector lunar e interplanetário «ainda estão numa fase inicial, envolvem uma complexidade técnica significativa e tecnologias não comprovadas, que poderão não alcançar a viabilidade comercial», em contraste marcante com a postura optimista expressa publicamente pelo CEO Musk este ano.

MarketWhisper1h atrás

O Claude Code está a retirar a oferta Pro e será necessário subscrever o Max para o utilizar! Um executivo da Anthropic afirmou que ainda está em fase de testes

Recentemente, vários utilizadores descobriram que o site oficial da Anthropic aparenta ter removido o Claude Code do plano Pro (20 USD/mês), passando a disponibilizá-lo através do Max (com preços a partir de 100 USD/mês). A entidade oficial afirmou que se trata apenas de um teste aplicado a cerca de 2% das novas inscrições de prosumer; os utilizadores actuais Pro e Max não são afectados. Esta medida é vista como uma reavaliação dos custos e da estratégia de preços para funcionalidades de elevado consumo e, no futuro, é possível que este tipo de funcionalidades seja retirado dos planos generalistas, seguindo uma abordagem de preços por escalões mais elevados.

ChainNewsAbmedia1h atrás

A OpenAI compromete-se com um investimento de até $1,5B num novo empreendimento conjunto de private equity

Mensagem do Gate News, 22 de abril — A OpenAI comprometeu-se a investir até $1,5 mil milhões num novo empreendimento conjunto com uma empresa de private equity, com o objetivo de competir com a Anthropic e captar o mercado em crescimento de ferramentas de inteligência artificial para empresas. A empresa investirá inicialmente $500 milhões em capital próprio

GateNews2h atrás

O GPT-5.5 aparece no selector do OpenAI Codex, mas devolve erro 400; actualmente indisponível

Notícia da Gate, 22 de Abril — O GPT-5.5 apareceu na lista pendente do selector de modelos do OpenAI Codex, posicionado no topo. No entanto, quando os utilizadores seleccionam o GPT-5.5 e enviam um pedido, o Codex devolve um erro 400 com a mensagem "O modelo 'gpt-5.5' não é suportado ao usar o Codex com uma conta do ChatGPT." O modelo encontra-se actualmente indisponível. A OpenAI não divulgou qualquer anúncio oficial ou documentação sobre o GPT-5.5 até agora.

GateNews2h atrás
Comentar
0/400
Nenhum comentário