¿Cómo se usa ChatGPT Images 2.0? Prueba práctica de menús de carne de res, portadas de revistas, efectos de divulgación en múltiples idiomas

robot
Generación de resúmenes en curso

OpenAI lanza ChatGPT Images 2.0, una herramienta para imágenes generadas en vivo, que destaca por su potente capacidad de maquetación compleja y manejo multilingüe de textos (incluyendo chino). Este artículo presenta una introducción completa a las funciones, características, planes gratuitos y de pago, además de resultados de pruebas reales.

¿Qué es ChatGPT Images 2.0? ¡Te contamos sus funciones principales y características!

¿Ha llegado una herramienta de generación de imágenes AI comparable a Gemini Nano Banana 2? OpenAI anunció el lanzamiento de ChatGPT Images 2.0, impulsada por el nuevo modelo GPT Image 2, que se enfoca en que las imágenes sean capaces de seleccionar, ordenar y revelar información. A continuación, las 3 principales características de ChatGPT Images 2.0:

Potente maquetación y manejo multilingüe de textos

Una característica claramente visible es la significativa mejora en la capacidad de maquetación y manejo multilingüe de textos de ChatGPT Images 2.0.

Medios como Techcrunch señalan que las herramientas anteriores de generación de imágenes AI generalmente usaban modelos de difusión, los cuales tenían dificultades para escribir textos con precisión. ChatGPT Images 2.0 puede presentar detalles finos como textos pequeños, iconos y interfaces de usuario con alta precisión.

OpenAI indica que Images 2.0 ha avanzado notablemente en el procesamiento de idiomas no latinos, incluyendo chino, japonés, coreano, hindi y bengalí, pudiendo generarlos con una claridad muy alta en las imágenes.

Fuente: Ejemplo generado oficial de ChatGPT Images 2.0 de OpenAI

Capacidad de pensamiento y búsqueda en línea renovadas

Además de la maquetación y manejo multilingüe, ChatGPT Images 2.0 ofrece una capacidad de pensamiento completamente nueva, que permite buscar información en línea en tiempo real para ayudar en la generación de imágenes. El modelo tiene una base de conocimientos actualizada hasta diciembre de 2025, lo que ayuda a crear contenido relacionado con eventos recientes.

Fuente: Ejemplo generado oficial de ChatGPT Images 2.0 de OpenAI

Soporte para resolución 2K y relaciones de aspecto variadas

ChatGPT Images 2.0 soporta generación de imágenes con resolución hasta 2K y ofrece una gama más amplia de relaciones de aspecto, desde panorámicas 3:1 hasta retrato 1:3.

El responsable de investigación de OpenAI, Boyuan Chen, afirma que la arquitectura de Images 2.0 ha sido completamente renovada, siendo un modelo universal que, con simples indicaciones de texto, puede manejar transformaciones de perspectiva en estilo 3D y razonamiento espacial complejo.

Funciones para usuarios en planes gratuitos y de pago de ChatGPT Images 2.0

¿Vale la pena pagar? Los diferentes niveles de usuarios en ChatGPT Images 2.0 tienen funciones desbloqueadas distintas, resumidas así:

  • Usuarios gratuitos: Actualmente pueden usar el modelo básico ImageGen 2.0 para tareas estándar de generación de imágenes. La versión básica ya incluye muchas mejoras clave, como mejor cumplimiento de instrucciones, efectos de renderizado de texto más potentes, soporte multilingüe y más opciones de relaciones de aspecto.
  • Usuarios de ChatGPT Plus, Business y Enterprise: Estos usuarios de pago pueden activar el nuevo modo de pensamiento. En este modo, el generador de imágenes del chatbot usará búsquedas en línea, creará diagramas visuales a partir de archivos subidos y realizará razonamiento estructural antes de generar la imagen. Se pueden generar hasta 8 imágenes simultáneamente, asegurando coherencia en personajes, objetos y estilos en cada escena.
  • Usuarios Pro: Tendrán acceso a una versión más avanzada del modelo ImageGen Pro. Aunque OpenAI aún no ha detallado exactamente las diferencias entre Pro y el modo de pensamiento, los usuarios empresariales pueden considerar el modo de pensamiento como una mejora funcional concreta, útil para tareas que requieren hechos verificables, convertir documentos internos en diagramas explicativos o mantener coherencia visual en múltiples activos.
  • Desarrolladores API: Ahora pueden integrar el modelo gpt-image-2, soportando alta resolución y configuraciones flexibles de relaciones de aspecto.

Pruebas reales de ChatGPT Images 2.0: menús, revistas, gráficos explicativos, etc.

¿El rendimiento real de ChatGPT Images 2.0 cumple con la promoción de OpenAI? Hagamos algunas pruebas.

Prueba del menú de un restaurante de carne de res

El editor de “Crypto City” probó la versión gratuita de ChatGPT, generando un menú de carne de res taiwanés con la indicación: “Genera un menú con enfoque en carne de res taiwanesa, en chino tradicional, mostrando nombres, precios e información visual de cada plato.”

Aquí los resultados:

Fuente: Generado por ChatGPT Images 2.0

En cuanto a lo que puede generar la versión gratuita, parece bastante decente a simple vista, aunque al examinar más de cerca, Images 2.0 aún presenta errores en caracteres tradicionales complejos, como errores en trazos. Quizá la versión de pago tenga resultados mejores.

Además, el resultado generado se acerca a los precios de carne de res en Taipei, e incluso permite una recarga gratis en el mismo pedido.

Pero si quieres imprimir el menú, en la práctica de impresión lo ideal sería convertir las imágenes generadas por ChatGPT Images 2.0 en archivos vectoriales (como EPS, .ai de Adobe Illustrator, PDF) y usar tonos CMYK. Aunque las imprentas también aceptan JPG y PNG, si tienes altas exigencias en la calidad de impresión, será más difícil ajustar la imagen a lo que deseas.

Prueba de portada de revista de tecnología

Luego, probamos la portada de una revista de ciencia ficción, en esta ocasión “Crypto City” evaluó la capacidad para manejar maquetación compleja. La indicación fue: “Genera una portada de revista de tecnología en chino tradicional, con el título ‘Crypto City’, tema ‘Intersección de Blockchain y AI’, que incluya título, número de volumen, código de barras y fecha de publicación en la parte superior, todo con texto claro y alineado profesionalmente.”

Aquí los resultados:

Fuente: Generado por ChatGPT Images 2.0

El resultado es similar al anterior, parece bien a simple vista, pero al revisar en detalle, aún presenta fallos en caracteres chinos con trazos complejos. Además, la tipografía de la portada se asemeja mucho a la “Jin Xuan Ti” de Justfont, una tipografía taiwanesa, no sabemos si tiene licencia.

Este tipo de dudas, “Crypto City” también las planteó cuando lanzó Nano Banana Pro.

  • Artículo relacionado: Prueba de Nano Banana Pro: ¡Mejoras en caracteres chinos! Pero también surgen dudas sobre derechos de autor en animaciones y tipografías.

Prueba de gráficos explicativos multilingües

“Crypto City” probó un gráfico en chino tradicional, japonés y coreano sobre las causas de un terremoto, logrando una renderización general en múltiples idiomas. En la maquetación, se usaron diferentes colores según el idioma, aunque al examinar en detalle, algunos caracteres complejos en chino, kanji o coreano aún presentan cierta borrosidad.

Aquí los resultados:

Fuente: Generado por ChatGPT Images 2.0

Images 2.0 mantiene la coherencia en personajes y objetos, resolviendo procesos complicados

Además, Images 2.0, al igual que Nano Banana 2, tiene capacidad de edición. Solo hay que hacer clic en “Editar” en la esquina inferior izquierda de la imagen generada para comenzar a modificar, manteniendo la coherencia en personajes y objetos, facilitando la creación de páginas de cómics, series de publicaciones en redes sociales o planos de diseño de habitaciones en viviendas.

La responsable del producto ChatGPT Images, Adele Li, indica que esta función resuelve el tedioso proceso previo de generar cada imagen individualmente y ensamblarlas manualmente, permitiendo a los creadores diseñar fácilmente libros infantiles con un mismo estilo visual o materiales de marketing de marca.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado