Lanzamiento del modelo GPT 5.5: ¡Especializado en programación de investigación! Mira una comparación de las diferencias con Claude Opus 4.7

OpenAI lanza de repente el modelo GPT-5.5, enfocado en la capacidad más potente e intuitiva para programar y operar entre herramientas, en este artículo se compara el rendimiento de GPT-5.5 con modelos principales como Claude Opus 4.7 y Gemini 3.1 Pro.

¡El modelo GPT-5.5 de OpenAI ha llegado! Características en una vista

El gigante de la IA, OpenAI, lanzó de repente en la madrugada del 24 de abril, hora de Taiwán, el nuevo modelo GPT-5.5, que afirma ser el sistema de IA más inteligente y con operación más intuitiva hasta la fecha.

OpenAI indica que el modelo GPT-5.5 posee una poderosa capacidad de programación de agentes de IA, especializado en manejar código, corregir errores, investigación en línea y operación entre herramientas.

En comparación con la versión anterior GPT-5.4, GPT-5.5 mantiene el mismo nivel de latencia de cálculo, pero puede completar tareas con menos marcas.

El presidente de OpenAI, Greg Brockman, señaló que el nuevo modelo representa un avance importante hacia el cálculo intuitivo, y es un paso clave para crear aplicaciones superpuestas que integren ChatGPT, Codex y navegadores de IA.

Planes de costos y permisos de uso del modelo GPT-5.5

Desde hoy, usuarios de ChatGPT Plus, Pro, Business y Enterprise, así como usuarios de Codex, pueden usar GPT-5.5, y la versión avanzada GPT-5.5 Pro está disponible para usuarios Pro, Business y Enterprise.

En cuanto a la tarifa API, el costo por token de entrada para GPT-5.5 es de 5 dólares por cada 1 millón, y por salida, 30 dólares por cada 1 millón. GPT-5.5 Pro cuesta 30 dólares por cada 1 millón de tokens de entrada y 180 dólares por cada 1 millón de tokens de salida.

Curiosamente, el lanzamiento del modelo GPT-5.5 coincide con una inminente disputa legal entre Elon Musk y el CEO de OpenAI, Sam Altman, lo que ha generado atención pública.

Rendimiento en pruebas de referencia de GPT-5.5: análisis de ventajas y desventajas

En las pruebas de rendimiento (Benchmark), GPT-5.5 muestra ventajas técnicas, aunque aún enfrenta desafíos en algunas áreas.

Según datos oficiales de OpenAI, en la evaluación de comandos complejos en Terminal-Bench 2.0, GPT-5.5 alcanzó una precisión del 82.7%; en la prueba GDPval para trabajos de conocimiento, obtuvo un puntaje alto del 84.9%, demostrando gran utilidad en tareas diarias de oficina.

En la prueba pública SWE-Bench Pro, que evalúa la resolución de problemas reales en GitHub, GPT-5.5 obtuvo un 58.6%, ligeramente por detrás del Claude Opus 4.7 de Anthropic, que logró un 64.3%.

OpenAI aclaró que las pruebas podrían verse afectadas por efectos de memoria del modelo, pero aún reflejan que GPT-5.5 presenta desventajas en la corrección de errores en desarrollo específico.

Fuente de la imagen: Rendimiento en pruebas de referencia de GPT-5.5: análisis de ventajas y desventajas

En el campo de la seguridad, Anthropic lanzó recientemente el modelo Claude Mythos Preview, que destaca por su fuerte seguridad, mientras que GPT-5.5, aunque mejoró en defensa, actualmente solo está disponible a través de canales específicos para empresas certificadas para protección de infraestructura.

Comparación de modelos principales: GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro

Comparación de datos entre GPT-5.5 y Claude Opus 4.7

Basándose en datos de pruebas oficiales de OpenAI y ITmedia, en la categoría OSWorld-Verified, que evalúa entornos de trabajo en computadoras reales, GPT-5.5 obtuvo un puntaje del 78.7%, ligeramente superior al 78.0% de Claude Opus 4.7.

En la prueba BrowseComp, que evalúa lógica avanzada y colaboración con herramientas, GPT-5.5 logró un 84.4%, superando a Claude Opus 4.7 con un 79.3%; en las pruebas FrontierMath Tier 1 a 3, que miden habilidades matemáticas avanzadas, GPT-5.5 alcanzó un 51.7%, superando a Claude Opus 4.7 con un 43.8%.

Comparación de datos entre GPT-5.5 y Gemini 3.1 Pro

En comparación con Gemini 3.1 Pro, GPT-5.5 mantiene liderazgo en la mayoría de las pruebas profesionales. En la prueba GDPval de trabajos de conocimiento, GPT-5.5 logró un 84.9%, superando al 67.3% de Gemini 3.1 Pro.

En la evaluación Toolathlon, que mide el uso de herramientas externas, GPT-5.5 obtuvo un 55.6%, mejor que el 48.8% de Gemini 3.1 Pro.

Fuente de la imagen: Comparación de datos entre GPT-5.5 y Gemini 3.1 Pro

En la prueba multimodal MMMU Pro sin ayuda de herramientas, GPT-5.5 obtuvo un 81.2%, mientras que Gemini 3.1 Pro logró un 80.5%, mostrando resultados muy cercanos.

¿GPT-5.5 prepara el camino para una IPO?

El director de investigación de OpenAI, Mark Chen, indicó que, GPT-5.5 trae mejoras sustanciales en los procesos de investigación científica y tecnológica, y en el futuro podría acelerar la investigación en áreas como el descubrimiento de medicamentos.

El medio internacional The Verge señala que el lanzamiento de este nuevo modelo refleja que OpenAI y Anthropic están en una competencia cada vez más intensa por dominar el mercado de herramientas de IA empresariales, y también allana el camino para una posible oferta pública inicial (IPO) que podría realizarse más adelante este año, en una competencia cada vez más acalorada.

Lectura adicional:
¿Cómo usar ChatGPT Images 2.0? Pruebas con menús de ramen, portadas de revistas y efectos en idiomas múltiples

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado