Lancement du modèle GPT 5.5 : spécialisé en programmation de recherche ! Comparaison des différences avec Claude Opus 4.7 une fois

OpenAI surprise release du modèle GPT-5.5, mettant en avant une capacité de programmation intuitive et une opération multi-outils puissante, cet article compare les performances de GPT-5.5 avec celles des modèles principaux tels que Claude Opus 4.7 et Gemini 3.1 Pro.

OpenAI présente le modèle GPT-5.5 ! Caractéristiques en un coup d’œil

Le géant de l’IA OpenAI a lancé de manière surprise, dans la nuit du 24 avril, heure taïwanaise, le tout nouveau modèle GPT-5.5, affirmant qu’il s’agit du système d’IA le plus intelligent et le plus intuitif à ce jour.

OpenAI indique que le modèle GPT-5.5 possède une capacité puissante d’écriture de code par agent IA, excelle dans la gestion de bugs, la recherche en ligne et l’opération multi-outils.

Comparé à la version précédente GPT-5.4, GPT-5.5 maintient le même niveau de latence de calcul, tout en accomplissant des tâches avec moins de tokens.

Le président d’OpenAI, Greg Brockman, souligne que ce nouveau modèle constitue une avancée significative vers une opération intuitive, et représente une étape clé dans la création d’une super application combinant ChatGPT, Codex et le navigateur IA.

Tarification et droits d’utilisation du modèle GPT-5.5

Dès aujourd’hui, les utilisateurs de ChatGPT Plus, Pro, Business et Enterprise, ainsi que les utilisateurs de Codex, peuvent accéder à GPT-5.5, la version avancée GPT-5.5 Pro étant réservée aux abonnés Pro, Business et Enterprise.

Concernant la tarification API, le coût par token d’entrée pour GPT-5.5 est de 5 dollars pour 1 million de tokens, et de 30 dollars pour 1 million de tokens de sortie. Pour GPT-5.5 Pro, le coût est de 30 dollars pour 1 million de tokens d’entrée, et de 180 dollars pour 1 million de tokens de sortie.

Fait intéressant, la sortie du modèle GPT-5.5 coïncide avec une période où Elon Musk et le PDG d’OpenAI, Sam Altman, sont sur le point d’être impliqués dans une procédure judiciaire, ce qui a suscité l’attention du public.

Performance de référence de GPT-5.5 : analyse des avantages et inconvénients

Dans les tests de référence de performance, GPT-5.5 montre des avantages techniques, mais certains domaines restent difficiles.

Selon les données officielles d’OpenAI, le modèle GPT-5.5 atteint un taux de précision de 82,7 % dans le test Terminal-Bench 2.0, qui évalue des commandes complexes ; dans le test GDPval, qui évalue le travail de connaissance, il obtient un score élevé de 84,9 %, montrant une grande utilité pour le travail quotidien.

Dans le test SWE-Bench Pro, qui évalue la résolution de problèmes concrets sur GitHub, GPT-5.5 a obtenu 58,6 %, légèrement en retrait par rapport à Claude Opus 4.7 d’Anthropic, qui a obtenu 64,3 %.

OpenAI précise que ces tests peuvent être influencés par la mémoire du modèle, mais ils reflètent tout de même que GPT-5.5 présente des faiblesses dans la correction de bugs spécifiques au développement.

Source : OpenAI, performance de référence de GPT-5.5 : analyse des avantages et inconvénients

Dans le domaine de la sécurité, Anthropic a récemment lancé le modèle Claude Mythos Preview, axé sur une forte sécurité, tandis que GPT-5.5 a renforcé ses capacités de défense, mais est actuellement accessible uniquement via des canaux spécifiques pour la protection des infrastructures par des entreprises certifiées.

Comparaison des modèles principaux : GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro

Comparaison des données entre GPT-5.5 et Claude Opus 4.7

Selon les tests combinés d’OpenAI et ITmedia, dans le test OSWorld-Verified, qui simule un environnement informatique réel, GPT-5.5 a obtenu un score de 78,7 %, légèrement supérieur à Claude Opus 4.7 avec 78,0 %.

Dans le test BrowseComp, qui évalue la logique avancée et la collaboration avec des outils, GPT-5.5 a obtenu 84,4 %, surpassant Claude Opus 4.7 avec 79,3 % ; dans les tests FrontierMath Tier 1 à 3, qui évaluent les mathématiques avancées, GPT-5.5 a obtenu 51,7 %, devant Claude Opus 4.7 avec 43,8 %.

Comparaison des données entre GPT-5.5 et Gemini 3.1 Pro

En comparaison avec Gemini 3.1 Pro, GPT-5.5 maintient une avance dans la majorité des tests spécialisés. Dans le test GDPval de travail de connaissance, GPT-5.5 a obtenu 84,9 %, contre 67,3 % pour Gemini 3.1 Pro.

Dans l’évaluation Toolathlon, qui teste l’utilisation d’outils externes, GPT-5.5 a obtenu 55,6 %, supérieur aux 48,8 % de Gemini 3.1 Pro.

Source : OpenAI, comparaison des données entre GPT-5.5 et Gemini 3.1 Pro

Dans le test multimodal MMMU Pro sans assistance d’outils, GPT-5.5 a obtenu 81,2 %, contre 80,5 % pour Gemini 3.1 Pro, performance très proche.

GPT-5.5 pour préparer une introduction en IPO ?

Le directeur de la recherche chez OpenAI, Mark Chen, indique que, GPT-5.5 apporte une amélioration substantielle dans les processus de recherche scientifique et technologique, pouvant aider à accélérer la découverte de médicaments et d’autres domaines.

Le média « The Verge » souligne que cette sortie reflète la compétition entre OpenAI et Anthropic pour dominer le marché des outils d’IA d’entreprise, et pourrait préparer le terrain pour une première introduction en bourse (IPO) plus tard cette année, alors que les deux parties se livrent à une concurrence de plus en plus féroce.

Lecture complémentaire :
Comment utiliser ChatGPT Images 2.0 ? Tests avec menus de ramen, couvertures de magazines, vulgarisation multilingue

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler