OpenAI teste la nouvelle génération de modèles d'images gpt-image-2, axée sur les graphiques complexes et le réalisme

robot
Création du résumé en cours

21 avril – OpenAI s’apprête à lancer une nouvelle génération de modèles de génération d’images, qui ont été testés par certains utilisateurs de ChatGPT et apparaissent sous un nom de code dans des classements tiers, certains utilisateurs la nommant gpt-image-2. Ce modèle devrait être officiellement publié dans les prochaines semaines.
Des sources proches du dossier mentionnent deux améliorations clés. La première est une capacité accrue pour les graphiques complexes. Par exemple, positionner précisément des notes adhésives ou du texte à des endroits spécifiques sur un tableau blanc, ce que l’ancien modèle ne faisait pas bien. La deuxième est que la sortie ne donne plus une « sensation d’IA », avec des visages trop parfaits, comme un éclairage ou un lissage de peau irréalistes, qui étaient autrefois considérés comme des défauts.
Le nouveau modèle est soutenu par la pression de croissance des utilisateurs d’OpenAI. Le nombre d’utilisateurs actifs hebdomadaires de ChatGPT est récemment resté autour de 920 millions, manquant l’objectif d’atteindre 1 milliard d’ici la fin 2025. Sam Altman a déjà lancé un « code rouge » interne à l’entreprise à la fin de l’année dernière, suite à la popularité du modèle d’image de Google, Nano Banana, et l’amélioration de la génération d’images est devenue l’une des priorités du « code red ».
OpenAI espère reproduire ce qu’on a appelé le « moment Ghibli » au début de 2025, lorsque des centaines de millions d’utilisateurs ont utilisé ChatGPT pour transformer leurs photos et celles de leurs amis en style Ghibli. Avec l’amélioration des capacités de rendu textuel, les images peuvent désormais être plus fiables pour une utilisation dans la publicité et les graphiques éducatifs. C’est une direction dans laquelle OpenAI cherche à prendre de l’avance par rapport à Anthropic, qui a récemment dépassé OpenAI en revenus grâce à ses modèles de programmation.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler