2026-01-01 18:26:36

Grok 4.2 vient d'atteindre 60% sur le benchmark ARC AGI 2. Performance plutôt solide. On dirait que nous assistons à un nouveau moment de pointe dans les capacités de l'IA. Les progrès sur ces benchmarks standardisés continuent de repousser les limites de ce que ces modèles peuvent gérer.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

15 J'aime

Récompense
15
5
Reposter
Partager

Commentaire

0/400

LiquidationHunter

· Il y a 5h

60 % ? C'est encore loin, il faut continuer à se battre.

Voir l'originalRépondre0

SnapshotLaborer

· Il y a 15h

60% ouais, ce chiffre semble pas mal mais pas si démentiel... De toute façon, ces benchmarks ne veulent rien dire, c'est l'utilisation réelle qui compte vraiment

Voir l'originalRépondre0

ForkInTheRoad

· Il y a 15h

60 % ? J'ai l'impression que ce n'est pas aussi explosif que je l'avais imaginé... Je pensais pouvoir dépasser 70.

Voir l'originalRépondre0

MEV_Whisperer

· Il y a 15h

ngl arc benchmark a été à nouveau mis à jour, mais ces 60 % peuvent-ils vraiment signifier quelque chose ? J'ai l'impression que ces classements sont encore loin de la réalité des applications...

Voir l'originalRépondre0

NeonCollector