Grok 4.2 vient d'atteindre 60% sur le benchmark ARC AGI 2. Performance plutôt solide. On dirait que nous assistons à un nouveau moment de pointe dans les capacités de l'IA. Les progrès sur ces benchmarks standardisés continuent de repousser les limites de ce que ces modèles peuvent gérer.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
15 J'aime
Récompense
15
5
Reposter
Partager
Commentaire
0/400
LiquidationHunter
· Il y a 5h
60 % ? C'est encore loin, il faut continuer à se battre.
Voir l'originalRépondre0
SnapshotLaborer
· Il y a 15h
60% ouais, ce chiffre semble pas mal mais pas si démentiel... De toute façon, ces benchmarks ne veulent rien dire, c'est l'utilisation réelle qui compte vraiment
Voir l'originalRépondre0
ForkInTheRoad
· Il y a 15h
60 % ? J'ai l'impression que ce n'est pas aussi explosif que je l'avais imaginé... Je pensais pouvoir dépasser 70.
Voir l'originalRépondre0
MEV_Whisperer
· Il y a 15h
ngl arc benchmark a été à nouveau mis à jour, mais ces 60 % peuvent-ils vraiment signifier quelque chose ? J'ai l'impression que ces classements sont encore loin de la réalité des applications...
Voir l'originalRépondre0
NeonCollector
· Il y a 15h
60% ah, quelle est la marge d'erreur de ce benchmark... le véritable AGI est encore loin
Grok 4.2 vient d'atteindre 60% sur le benchmark ARC AGI 2. Performance plutôt solide. On dirait que nous assistons à un nouveau moment de pointe dans les capacités de l'IA. Les progrès sur ces benchmarks standardisés continuent de repousser les limites de ce que ces modèles peuvent gérer.