Nouvelles de Gate News, le 10 avril : récemment, une réponse de Musk sur la plateforme X a suscité de vifs débats à propos de l’estimation de l’ampleur des paramètres du modèle phare d’Anthropic. En réponse à la question d’un utilisateur au sujet du nombre de paramètres de Grok 4.2, Musk a confirmé : « 0,5 billion de paramètres au total. À l’heure actuelle, Grok représente la moitié de Sonnet, et un dixième d’Opus. Compte tenu de sa taille, c’est un modèle extrêmement puissant. » Si l’on effectue un calcul à rebours à partir de l’affirmation de Musk selon laquelle « Grok 4.2 équivaut à un dixième d’Opus », les paramètres de Claude Opus seraient d’environ 5 billions et ceux de Claude Sonnet d’environ 1 billion. Il convient de noter qu’Anthropic n’a jamais divulgué publiquement la taille des paramètres de l’un quelconque de ses modèles ; les chiffres ci-dessus ne sont qu’une estimation tirée des propos de Musk, et ne constituent pas des données officielles. Par ailleurs, Musk a révélé que le cluster de supercalculateur Colossus 2, du département IA de SpaceX, entraîne en parallèle 7 modèles, dont la taille maximale atteint 10 billions de paramètres, et a ajouté : « Il reste encore quelques efforts de rattrapage à fournir. » Si l’estimation est exacte, Claude Opus, avec 5 billions de paramètres, se classerait au sommet parmi les modèles déployés actuellement connus ; quant au modèle à 10 billions de paramètres entraîné en parallèle par xAI, il deviendra alors un facteur déterminant de la prochaine phase de la compétition.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Google et Boston Dynamics intègrent des modèles d’IA Gemini dans le robot Spot pour le contrôle en langage naturel et l’exécution de tâches
Google et Boston Dynamics ont intégré les modèles de robotique Gemini dans le robot Spot, lui permettant de comprendre des commandes en langage naturel, de reconnaître des objets et d’exécuter des tâches de manière autonome, améliorant l’efficacité et l’adaptabilité en robotique.
GateNewsIl y a 20m
Le créateur de Nas Daily, Nuseir Yassin, lève $27M en Série A pour la plateforme de création d’entreprises d’IA
Nas.com, fondée par Nuseir Yassin de Nas Daily, a levé $27 million au cours d’un tour de financement de Série A mené par Khosla Ventures. Cela met en évidence une tendance selon laquelle les créateurs se tournent vers la technologie, en tirant parti de leur audience pour stimuler la croissance des entreprises.
GateNewsIl y a 22m
Sama va licencier plus de 1 100 travailleurs kényans après la fin du contrat avec Meta
Samasource Impact Sourcing Inc licenciera plus de 1 100 employés à Nairobi à la suite de la résiliation d’un contrat clé par Meta. Malgré les efforts pour préserver les emplois, le recours de l’entreprise à de grands clients technologiques américains met en évidence l’instabilité du secteur africain de l’externalisation de l’IA.
GateNewsIl y a 22m
Claude Opus 4.7 d’Anthropic : le raisonnement évolue encore, ce n’est plus seulement un outil pour répondre
Claude Opus 4.7, publié par Anthropic, renforce les capacités de raisonnement et le traitement des longs textes. Il passe d’un outil de réponse à un assistant à la prise de décision, améliorant la compréhension du contexte et la sécurité. Cette mise à jour montre que les enjeux concurrentiels de l’industrie se déplacent de la performance des modèles vers l’utilité, marquant l’entrée de l’IA générative dans une phase d’applications matures plutôt que de simples techniques expérimentales.
ChainNewsAbmediaIl y a 28m
CoreWeave lève $1 milliards de dollars en obligations senior à un rendement de 9,75 %, après une première émission obligataire de 1,75 milliard de dollars
CoreWeave a annoncé une offre de $1 milliards d'obligations senior non garanties à un coupon de 9,75 %, après une émission obligataire de 1,75 milliard de dollars. Les fonds sont destinés au remboursement de la dette et à des fins générales d'entreprise, reflétant le modèle fortement capitalistique de CoreWeave et une forte demande pour les locations de GPU.
GateNewsIl y a 1h
Le Qwen Lab d'Alibaba ouvre le modèle Qwen3.6-35B-A3B avec une architecture MoE clairsemée
Le Qwen Lab d'Alibaba a publié Qwen3.6-35B-A3B, un grand modèle de langage open source doté d'une architecture à mélange d'experts clairsemé, avec 35 milliards de paramètres et des capacités de programmation agentique pour une intégration avec des assistants de codage tiers.
GateNewsIl y a 1h