Selon les dernières nouvelles de Yijing AI, le 16 février, Alibaba Qianwen a officiellement lancé Qwen3.5 et a publié la version avec poids ouverts du premier modèle de la série Qwen3.5, Qwen3.5-397B-A17B. Ce modèle utilise une architecture innovante hybride, combinant l’attention linéaire (Gated Delta Networks) et les experts mixtes creux (MoE), pour une efficacité de raisonnement exceptionnelle : un total de 397 milliards de paramètres, avec seulement 17 milliards de paramètres activés lors de chaque propagation avant, optimisant ainsi la vitesse et le coût tout en conservant la capacité.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Alibaba a officiellement lancé la nouvelle génération de grand modèle Qwen3.5
Selon les dernières nouvelles de Yijing AI, le 16 février, Alibaba Qianwen a officiellement lancé Qwen3.5 et a publié la version avec poids ouverts du premier modèle de la série Qwen3.5, Qwen3.5-397B-A17B. Ce modèle utilise une architecture innovante hybride, combinant l’attention linéaire (Gated Delta Networks) et les experts mixtes creux (MoE), pour une efficacité de raisonnement exceptionnelle : un total de 397 milliards de paramètres, avec seulement 17 milliards de paramètres activés lors de chaque propagation avant, optimisant ainsi la vitesse et le coût tout en conservant la capacité.