Gate News, le 25 mars, l’Institut de recherche de Google a publié l’algorithme de compression quantifiée TurboQuant, qui peut compresser le cache KV des grands modèles linguistiques à 3 bits, réduisant l’utilisation de mémoire d’au moins 6 fois, sans nécessiter d’entraînement ou de fine-tuning, tout en préservant la précision du modèle. En mode 4 bits, la vitesse de calcul de l’attention sur le GPU H100 de NVIDIA est jusqu’à 8 fois plus rapide que la ligne de base non quantifiée à 32 bits. L’équipe de recherche a validé TurboQuant sur des benchmarks de contexte long tels que LongBench, Needle In A Haystack, ZeroSCROLLS, en utilisant les modèles Gemma et Mistral, et TurboQuant a obtenu des performances optimales dans tous les tests. Cet algorithme se compose de deux sous-algorithmes : PolarQuant, qui élimine la surcharge mémoire des méthodes de quantification traditionnelles via une transformation en coordonnées polaires, et QJL, qui corrige l’erreur résiduelle avec seulement 1 bit. La recherche a été menée sous la direction d’Amir Zandieh de l’Institut de recherche de Google et du vice-président et Google Fellow Vahab Mirrokni, en collaboration avec KAIST en Corée du Sud et l’Université de New York, et sera présentée à l’ICLR 2026. Google indique que l’une des principales applications de cette technologie est de résoudre le goulot d’étranglement du cache KV dans des modèles tels que Gemini.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
CryptoRank : seulement 6 ICO finalisées en 2026, le financement ralentit
D’après CryptoRank, seulement six offres initiales de pièces (ICO) ont été finalisées en 2026 à ce jour, et la moitié d’entre elles se négociaient en dessous de leurs prix d’offre. Le financement par crypto connaît un changement structurel, les tours de financement par capital-risque ralentissant aussi en avril par rapport au début de l’année. Les six ICO
CryptoFrontierIl y a 3h
Les CEX traitent 19,17T de trading de crypto au comptant en 2025, la TradFi s’étend avec l’activité $37B de fusions-acquisitions
Message de Gate News : des bourses de cryptomonnaies ont traité 19,17 billions de dollars en négociation spot de crypto en 2025, tandis que les actions ont atteint 155 billions de dollars et que les marchés des changes ont réalisé 9,6 billions de dollars de transactions quotidiennes. Le marché a également vu 37 milliards de dollars déployés dans des opérations de M&A de TradFi par de grands acteurs, parallèlement à th
GateNewsIl y a 8h
Hyperscale Data signale $5M de revenus miniers en cryptomonnaie pour le T1 2026
Hyperscale Data (NYSE American : GPUS) a divulgué son chiffre d’affaires préliminaire pour le premier trimestre 2026, son activité d’extraction de cryptomonnaies générant environ 5 millions de dollars, contribuant à un chiffre d’affaires total de l’entreprise d’environ 44 millions de dollars, en hausse de 76 % d’une année sur l’autre.
La société prévoit de céder son activité diversifiée
GateNewsIl y a 8h
SoFi publie 1,1 milliard de dollars de revenus au T1, en hausse de 41 %, et lance le stablecoin SoFiUSD
D’après Businesswire, SoFi Technologies a annoncé un chiffre d’affaires net du premier trimestre record de 1,1 milliard de dollars, en hausse de 41 % d’une année sur l’autre, avec un résultat net de 167 millions de dollars, marquant sa dixième séquence consécutive de rentabilité en GAAP. La société fintech a officiellement lancé sa stablecoin en dollars américains SoFiUSD entièrement adossée à des réserves.
GateNewsIl y a 8h
Le marché des RWA tokenisées atteint 193,2 milliards de dollars d’ici la fin du T1 2026, en hausse de 256 % en 15 mois
D’après CoinGecko, le marché des actifs réels tokenisés (RWA) a atteint 193,2 milliards de dollars d’ici la fin du T1 2026, en hausse de 256 % par rapport à 54,2 milliards de dollars au début de 2025. Les Trésors tokenisés ont mené la croissance, représentant 67,2 % du marché pour environ 130 milliards de dollars, tandis que les Commodités tokenisées sont passées à $
GateNewsIl y a 10h
Les piratages DeFi atteignent 624,58 millions de dollars en avril 2026, la sixième plus grosse perte jamais enregistrée avec le plus grand nombre d’incidents
D’après DefiLlama, les piratages dans la DeFi et l’infrastructure on-chain ont entraîné 624,58 millions de dollars de pertes en avril 2026, soit la sixième plus importante perte mensuelle enregistrée. Les 23 incidents recensés ce mois-là représentent aussi le plus grand nombre d’attaques en un seul mois depuis le début du suivi en
GateNewsIl y a 13h