Google publica el algoritmo TurboQuant: cuantización KV cache de 3 bits sin pérdida de precisión, velocidad de inferencia aumenta hasta 8 veces

Noticias de Gate News, el 25 de marzo, el Google Research Institute publicó el algoritmo de compresión cuantitativa TurboQuant, que puede comprimir la caché KV de modelos de lenguaje grande a 3 bits, reduciendo el uso de memoria al menos 6 veces, sin necesidad de entrenamiento o ajuste fino, y sin pérdida de precisión del modelo. En modo de 4 bits, la velocidad de cálculo de atención en la GPU Nvidia H100 se incrementa hasta 8 veces en comparación con la línea base de 32 bits sin cuantificación. El equipo de investigación validó TurboQuant en benchmarks de contexto largo como LongBench, Needle In A Haystack, ZeroSCROLLS, usando los modelos Gemma y Mistral, logrando el mejor rendimiento en todas las pruebas. El algoritmo consta de dos subalgoritmos: PolarQuant, que elimina el gasto de memoria de los métodos tradicionales de cuantificación mediante transformación en coordenadas polares, y QJL, que corrige errores residuales con solo 1 bit. La investigación fue liderada por Amir Zandieh del Google Research Institute y Vahab Mirrokni, vicepresidente y Google Fellow, en colaboración con KAIST en Corea y la Universidad de Nueva York, y será presentada en ICLR 2026. Google afirmó que una de las principales aplicaciones de esta tecnología es resolver el cuello de botella en la caché KV de modelos como Gemini.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Los ingresos del Q1 de Moore Threads se disparan un 155% interanual hasta $104M; cambia a la rentabilidad

Mensaje de Gate News, 26 de abril — Moore Threads informó unos ingresos de 738 millones de yuanes en el primer trimestre de 2026 (aproximadamente $104 million), lo que representa un aumento interanual del 155,35%. La empresa pasó a la rentabilidad con un ingreso neto de 29,36 millones de yuanes, en comparación con una pérdida de 112 millones de yuanes en el sa

GateNewsHace35m

Las stablecoins no solo se usan para pagos transfronterizos, ¡también se localizan! Informe más reciente de a16z: Asia impulsa dos tercios del volumen de transacciones

El gigante de la inversión cripto a16z acaba de publicar el informe “9 charts on what stablecoins are becoming”, que con nueve gráficos clave describe el cambio estructural que está ocurriendo en las stablecoins. La conclusión central de este informe no es la aparición de nuevos tokens o una nueva narrativa, sino la transición del papel de las stablecoins de “herramienta de transacciones” y “medio de ahorro” hacia “infraestructura financiera central”, y además cada vez más localizada, con una brecha clara entre lo que el mercado imaginaba originalmente para los pagos transfronterizos. El GENIUS Act de EE. UU. impulsa el volumen de operaciones con stablecoins a 4,5 billones de dólares en el trimestre 4 Durante muchos años, la incertidumbre regulatoria ha sido el techo de la participación institucional en las stablecoins. El punto de inflexión proviene del GENIUS Act de Estados Unidos, que establece el primer marco a nivel federal para la emisión de stablecoins. Los datos de a16z muestran que, antes de la aprobación del proyecto de ley, el volumen de operaciones de stablecoins ajustado ya llevaba varios trimestres en una tendencia

ChainNewsAbmediaHace47m

Banco Central de Brasil: Las stablecoins dominan las compras de criptomonedas por más de $6.9 mil millones registradas en el 1T

Según los datos divulgados por el Banco Central de Brasil, las compras de stablecoins representaron 6.800 millones de dólares de los 6.900 millones de dólares en criptomonedas compradas en el extranjero por brasileños durante el primer trimestre (Q1). Esto representa un aumento de más del 100% en comparación con el mismo período del año pasado. Ideas clave: El Banco Central de Brasil

Coinpediahace3h

Los stablecoins surgen como infraestructura financiera central, y se aceleran las tendencias de localización: informe de a16z

Mensaje de Gate News, 26 de abril — Según un informe de los investigadores de cripto de a16z Robert Hackett y Jeremy Zhang, los stablecoins están evolucionando desde instrumentos de trading en etapas iniciales y vehículos de ahorro hacia una infraestructura financiera central. La Ley U.S. GENIUS Act ha

GateNewshace9h

79% de los cajeros automáticos globales de cripto ubicados en Estados Unidos

Mensaje de Gate News, 25 de abril — Según Cointelegraph, el 79% de los cajeros automáticos de criptomonedas del mundo están ubicados en Estados Unidos.

GateNewshace17h

Informe de tendencias del ETF de JPMorgan: API, asignación activa del 83%, y tokenización dividida en dos rutas: sintética y nativa

El informe de JPMorgan señala tres tendencias principales: 1) el comercio automatizado mediante APIs de AP representa aproximadamente el 50% del flujo de la primera capa del mercado; 2) en 2025, los ETF activos representarán el 83% de las nuevas emisiones, y se espera que en 2026–27 se conviertan en la corriente principal; 3) la tokenización se divide en dos rutas: sintética (que replica precios mediante derivados) y nativa (que se emite en una blockchain). El informe enfatiza mejorar la transparencia y la gobernanza con herramientas como Athena, y observa la evolución posterior y los plazos de la comercialización formal.

ChainNewsAbmediahace20h
Comentar
0/400
Sin comentarios