🚨 La crisis de RAM acaba de terminar y un algoritmo la solucionó


En octubre de 2025, OpenAI voló a Seúl.
Firmaron acuerdos con Samsung y SK Hynix.
Por 900,000 obleas de memoria. Por mes.
Eso es el 40% de toda la oferta mundial de DRAM.
Reservado. Para una sola compañía.
Los kits de RAM DDR5 pasaron de $120 a $490 casi de la noche a la mañana.
Las laptops se volvieron más caras.
Los teléfonos se enviaron con menos RAM.
Los constructores de PC estaban pagando 4 veces lo que pagaron el año anterior.
Los analistas lo llamaron la peor crisis de memoria en 20 años.
Luego Google publicó un artículo de investigación.
Aquí por qué eso importa.
Cada chatbot de IA que usas tiene una "memoria de trabajo".
Se llama la caché KV.
Así es como el modelo recuerda tu conversación mientras hablas.
Se almacena con precisión de 16 bits.
Eso es como escribir cada palabra en letras grandes y negritas.
Es preciso. Pero es enorme.
Y a medida que las ventanas de contexto de IA crecieron a 1 millón de tokens, esa memoria se infló.
Los centros de datos estaban acaparando RAM solo para mantenerse al día.
El equipo de Google hizo una pregunta diferente.
¿Realmente necesita ser tan grande?
La respuesta fue no.
Desarrollaron TurboQuant.
Usando matemáticas de coordenadas polares y la transformación de Johnson-Lindenstrauss, comprimen esa memoria de 16 bits a 3.
No se requiere reentrenamiento.
Cero pérdida de precisión.
6 veces menos memoria.
8 veces más rápido en Nvidia H100s.
El artículo se publicó el 25 de marzo de 2026.
Las acciones de chips de memoria cayeron en 24 horas.
Y luego sucedió otra cosa.
OpenAI ya estaba bajo presión.
Los inversores querían recortes de costos.
Una posible oferta pública inicial estaba en el horizonte.
Cancelaron un acuerdo masivo de centro de datos con Oracle en Texas.
Cerraron Sora.
Reducieron silenciosamente sus pedidos de RAM a Samsung y SK Hynix.
Los kits DDR5 cayeron $100 en semanas.
La crisis de RAM empezó a desinflarse casi de la noche a la mañana.
Aquí está la verdadera lección.
La escasez no fue un problema de hardware.
Fue una apuesta.
Una apuesta a que la IA siempre sería hambrienta de memoria.
Que la única solución era comprar más chips.
TurboQuant invalidó esa apuesta a nivel de software.
Gratis.
Un artículo de investigación cambió la economía de toda una industria.
Así es como la eficiencia algorítmica se manifiesta como una fuerza macro.
Y apenas estamos comenzando.
Ver originales
post-image
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado