Básico
Spot
Opera con criptomonedas libremente
Margen
Multiplica tus beneficios con el apalancamiento
Convertir e Inversión automática
0 Fees
Opera cualquier volumen sin tarifas ni deslizamiento
ETF
Obtén exposición a posiciones apalancadas de forma sencilla
Trading premercado
Opera nuevos tokens antes de su listado
Contrato
Accede a cientos de contratos perpetuos
TradFi
Oro
Plataforma global de activos tradicionales
Opciones
Hot
Opera con opciones estándar al estilo europeo
Cuenta unificada
Maximiza la eficacia de tu capital
Trading de prueba
Introducción al trading de futuros
Prepárate para operar con futuros
Eventos de futuros
Únete a eventos para ganar recompensas
Trading de prueba
Usa fondos virtuales para probar el trading sin asumir riesgos
Lanzamiento
CandyDrop
Acumula golosinas para ganar airdrops
Launchpool
Staking rápido, ¡gana nuevos tokens con potencial!
HODLer Airdrop
Holdea GT y consigue airdrops enormes gratis
Launchpad
Anticípate a los demás en el próximo gran proyecto de tokens
Puntos Alpha
Opera activos on-chain y recibe airdrops
Puntos de futuros
Gana puntos de futuros y reclama recompensas de airdrop
Inversión
Simple Earn
Genera intereses con los tokens inactivos
Inversión automática
Invierte automáticamente de forma regular
Inversión dual
Aprovecha la volatilidad del mercado
Staking flexible
Gana recompensas con el staking flexible
Préstamo de criptomonedas
0 Fees
Usa tu cripto como garantía y pide otra en préstamo
Centro de préstamos
Centro de préstamos integral
Centro de patrimonio VIP
Planes de aumento patrimonial prémium
Gestión patrimonial privada
Asignación de activos prémium
Quant Fund
Estrategias cuantitativas de alto nivel
Staking
Haz staking de criptomonedas para ganar en productos PoS
Apalancamiento inteligente
Apalancamiento sin liquidación
Acuñación de GUSD
Acuña GUSD y gana rentabilidad de RWA
¿Por qué los precios de las GPU se están disparando sin control?
El gran déficit de GPU: capacidad de alquiler: lanzando nuestro índice de precios de alquiler a 1 año del H100 Autor: Daniel Nishball, Jordan Nanos, Cheang Kang Wen, etc. Traducción: Peggy, BlockBeats
Autor:律动BlockBeats
Fuente original:
Reimpresión: 火星财经
Nota del editor: A medida que la IA pasa de ser “una herramienta” a convertirse en una infraestructura base de “flujos de trabajo”, los precios del alquiler de GPU entran en un tramo de ascenso acelerado, mientras la oferta sigue apretándose.
Del aumento de casi 40% en el precio de alquiler a un año del H100, a la capacidad de cómputo bloqueada con antelación hasta la segunda mitad de 2026, y luego a que los laboratorios de IA sigan fijando la oferta mediante contratos de largo plazo y mecanismos de renovación, la lógica operativa del mercado de GPU ha cambiado de forma evidente: los precios ya no dependen principalmente del costo del hardware, sino que los moldean conjuntamente el consumo de tokens, la capacidad del modelo y la eficiencia de producción.
Los cambios en el lado de la demanda son aún más decisivos. Nuevos paradigmas como sistemas de múltiples agentes, generación nativa de contenido y herramientas de programación de IA están empujando el uso de tokens hacia un rango de crecimiento exponencial. El juicio central del informe también se va aclarando: la relación inversión-producto de las herramientas de IA ya fue verificada, con retornos de 5–10 veces, lo que hace que los precios del cómputo permanezcan difíciles de convertir en una restricción efectiva sobre la demanda durante bastante tiempo.
La tensión que surge se ve cada vez más clara: en el mercado real del cómputo, hay una escasez integral y el poder de fijación de precios se desplaza hacia arriba, mientras que el mercado de capitales sigue anclado en la expectativa de “que finalmente habrá exceso y se convertirá en un producto básico”. Ese desajuste entre expectativas y realidad está reconfigurando la lógica de valuación del sector de infraestructura de IA.
Cuando el cómputo se convierte en el nuevo insumo de producción, su mecanismo de precios, su estructura de oferta y el retorno del capital están inmersos en una ronda de reestructuración profunda.
A continuación, el texto original:
La demanda de Claude 4.6 Opus y Claude Code de Anthropic se dispara considerablemente. Sus ingresos recurrentes anuales (ARR) en apenas un trimestre saltaron de los 9.000 millones de dólares de finales del año pasado a más de 25.000 millones de dólares en la actualidad, logrando casi un crecimiento triple. Al mismo tiempo, los modelos de código abierto, representados por GLM y Kimi K2.5, también impulsan una rápida expansión de los casos de uso relacionados con el ecosistema de modelos de código abierto. Las empresas, incluidas Anthropic, OpenAI y varias Neolabs, siguen levantando financiación, lo que también intensifica la demanda de recursos de GPU.
Este punto de inflexión implica que, en un periodo corto, la demanda sube de manera drástica, y ya se observa una oleada de compras apresuradas de GPU por parte de los hiperscalers y de nuevos proveedores de servicios en la nube (Neoclouds).
Esta demanda adicional está empujando los precios a lo largo de toda la cadena de suministro: desde la memoria DRAM y NAND, hasta cables de fibra óptica, alojamiento en centros de datos y turbinas de gas, casi todos los productos y servicios relacionados están registrando aumentos.
Los precios de alquiler de GPU se han convertido en el campo más reciente dentro de los muchos productos y servicios relacionados con cómputo donde aparece una escasez de oferta y un salto de precios. El precio del contrato de alquiler de GPU de H100 a un año, desde su mínimo de 1,70 dólares por GPU por hora en octubre de 2025, aumentó hasta 2,35 dólares por GPU por hora en marzo de 2026; el incremento es cercano al 40%.
La capacidad de alquiler de GPU bajo demanda (on-demand) está prácticamente agotada en todos los modelos: los usuarios que ya han bloqueado instancias bajo demanda, incluso después de que suban los precios, no quieren liberar el cómputo al mercado. A comienzos de 2026, la dificultad de encontrar capacidad de GPU es casi como intentar conseguir billetes para “el último vuelo”: precios altos y prácticamente sin boletos. Con un símil más preciso, más que “comprar billetes”, se parece a “buscar un canal para comprar medicinas”.
En SemiAnalysis, llevamos mucho tiempo siguiendo en profundidad diversas tendencias y temas clave dentro de los ecosistemas Neocloud y de los hiperscalers, incluyendo los precios del alquiler de GPU. Esta capacidad proviene de nuestra investigación y práctica continua en proyectos como ClusterMAX, InferenceX y el costo total de propiedad de la nube de IA (TCO).
Mientras tanto, también dedicamos grandes esfuerzos para ayudar a distintos laboratorios de IA a conectar con proveedores Neocloud, encontrar en el mercado recursos de alquiler de GPU, y mantener conversaciones continuas con casi todas las partes involucradas del ecosistema sobre las tendencias de los precios del alquiler de GPU.
Desde 2023, hemos construido y mantenido un sistema de índice de precios de alquiler de GPU para nuestros clientes. Cubre los modelos GPU principales (como H100, H200, B200, B300, GB200, GB300, MI300, MI325, MI355) y abarca distintos plazos de alquiler, desde bajo demanda (on-demand), alquiler corto de 1 mes, hasta contratos de largo plazo de hasta 5 años. Este índice se construye a partir de datos de investigación de varios proveedores Neocloud y compradores de cómputo, y se valida mediante datos de transacciones reales, así como la verificación cruzada con las negociaciones y cierres de acuerdos en los que participamos como intermediarios.
Hoy, abrimos al público el índice de precios de alquiler de GPU de H100 a 1 año, con la esperanza de proporcionar más datos e información para la industria. Este índice se actualiza mensualmente, y también publicaremos interpretaciones de las tendencias más recientes y observaciones del mercado de forma continua en X y LinkedIn. En cuanto a los datos completos de precios que cubren diferentes estructuras de plazos de alquiler y otros modelos GPU principales, por ahora solo están disponibles para usuarios institucionales que se suscriban a nuestro modelo de TCO de IA en la nube.
Este informe se centrará en las tendencias más recientes del mercado de alquiler de GPU, las observaciones de primera línea del mercado y los datos clave, analizando cómo entendemos la estructura general del mercado y ofreciendo un juicio preliminar sobre la dirección futura de los precios del alquiler.
El mercado de alquiler de GPU entra en una etapa de “pricing dinámico”
Solo observando la curva de precios del alquiler a un año de H100, todavía no basta para reflejar por completo el nivel de tensión del mercado: lo que se refleja a través de nuestra experiencia real obteniendo cómputo en primera línea y de los comentarios de los participantes del mercado es aún más severo.
La demanda actual proviene de múltiples escenarios de uso altamente heterogéneos y, en la práctica, no existe una “solución universal”. Por ejemplo, en el lado de la inferencia, los modelos de Mixture of Experts a gran escala (MoE) se adaptan mejor para ejecutarse en sistemas grandes de última generación como GB300 NVL72; mientras que en el lado del entrenamiento, H100 mantiene ventajas en costo-beneficio, de modo que incluso las GPU de “la generación anterior” siguen manteniendo la demanda en niveles altos.
Los clientes incluso están compitiendo por pagar rápidamente 14 dólares por GPU por hora en el precio del servicio AWS p6-b200 de instancias tipo spot; algunos de los principales proveedores Neocloud ya no venden instancias de un solo nodo; algunos precios de renovación de H100, incluso, son exactamente los mismos que cuando se firmaron hace dos o tres años; y también hay contratos de H100 ya renovados hasta 2028, con un plazo de alquiler de 4 años. Ahora buscar un clúster H100 o H200 de incluso 8 nodos (64 GPUs) no es fácil: de los proveedores a los que consultamos, la mitad ya está completamente agotada, y la mayoría de las respuestas de los proveedores es: no hay ninguna GPU con arquitectura Hopper que vaya a vencer un contrato reciente y vaya a liberarse.
Incluso escuchamos que algunos arrendatarios de cómputo están empezando a desarmar los clústeres que alquilaron para revenderlos y reacondicionarlos en nuevas rentas, casi como desarmar un apartamento para alquilarlo por corta duración durante una carrera del Gran Premio de Mónaco. Si después aparecerá lo que se llama un “Neocloud doble revendedor”, probablemente ya no sea solo un chiste.
La oferta de Blackwell también está extremadamente tensionada. Entendemos que, debido a una fuerte demanda de modelos de pesos de código abierto, y a que la demanda de inferencia sigue estallando, el periodo de despliegue y entrega de la nueva tanda de clústeres Blackwell se ha extendido hasta junio-julio. Además, la mayoría de estos clústeres que están por salir ya han sido bloqueados con antelación. En realidad, mirando el mercado en su conjunto, hasta agosto-septiembre de 2026, la capacidad nueva que se incorporará ya está casi toda reservada.
Precios de alquiler de GPU: vuelve el “boom”
Pero, ¿por qué el mercado llega a este punto? Hace solo 6 meses, la mayoría de los observadores del mercado seguían dudando del “valor final” de las GPU y, en general, creían que los precios del alquiler de GPU inevitablemente seguirían cayendo con el paso del tiempo. En ese momento, si un Neocloud o un hiperscalers aplicaba un ciclo de depreciación de 6 años en sus modelos financieros para gestionar activos de cómputo de GPU, incluso podría recibir críticas de analistas financieros. Antes de discutir tendencias futuras, primero revisemos rápidamente cómo evolucionaron las cosas hasta aquí.
Antes de la segunda mitad de 2025, las expectativas dominantes del ecosistema eran: con los despliegues a gran escala de Blackwell y un costo unitario de cómputo significativamente más bajo, el precio de alquiler de Hopper (es decir, H100 y H200) bajaría claramente. Sin embargo, la realidad fue exactamente lo contrario. Hacia la segunda mitad de 2025, la demanda de H100 no solo no se debilitó, sino que en muchos escenarios incluso se intensificó. La rápida adopción de modelos de pesos de código abierto, y la aceleración continua de la demanda de inferencia en ese periodo, fueron las primeras señales de esta nueva ola de demanda de cómputo casi interminable.
En enero de 2026, el mercado de cómputo tocó su siguiente punto de inflexión: después de varios trimestres de rápida alza en los precios de la memoria DRAM y NAND, estos entraron en una fase de subida casi “parabólica”. Según nuestro modelo de almacenamiento, en el primer trimestre de 2026, las tasas de aumento interanual de los precios de contratos de LPDDR5 y DDR5 se acercaron, respectivamente, a unas 4 veces y 5 veces.
Para mitigar el riesgo de márgenes de ganancia provocado por el aumento abrupto en el costo de componentes, los fabricantes OEM empezaron a subir los precios de los servidores de IA, y el aumento fue claramente mayor que el incremento por sí mismo de los precios de los componentes subyacentes. Esto volvió aún más complejas las decisiones de capex de clústeres: el mayor costo de compra de servidores comprimió las devoluciones esperadas de los proyectos, obligando a algunos operadores a frenar el ritmo de despliegue e incluso abandonar proyectos. Como resultado, parte de la nueva oferta que potencialmente habría entrado al mercado se pospuso o se dejó en pausa, intensificando aún más la tensión en el mercado de alquiler.
En esta confusión de compras provocada por el “descontrol de la fijación de precios de servidores de IA”, la demanda de alquiler de GPU creció de forma notablemente acelerada; gran parte del cómputo que antes aún quedaba disponible en el mercado se consumió completamente en enero y febrero. Para marzo, ya casi no era posible encontrar capacidad utilizable en ningún plazo de alquiler, ya fuera para H100, H200 o B200. El precio del alquiler a un año ya superó 2 dólares por GPU por hora a finales de enero y, a mediados-mediados de febrero, volvió a subir 15%–20% respecto a finales de enero; se estima que para finales de marzo todavía subirá 15%–20% en términos secuenciales.
Uno de los impulsores clave de la demanda a comienzos de este año proviene de la generación nativa de medios (native media generation). Aplicaciones como Seedance y Nano Banana están impulsando a los usuarios a generar e iterar imágenes y videos a escala, lo que mejora de forma significativa el throughput de tokens. Pero aún más importante, y más visible, es la aparición de cargas de trabajo de múltiples agentes (multi-agent): estos sistemas ejecutan procesos de múltiples pasos, iteran continuamente en entornos de alta concurrencia y hacen que el consumo de tokens y la demanda de cómputo muestren un crecimiento “exponencial”.
Esta tendencia se refleja especialmente en los datos relacionados con Claude Code, de lo cual ya hemos hablado en varios artículos anteriores. Por ejemplo, en SemiAnalysis: solo en los últimos 7 días, la empresa consumió decenas de miles de millones de tokens internamente, con un costo promedio de aproximadamente 5 dólares por cada millón de tokens. Pero el ahorro de tiempo, la expansión de flujos de trabajo y el aumento de capacidades que se derivan de ello superan con creces el costo en sí. Hoy en día, SemiAnalysis ha integrado un conjunto completo de herramientas de IA en múltiples flujos de trabajo: ya no se limita a búsqueda y resumen simples, sino que se extiende a paneles de datos, extracción automatizada de gran escala, procesamiento de datos a gran escala y modelado financiero basado en agentes, entre otros escenarios.
También seguimos el crecimiento explosivo de esta demanda a través de métricas como las presentaciones diarias de Claude (Claude Commits Daily). Según la tendencia actual, estimamos que para finales de 2026, Claude Code representará más del 20% de todas las presentaciones de código. Se puede decir que, en el tiempo que aún no has notado, la IA ya ha empezado a “devorar” todo el proceso de desarrollo de software. Para clientes institucionales que deseen obtener este conjunto de datos, contáctenos con nuestro equipo de API. Un adelanto: este volumen de presentaciones ya es claramente superior al nivel que teníamos cuando publicamos por primera vez.
En nuestro círculo, casi todos son usuarios intensivos de Claude Code. Pero también entendemos que ese círculo, en sí mismo, está profundamente sumergido en IA y en el sector de semiconductores; en esencia, es solo “un pequeño grupo en la primera línea”.
Para muchas empresas Fortune 500, y para el público en general, Claude Code y el “mundo de los agentes” son apenas un tema periférico un tanto novedoso, que aparece de vez en cuando en el feed de Facebook o en podcasts de NPR. Casi no se han dado cuenta de que una ola de productividad impulsada por agentes y un impacto estructural están cerca de llegar.
A medida que más participantes de la economía real van tomando conciencia de los asombrosos retornos de inversión que trae el uso de herramientas de IA y se suman a esta “ola de cómputo”, el consumo de tokens seguirá aumentando de manera escalonada. Las discusiones sobre la relación inversión-producto de la IA, en realidad, ya quedaron zanjadas: el valor creado al usar herramientas de IA suele ser de un orden de magnitud superior a su costo. En ese contexto, el desplazamiento sostenido hacia la derecha de la curva de demanda de tokens está formando una fuerza fuerte y (en la etapa actual) relativamente inelástica, que impulsa continuamente los precios del alquiler de GPU hacia arriba.
En términos simples: si el retorno de la inversión al usar herramientas de IA puede alcanzar 5–10 veces, entonces los precios del alquiler de GPU todavía tienen bastante espacio al alza; solo así la demanda podría verse realmente frenada. También no descartamos que el aumento adicional de los precios de alquiler siga transmitiéndose hacia arriba, elevando los costos de servidores y de componentes esenciales.
Publicación del índice de precios de alquiler de H100 a 1 año de SemiAnalysis
Hoy, abrimos gratis al público el índice de precios de los contratos de alquiler de H100 a 1 año de SemiAnalysis, con el objetivo de mejorar el conocimiento del mercado sobre las tendencias de precios del alquiler de GPU y la transparencia.
Este índice se basa en datos de encuestas mensuales de más de 100 participantes del mercado (incluyendo proveedores Neocloud, compradores y vendedores de cómputo) para determinar los rangos representativos de precios de alquiler de GPU (percentiles 25 a 75). Al mismo tiempo, también realizamos validación cruzada mediante datos de transacciones reales y, dentro de nuestra propia red, hacemos la intermediación entre compradores y vendedores, participando directamente en algunas transacciones, para calibrar aún mejor el nivel de precios.
Desde 2023, hemos dado seguimiento continuo a GPU como H100, H200, B200, B300, GB200 y GB300, registrando los precios de contratos bajo diferentes plazos de alquiler de 3 meses a 5 años; asimismo, incorporamos los datos relacionados con la serie AMD (MI300, MI325, MI355).
En comparación con los índices de GPU que ya existen en el mercado, el índice de precios de contratos a 1 año de H100 de SemiAnalysis tiene varias diferencias clave:
Primero, muchos índices de alquiler de GPU se basan en precios spot/on-demand o en precios de cotización pública; sin embargo, en realidad, la gran mayoría de las transacciones de alquiler de GPU se realizan mediante contratos de largo plazo, normalmente con plazos de más de 6 meses. Estos precios suelen formarse mediante negociaciones bilaterales y no aparecen en ninguna base de datos pública. La mayoría de los grandes proveedores Neocloud prefiere firmar contratos de al menos 1 año; 2–3 años es lo ideal, y aún mejor si se pueden lograr acuerdos de paquete (bundling) de 5 años por montos grandes. El índice de alquiler de H100 a un año de SemiAnalysis se enfoca justamente en este “mercado de contratos”, es decir, la parte donde se concentra el volumen real de transacciones. Al señalar un plazo de alquiler específico, el índice también facilita que los usuarios entiendan el rango de mercado que cubre y lo comparen con sus propias observaciones.
Segundo, los precios divulgados públicamente no representan los precios reales de cierre. Los precios publicados por hiperscalers y Neocloud ofrecen más bien una referencia sobre dirección de tendencia, no el nivel de transacción real. Esos precios suelen ir con retraso respecto a los cambios en el mercado de contratos, y normalmente se ajustan solo después de que la demanda de cómputo ya haya cambiado. Especialmente en el mercado on-demand, los precios a menudo se fijan en un nivel relativamente estable; en cambio, los cambios reales en oferta y demanda se reflejan mediante la utilización o ocupación de recursos, con ajustes solo cuando es necesario. Sobre esta mecánica de mercado, se ampliará más adelante en el artículo.
En tercer lugar, aunque existen varios índices que pueden manejar grandes volúmenes de cotizaciones, precios y datos de transacciones, y cuentan con ventajas en análisis de tendencias, nuestro enfoque hace aún más énfasis en la interacción directa con los participantes del mercado. Detrás de cada cotización y cada transacción hay un contexto específico y una lógica de decisión concreta. Queremos, al presentar datos cuantitativos, complementar esa información con datos cualitativos y observaciones de primera línea, para reconstruir de forma más completa la estructura real del mercado de alquiler de GPU.
Para usuarios institucionales suscritos, también ofrecemos datos de estructura de plazos completos que cubren casi todos los principales mercados de alquiler de GPU.
Al publicar el índice de precios de contratos a un año, también lanzamos para usuarios suscritos al modelo institucional de Tokenomics de SemiAnalysis el SemiAnalysis Tokenomics Dashboard, con el fin de seguir y comprender el panorama de modelos de IA de vanguardia. Este panel permite a los usuarios realizar comparaciones personalizadas en múltiples dimensiones, como código, inferencia, matemáticas y evaluaciones de agentes; comparar la fijación de precios de API de distintos modelos y proveedores; y ver datos clave divulgados por principales laboratorios de IA, incluidos volumen de uso de tokens, ingresos, valuación y tamaño de clientes, entre otros.
Estructura actual del mercado de alquiler de GPU
Antes de la segunda mitad de 2025, el entorno de precios del mercado de alquiler de GPU era relativamente más competitivo. En aquel entonces, los operadores contaban con inventarios de GPU más abundantes, mientras que la demanda final apenas empezaba a acelerar. Por ello, la competencia entre los distintos proveedores Neocloud era feroz: en general, ganaban clientes mediante precios más atractivos. Su objetivo central era aumentar la utilización y, antes de que llegara el siguiente ciclo de iteración de GPU, “exprimir” al máximo el valor de los activos de cómputo existentes.
Pero desde entonces, el panorama del mercado cambió 180 grados. Hoy, Neocloud y los hiperscalers ya han tomado por completo el control: pueden exigir mayores pagos por adelantado, mejores condiciones de precios y plazos de contrato más largos; e incluso pueden elegir por cuenta propia el momento de inicio y fin del contrato, para ajustarse a sus planes de inventario y capacidad de producción. Al mismo tiempo, el tiempo también juega a favor del lado de la oferta: pueden avanzar con los despliegues a su propio ritmo y, en un entorno de precios en aumento continuo, filtrar gradualmente la mejor combinación de clientes.
Estructuralmente, el mercado de alquiler de GPU puede dividirse aproximadamente en tres grandes segmentos; cada segmento corresponde a diferentes tipos de necesidades de clientes:
Alquiler a corto plazo: bajo demanda (on-demand), spot y contratos de menos de 3 meses
Contratos de mediano plazo: contratos de 3 meses a más de 3 años
Offtake de largo plazo (oferta asegurada): contratos de 4–5 años, donde 5 años es lo más común
Alquiler a corto plazo: bajo demanda, spot y contratos de menos de 3 meses
El alquiler a corto plazo se sitúa al frente de toda la estructura de plazos de alquiler; en muchos casos corresponde a “capacidad excedente”. Sin embargo, también hay algunos proveedores (como Runpod, Lambda) que se enfocan en ofrecer una capacidad on-demand o spot de escala considerable y con alta flexibilidad.
Hay que tener en cuenta que el mecanismo de precios del mercado on-demand es significativamente diferente al de otros mercados de contratos. Normalmente, el proveedor establece un nivel de precio relativamente fijo para los recursos on-demand, y solo lo ajusta en muy raras ocasiones. En otras palabras, los precios del mercado a corto plazo no los impulsa directamente en tiempo real el equilibrio entre oferta y demanda, sino que reflejan en mayor medida la tensión del mercado a través de los cambios en la utilización de recursos.
Los proveedores suelen ajustar los precios de una sola vez según la utilización de recursos: cuando la utilización es baja, estimulan la demanda con bajadas de precio; y cuando la utilización se acerca a la carga máxima, suben los precios, ya que incluso con un nivel de precios más alto la demanda puede mantenerse en niveles elevados.
Esto también explica por qué, al observar la serie temporal, los precios on-demand publicados por Neocloud a menudo permanecen inmutables durante un largo periodo y luego, de repente, presentan subidas o bajadas “en forma de salto”. Para el mercado on-demand, lo que realmente refleja los cambios de demanda a alta frecuencia no es el precio, sino la utilización de recursos.
Contratos de mediano plazo (Mid-Term Contracts)
En sentido económico, lo más crucial es el “mercado de contratos”, porque el valor de la gran mayoría de transacciones de alquiler de GPU ocurre en este segmento. Y especialmente los contratos de 1 año: por un lado, reflejan la demanda marginal de clientes que no son laboratorios de IA; por otro, también muestran la demanda marginal que proviene de grandes clientes. Por tanto, son el indicador más sensible para juzgar qué tan estrecho se vuelve el mercado.
Las empresas de IA nativa (AI Natives) y los laboratorios de IA medianos y pequeños suelen concentrarse principalmente en el rango de 1–3 años. Sin embargo, una tendencia reciente clara es que estas instituciones también están intentando fijar recursos de cómputo mediante contratos más largos: muchos ya se extienden a 4 años o más, e incluso están dispuestas a pagar un pago por adelantado que supera el 20%, algo que en los contratos de más de 4 años no era común en el pasado.
Ofertas aseguradas de largo plazo (Long-Term Offtakes)
En el mercado de 4–5 años, la fuerza dominante son grandes laboratorios de IA, que fijan grandes cantidades de recursos de cómputo desde una etapa temprana. Este tipo de transacciones suele corresponder a clústeres de 50MW, 100MW e incluso más; aproximadamente equivalentes a entre 24k y 48k GPUs GB300 NVL72. En general, estos acuerdos de offtake de largo plazo ya representan una parte significativa del mercado de alquiler de GPU de Neocloud.
Los laboratorios de IA prefieren estos contratos porque les permiten fijar a la vez grandes cantidades de cómputo para afrontar el crecimiento acelerado de la demanda final. Además, normalmente estas instituciones participan profundamente en el diseño del clúster, incluyendo aspectos clave como almacenamiento, red y configuraciones de CPU. Este tipo de transacción a menudo se entrega en forma de “bare metal”, ya que los laboratorios de IA cuentan con suficiente capacidad de ingeniería para personalizar la pila tecnológica en un nivel más bajo, logrando así el mejor TCO (costo total de propiedad) y el mejor rendimiento.
Para los proveedores Neocloud, este tipo de transacción también es atractiva. Por un lado, pueden concentrar sus recursos de ventas en unos pocos pedidos grandes, sin tener que gestionar una gran cantidad de clientes pequeños con el mismo ingreso. Por otro lado, los contratos de largo plazo también facilitan su financiación de deuda en mejores condiciones: al hacer coincidir los plazos de financiación con los plazos del contrato, se puede reducir de forma efectiva el riesgo por desajuste de plazos y el riesgo de volatilidad de precios; y en la mayoría de los casos, se puede asegurar una tasa interna de retorno del proyecto (IRR) de alrededor de “dos dígitos” por ciento.
Además, los hiperscalers suelen desempeñar también un papel de “backstop” (garantía de respaldo): compran el cómputo directamente a Neocloud como parte compradora, y luego lo revenden a los laboratorios de IA. Esta estructura beneficia a todas las partes: Neocloud puede obtener mejores condiciones de financiación basadas en el comprador con calificación AAA; mientras que los hiperscalers no necesitan expandir su balance de activos y pasivos, y pueden participar en una parte de los beneficios del proyecto aportando aval crediticio.
La siguiente tabla muestra algunos acuerdos grandes de offtake que estamos siguiendo. Analizaremos a fondo estas transacciones para deducir los precios implícitos por hora de GPU ($/hr/GPU), así como indicadores de rentabilidad clave como la IRR del proyecto y el margen de ganancias EBIT.
En el entorno de mercado actual, la gran mayoría de los grandes clústeres en expansión en realidad son “absorbidos internamente” por laboratorios de IA. Sin embargo, estas instituciones también entrarán en el mercado de contratos dentro de los 4 años para sumar capacidad de forma adicional, y además, al renovar los clústeres existentes de H100 y H200, impiden de manera indirecta que la oferta vuelva a fluir a este mercado. A medida que los superclústeres GB200 y GB300 vayan entrando gradualmente en operación, cómo evolucionarán las relaciones de oferta y demanda en el mercado de contratos de 1–3 años se convertirá en la variable a observar de cerca en el siguiente periodo.
“¿Hacia dónde va la bola?” (Where The Puck is Going)
Lo que más llama la atención es el desajuste claro entre la realidad subyacente y el sentimiento del mercado. Aunque las señales como el estrechamiento de la oferta y el aumento de precios, que deberían ser favorables para Neocloud (expansión de márgenes de ganancia y extensión de la vida útil de activos), ya son muy claras, el mercado público se vuelve cada vez más pesimista sobre empresas como CoreWeave, Nebius, Iris Energy, etc.; y sus precios de las acciones siguen actualmente en la parte baja del rango de los últimos 6–12 meses.
El mercado aún está dominado por el relato de “exceso de oferta final” y “commoditización del cómputo”, y los cambios anteriores no han aliviado realmente la preocupación de los inversores por el valor a largo plazo de las GPU. Pero desde la perspectiva de primera línea, la oferta sigue tensionada y el poder de fijación de precios ha aumentado: esto significa que casi todo el cómputo está en estado de ser “absorbido” por la demanda. Incluso si existen diferencias de rendimiento, en este entorno extremo de escasez, todavía no hay suficiente oferta para satisfacer la demanda.
Tres puntos de observación futuros
Para determinar si los precios del alquiler de GPU seguirán manteniéndose en niveles altos, se pueden enfocar en tres variables:
1、El ritmo de expansión de clústeres GB300 (2026) La clave está en la velocidad relativa entre la nueva capacidad de cómputo y la demanda de tokens: si la oferta aliviará la tensión o si la demanda seguirá superando a la oferta. Esto afectará directamente si los laboratorios de IA seguirán participando en el mercado de contratos dentro de 4 años y la trayectoria de precios en ese rango.
2、Si la escasez de chips empeora más Incluye la capacidad de fabricación de la N3 de TSMC, HBM, DRAM, NAND y otros eslabones clave; cualquier oscilación a nivel de ejecución de fabricación podría apretar aún más la oferta.
3、La velocidad de crecimiento de los ingresos (ARR) y el consumo de tokens de los laboratorios de IA La expansión de la comercialización de la IA y del tamaño de uso determinará la intensidad de la demanda final; y esta es la variable central que impulsa la demanda de cómputo.
Los precios suben en una sola dirección y la tasa de retorno aumenta en consecuencia
En conjunto, una conclusión relativamente clara es: la probabilidad de que los precios del alquiler de GPU sigan subiendo es mayor que la probabilidad de que caigan.
Este proceso tiene características claramente auto-reforzadas: cuando Neocloud observa que la oferta se está ajustando y que los precios suben, bloquea con antelación más hardware, comprimiendo aún más la oferta del mercado y empujando los precios a continuar al alza. Esto se parece al ciclo de escasez de GPU de 2023–2024: en ese momento, la escasez de oferta impulsó a los OEM a lograr una expansión de ganancias significativa y llevó a que los precios de servidores subieran considerablemente (aunque, dado que la madurez del mercado en esta ronda es mayor, es posible que este proceso no se repita completamente).
Al mismo tiempo, el nuevo aumento de los precios del alquiler de GPU también está mejorando el retorno de capital (ROIC) de Neocloud:
Por un lado, mejora los márgenes de ganancia de los activos ya desplegados
Por otro lado, alarga el ciclo económico de uso de las GPU, permitiendo que el capital genere flujos de efectivo durante más tiempo
¿Quién es el mayor beneficiario actual?
El beneficiario más directo ahora es el proveedor de cómputo que tenga las siguientes características:
· Contratos principalmente de ciclo corto (permite re-preciar rápidamente)
· Tener grandes cantidades de equipos H100 en inventario
· Capacidad de nueva producción que entra en línea a corto plazo
Los Neocloud con estructura de alquiler a corto plazo pueden liberar contratos antiguos más rápido y firmar nuevamente a precios más altos, logrando así una expansión de ganancias de forma rápida. Y además, los hiperscalers y Neocloud que fijaron con antelación la siguiente generación de cómputo (contratos multi-año) también se beneficiarán en el próximo ciclo.
Entonces, la pregunta es: ¿esta vez realmente será “diferente”?