Jensen Huang lança a plataforma Vera Rubin de 2,5 toneladas na CES 2026, determinado a conquistar a IA física

2026-03-05 22:12:18

CES 2026 acabou por testemunhar um marco histórico na indústria de IA, quando Jensen Huang, CEO da NVIDIA, apresentou um “máquina milagrosa” de 2,5 toneladas. Ao contrário dos anos anteriores, focados em placas gráficas de consumo, desta vez Jensen Huang mudou completamente de direção para sistemas de computação empresarial, anunciando a plataforma Vera Rubin – um avanço na história do desenvolvimento de GPUs da NVIDIA.

Em 48 horas, Jensen Huang participou em três grandes eventos: NVIDIA Live, seminário de tecnologia IA com Siemens e TechWorld da Lenovo. Esta presença contínua não foi por acaso – reflete a estratégia global da NVIDIA de construir um ecossistema de IA para aplicações práticas.

Vera Rubin: Um salto na arquitetura de chips da NVIDIA

A plataforma Vera Rubin, nomeada em homenagem ao famoso astrónomo, representa uma inovação radical. Pela primeira vez na história da NVIDIA, uma geração de produtos não só busca melhorias, mas redesenha completamente seis tipos diferentes de chips ao mesmo tempo, que já entrou em produção em massa.

A razão desta mudança é clara: a Lei de Moore desacelerou. A abordagem tradicional já não acompanha o ritmo de crescimento de 10 vezes por ano dos modelos de IA. Jensen Huang e a NVIDIA optaram pelo caminho da “designação coordenada extrema” – inovação simultânea em todos os níveis.

Os seis chips incluem:

Vera CPU: 88 núcleos Olympus personalizados, memória de sistema de 1,5 TB (triplicando a geração Grace), suportando 176 threads com largura de banda NVLink C2C de 1,8 TB/s
Rubin GPU: Poder de inferência NVFP4 de 50 PFLOPS (cinco vezes maior que Blackwell), com engine Transformer de terceira geração
ConnectX-9: Rede Ethernet de 800 Gb/s com RDMA programável
BlueField-4 DPU: Processador dedicado com 64 núcleos Grace CPU, com 150TB de memória de contexto
NVLink-6 Switch: Conecta 72 GPUs como uma unidade unificada
Spectrum-6: Tecnologia óptica com 512 canais, cada um a 200Gbps

Desempenho que supera as expectativas

O sistema Vera Rubin NVL72 apresenta números impressionantes. Em tarefas de inferência, o poder de cálculo atinge 3,6 EFLOPS, cinco vezes maior que Blackwell. Para treino, o desempenho chega a 2,5 EFLOPS, um aumento de 3,5 vezes.

A capacidade de memória LPDDR5X chega a 54TB (triplicando a geração anterior), enquanto a memória HBM4 atinge 1,6 PB/s, quase três vezes mais rápida. O mais impressionante é que, apesar do aumento de desempenho, o número de transistores só cresceu 1,7 vezes, atingindo 220 trilhões.

Mesmo do ponto de vista de custos, Vera Rubin demonstra força. Para treinar um modelo de 100 trilhões de parâmetros, necessita de apenas um quarto dos sistemas Blackwell, com o custo de criar um Token sendo um décimo. Quanto à eficiência energética, a taxa de throughput (tokens de IA concluídos por watt e por dólar) aumentou dez vezes – para centros de dados de gigawatt, avaliado em 50 bilhões de dólares, isso significa dobrar a receita.

Tecnologia de rede Spectrum-X: “Grátis” 5 bilhões de dólares

Jensen Huang calculou precisamente: Spectrum-X, a plataforma de rede Ethernet dedicada à IA generativa, pode aumentar o throughput em 25%, economizando cerca de 5 bilhões de dólares em centros de dados de gigawatt. Ele afirmou com confiança: “Este sistema de rede é quase gratuito.”

Esta tecnologia usa o processo COOP da TSMC, integrando silício fotónico, permitindo que GPUs e BlueField-4 se estendam por dezenas de milhares de dispositivos, funcionando como uma única memória.

Resolvendo o “problema de cauda longa” da memória de contexto

Um grande desafio na IA é a KV Cache (memória de chave-valor), o “memória de tarefas” da IA. Quando as conversas são longas e os modelos grandes, a memória HBM fica sobrecarregada.

Vera Rubin resolve isso implantando BlueField-4 em cada nó de servidor. Cada nó possui 4 BlueField-4, cada um com 150TB de memória de contexto, oferecendo 16TB por GPU sem reduzir a velocidade de transmissão (mantendo 200Gbps).

Segurança reforçada

Vera Rubin suporta Confidential Computing – todos os dados são criptografados durante transmissão, armazenamento e processamento, incluindo PCIe, NVLink e comunicação CPU-GPU. As empresas podem implementar modelos com tranquilidade, sem risco de vazamento de dados.

Código aberto e agentes: tendências principais

Jensen Huang reforçou a importância do software de código aberto. Destacou especialmente o DeepSeek V1 – o primeiro sistema de inferência de código aberto, que surpreendeu o mundo. Em seus slides, modelos como Kimi k2 e DeepSeek V3.2 aparecem como os melhores na área.

Embora os modelos de código aberto atuais possam estar seis meses atrás dos líderes, novos modelos surgem a cada seis meses. Essa velocidade de evolução é a razão pela qual startups, grandes empresas e pesquisadores não querem perder – nem mesmo a NVIDIA.

A NVIDIA constrói um ecossistema de código aberto que inclui biologia, IA física, modelos de agentes, robótica e condução autônoma. Desenvolvem também modelos avançados como La Proteina (síntese de proteínas) e OpenFold 3, além do supercomputador DGX Cloud, avaliado em vários bilhões de dólares.

IA física: conquistando o mundo real

Se os grandes modelos de linguagem resolvem o questão do “mundo digital”, a próxima ambição de Jensen Huang é conquistar o “mundo físico”.

Ele propõe uma arquitetura de “três computadores centrais” para Physical AI: o computador de treino (construído com GPUs), o de inferência (pequeno cérebro na borda de robôs ou carros), e o de simulação (Omniverse e Cosmos).

Alpamayo: sistema de condução autônoma com capacidade de inferência

Com base nesta arquitetura, Jensen Huang anunciou oficialmente o Alpamayo – o primeiro modelo de condução autônoma do mundo com capacidade real de raciocínio e inferência.

Ao contrário dos veículos autônomos tradicionais, o Alpamayo não apenas executa comandos rígidos. Quando enfrenta situações de trânsito complexas e inéditas, consegue raciocinar como um motorista humano: “Ele dirá o que vai fazer a seguir e por quê.”

O Mercedes CLA equipado com tecnologia Alpamayo será lançado oficialmente nos EUA no primeiro trimestre de 2026, seguido pelos mercados europeu e asiático. Este carro foi avaliado pela NCAP como o mais seguro do mundo, graças ao seu design de “pilha de segurança dupla” da NVIDIA – quando o modelo de IA não está confiante, o sistema troca para modo de segurança tradicional.

Estratégia de robótica: de Boston Dynamics às fábricas

Todos os robôs terão computadores mini Jetson, treinados no Isaac Simulator na plataforma Omniverse. A NVIDIA está integrando essa tecnologia no ecossistema industrial, incluindo Synopsys, Cadence e Siemens.

Jensen Huang convidou ao palco robôs humanoides, robôs de quatro patas de Boston Dynamics e Agility, além de robôs Disney fofos. Mas destacou um ponto crucial: “O maior robô de todos é, na verdade, a fábrica.”

No futuro, o design de chips, o design de sistemas, a simulação de fábricas – tudo será acelerado pela IA física. Jensen Huang até disse aos engenheiros de robótica: “Vocês serão projetados no computador, fabricados no computador, e até testados e validados no computador antes de enfrentarem a gravidade de verdade.”

Estratégia global de Jensen Huang

Num contexto de debates sobre a bolha da IA, Jensen Huang parece precisar provar que a IA realmente faz algo útil. Além de anunciar a força da plataforma Vera Rubin, ele investe bastante em aplicações e software.

De chips para o mundo virtual, a NVIDIA agora foca em Physical AI – condução autônoma, robôs humanoides – para entrar no mundo físico real. Como Jensen Huang afirmou: “Só quando a batalha começar, as armas poderão continuar a ser vendidas.”

CES 2026 mostrou que, com Jensen Huang ao leme, a NVIDIA não vende apenas chips – constrói o futuro da IA física.

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.