Google lança algoritmo TurboQuant: quantização KV cache de 3 bits sem perda de precisão, velocidade de inferência aumenta até 8 vezes

Notícias do Gate News, a 25 de março, o Google Research lançou o algoritmo de compressão quântica TurboQuant, que consegue comprimir o cache KV de grandes modelos de linguagem para 3 bits, reduzindo o uso de memória pelo menos 6 vezes, sem necessidade de treino ou ajuste fino, sem perder precisão do modelo. No modo de 4 bits, a velocidade de cálculo de atenção na GPU Nvidia H100 é até 8 vezes superior à linha de base de 32 bits não quantificados. A equipe de pesquisa validou o TurboQuant usando modelos Gemma e Mistral em benchmarks de contexto longo como LongBench, Needle In A Haystack e ZeroSCROLLS, alcançando desempenho ótimo em todos os testes. O algoritmo é composto por duas subferramentas: PolarQuant, que elimina o custo de memória das quantizações tradicionais por meio de transformação em coordenadas polares, e QJL, que corrige o erro residual usando apenas 1 bit. A pesquisa foi liderada por Amir Zandieh do Google Research e Vahab Mirrokni, vice-presidente e Google Fellow, em colaboração com KAIST na Coreia do Sul e a Universidade de Nova York, e será apresentada na ICLR 2026. O Google afirmou que uma das principais aplicações dessa tecnologia é resolver o gargalo do cache KV em modelos como Gemini.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

A Sequans vende 1.025 Bitcoin no 1T de 2026, reduz quase pela metade as reservas

De acordo com a BlockBeats, a fabricante francesa de chips Sequans Communications vendeu 1.025 Bitcoin no primeiro trimestre de 2026, reduzindo suas holdings de 2.139 BTC no fim de 2025 para 1.114 BTC até abril. A empresa registrou um prejuízo líquido de US$ 54,3 milhões no 1T, com prejuízos operacionais aumentando para US$ 50,5 milhões

GateNews2h atrás

Cipher Digital publica perdas líquidas de $114M Net no 1T de 2026, quase dobrando ano a ano

De acordo com o The Block, o minerador de Bitcoin Cipher Digital registrou prejuízo líquido de US$ 114 milhões no 1T de 2026, quase dobrando em relação aos US$ 39 milhões no 1T de 2025. A receita de mineração caiu para US$ 35 milhões, ante US$ 49 milhões, enquanto as participações em Bitcoin da empresa tiveram queda de valor de US$ 125 milhões para US$ 76 milhões. CEO Tyler

GateNews2h atrás

Relatórios de Estratégia: prejuízo de US$ 12,54 bilhões no 1T de 2026, mantém 818.334 Bitcoin

De acordo com a BlockBeats, a Strategy informou em 6 de maio que detinha 818.334 Bitcoin em 3 de maio de 2026, representando um aumento de 22% desde o início do ano, com rendimento em Bitcoin de 9,4%. A empresa informou receita do 1T de 2026 de US$ 124,3 milhões, alta de 11,9% na comparação anual, mas registrou um prejuízo líquido de US$ 12,54

GateNews4h atrás

A CoinShares reporta entradas de cripto de US$ 117,8 milhões na última semana, a quinta semana consecutiva de crescimento enquanto o Bitcoin dispara

De acordo com a Coinshares, os produtos de investimento em criptomoedas registraram entradas de US$ 117,8 milhões na última semana, marcando a quinta semana consecutiva de crescimento positivo. As entradas foram impulsionadas principalmente pelo Bitcoin, que teve US$ 192,1 milhões em entradas e agora acumulou US$ 4,2 bilhões em entradas totais

GateNews7h atrás

A Bullish adquire a Equiniti por US$ 4,2 bilhões para liderar a expansão de títulos tokenizados

Bullish, uma plataforma de ativos virtuais dos EUA, anunciou no dia 5 (horário local) que firmou um acordo final para adquirir a Equiniti, uma fornecedora global de agentes de transferência de valores mobiliários e serviços a acionistas, por US$ 4,2 bilhões (aproximadamente 6 trilhões de KRW), marcando sua entrada formal em sec tokenizado

CryptoFrontier8h atrás
Comentário
0/400
Sem comentários