DeepSeek-V4-Flash lança na Huawei Cloud

Em 24 de abril, o modelo DeepSeek-V4 foi oficialmente lançado e de código aberto, com suporte inicial na Huawei Cloud.
Para o DeepSeek-V4, a Huawei Cloud lançou um mecanismo de compressão de atenção em camadas, que realiza uma gestão eficiente da alocação de KVCache sob o mecanismo de atenção V4, oferecendo mais de 10 operadores de fusão de alto desempenho, como TopK, SWA e CFA, combinados com otimizações de framework como agendamento assíncrono e especulação de múltiplas etapas MTP, suportando inferência de alto desempenho com contexto nativo de 1 milhão de tokens.
Atualmente, a plataforma de modelos como serviço (MaaS) da Huawei Cloud já fornece aos desenvolvedores um serviço de Tokens que permite chamar o DeepSeek-V4-Flash API de forma simples e sem necessidade de implantação.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar