📰 【NVIDIA lanza el modelo Nemotron3 Nano Omni: puede procesar unificado video, audio, imágenes y texto, mejorando la eficiencia del razonamiento multimodal】


BlockBeats informa, el 29 de abril, NVIDIA lanzó oficialmente Nemotron 3 Nano Omni, que es un nuevo miembro de la serie Nemotron 3, integrando el razonamiento multimodal unificado en un solo modelo eficiente y de código abierto. NVIDIA afirmó que los sistemas inteligentes generalmente necesitan realizar un ciclo de percepción a acción en pantalla, documentos, audio, video y texto, pero aún dependen de cadenas de modelos fragmentadas — pilas tecnológicas separadas para visión, audio y texto. Esto aumenta el número de saltos en el razonamiento y la complejidad de la orquestación, elevando los costos de razonamiento y debilitando la coherencia del contexto entre modalidades. Nemotron 3 Nano Omni busca reemplazar esta fragmentación...
NVIDIA también lanza un nuevo modelo, integrando pilas tecnológicas fragmentadas en un solo código abierto. Suena muy bien, pero en el mundo cripto a nadie le importa, a menos que pueda ejecutar directamente DePIN o un Agente de IA. De lo contrario, solo alimenta la burbuja.👇👇👇👇👇
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado