Google DeepMind ha presentado un nuevo modelo base para robots, Gemini Robotics ER 1.6, donde ER representa Embodied Reasoning (razonamiento encarnado). Este modelo alcanza el mejor nivel actual (SOTA) en razonamiento visual y espacial, y ya está disponible mediante la Gemini API. Logan Kilpatrick, responsable de relaciones con desarrolladores de Google AI, publicó esta noticia en redes sociales. (Fuente)
¿Qué es el Embodied Reasoning?
Embodied Reasoning se refiere a la capacidad de los modelos de IA para comprender y razonar sobre el mundo físico. A diferencia de los modelos tradicionales de lenguaje, los modelos de razonamiento encarnado necesitan manejar objetos, posiciones en el espacio tridimensional, formas, materiales y relaciones de interacción física. Gemini Robotics ER 1.6 está optimizado específicamente para este tipo de tareas, permitiendo que los robots comprendan con mayor precisión el entorno y tomen decisiones adecuadas de acción.
Capacidades principales
Las principales ventajas de Gemini Robotics ER 1.6 se concentran en dos aspectos:
Capacidad Explicación Razonamiento visual Puede identificar objetos a partir de imágenes y videos, comprender la estructura de la escena y tomar decisiones en función de ello Razonamiento espacial Comprender la posición relativa, la distancia y la dirección de los objetos en el espacio tridimensional, con soporte para una planificación de operaciones compleja
La combinación de estas dos capacidades permite a los robots manejar tareas del mundo real más complejas. Por ejemplo, en entornos de almacén, el robot necesita identificar simultáneamente objetos de diferentes formas y calcular el mejor ángulo de agarre y la posición de colocación; este es precisamente el tipo de escenario en el que destaca Gemini Robotics ER 1.6.
Uso mediante Gemini API
A diferencia de muchos modelos de robots del pasado que solo se quedaban en la fase de artículos, Gemini Robotics ER 1.6 ya ofrece acceso a través de Gemini API. Esto significa que los desarrolladores y los fabricantes de hardware pueden integrar directamente este modelo en sus propios sistemas de robots, sin necesidad de entrenar el modelo desde cero.
La apertura de la API también reduce el umbral de desarrollo de la IA para robots. Antes, desarrollar un sistema de robots con capacidades de razonamiento visual y espacial requería una gran cantidad de recolección de datos y trabajo de entrenamiento de modelos. Ahora, los desarrolladores pueden centrarse en el desarrollo del diseño de hardware y en los escenarios de aplicación, dejando las capacidades de razonamiento subyacentes a Gemini Robotics ER 1.6.
Diseño de la IA robótica de Google
Gemini Robotics ER 1.6 es el último logro de Google DeepMind en el campo de la robótica. Desde el RT-2 de los inicios hasta la serie Gemini Robotics de hoy, Google continúa extendiendo las capacidades de los grandes modelos de lenguaje a la interacción con el mundo físico. La versión ER 1.6 mejora aún más la precisión del razonamiento sobre la base de las generaciones anteriores, mostrando un rendimiento especialmente excelente en escenarios que requieren operaciones finas.
A medida que la industria de la robótica entra en una nueva etapa de crecimiento, los modelos base con capacidades sólidas de razonamiento visual y espacial se convertirán en infraestructura clave. Para saber más sobre el desarrollo del ecosistema Gemini, puedes consultar la guía completa de Gemini.
Este artículo Google presenta Gemini Robotics ER 1.6: modelo SOTA para robots, experto en razonamiento visual y espacial apareció por primera vez en Cadena Noticias ABMedia.
Artículos relacionados
Realidad de los agentes de IA en Silicon Valley: se desperdician muchos tokens, la integración de sistemas está «extremadamente desordenada», la predicción de Huang Renxun sobre «el próximo ChatGPT» aún debe verificarse
La IA se devora el 80% del capital global de venture, Q1 2026 se lleva 240 mil millones de dólares: ¿cómo responden los actores de la industria cripto a la reasignación de capital?
La policía de Hong Kong advierte de la estafa cripto de "trading cuantitativo con IA"; una mujer pierde 7,7 millones de HKD
Hong Kong anunciará mañana la sexta tanda de la lista de empresas clave
El robot Lightning de Honor gana la Media Maratón de Robots Humanoides de Pekín 2026 con una marca de 50:26
La acción de Meta sube 1.73% mientras la empresa planea un recorte de 8,000 empleos a partir del 20 de mayo