Google lanza un nuevo modelo Gemini que puede funcionar con robots
Google DeepMind ha lanzado una nueva variante de su modelo Gemini, llamada Gemini Robotics On‑Device, que permite ejecutar capacidades de visión‑lenguaje‑acción directamente en el dispositivo, es decir, en el propio robot sin depender de la nube, lo que reduce latencias y mejora la privacidad. Aunque es ligeramente menos precisa que la versión híbrida que combina nube y local, Gemini On‑Device es sorprendentemente robusta en tareas comunes como atar cordones o doblar ropa, y puede personalizarse con entre 50 y 100 demostraciones.

Este avance es parte de una familia más amplia de modelos Gemini Robotics, incluyendo Gemini Robotics-ER, que destaca en razonamiento espaciotemporal y puede generar código para maniobras complejas. Google está probando estas tecnologías con socios como Apptronik, Boston Dynamics y Agility Robotics, y ofrece kits de desarrollo y acceso a un programa de testers confiables. El objetivo es acelerar la adopción de robots que entiendan instrucciones en lenguaje natural y actúen de forma ágil y segura, incluso en entornos sin conectividad.
Vía – Techcrunch
