Home Mundo El modelo de IA de robótica Gemini de Google llega al mundo...

El modelo de IA de robótica Gemini de Google llega al mundo físico

4
0

En cuentos de ciencia ficción, la inteligencia artificial a menudo alimenta todo tipo de robots inteligentes, capaces y ocasionalmente homicidas. Una limitación reveladora de la mejor IA de hoy es que, por ahora, permanece atrapada directamente dentro de la ventana de chat.

Google Deepmind señaló un plan para cambiar que hoy, presumiblemente menos la parte homicida, anunciando una nueva versión de su modelo de IA Géminis que fusiona el lenguaje, la visión y la acción física para impulsar una gama de robots más capaces, adaptativos y potencialmente útiles.

En una serie de videos de demostración, la compañía mostró varios robots equipados con el nuevo modelo, llamado Gemini Robotics, manipulando elementos en respuesta a los comandos hablados: los brazos de robot se pliegan el papel, la mano sobre las verduras, colocan suavemente un par de vasos en un caso y complete otras tareas. Los robots confían en el nuevo modelo para conectar elementos que son visibles con posibles acciones para hacer lo que se les dice. El modelo está entrenado de una manera que permite que el comportamiento se generalice en hardware muy diferente.

Google Deepmind también anunció una versión de su modelo llamado Gemini Robotics-Er (para razonamiento encarnado), que tiene una comprensión visual y espacial. La idea es que otros investigadores de robots usen este modelo para entrenar sus propios modelos para controlar las acciones de los robots.

En una demostración de video, los investigadores de Google Deepmind usaron el modelo para controlar un robot humanoide llamado Apolo, desde la inicio Apptronik. El robot conversa con un humano y mueve letras alrededor de una mesa cuando se le indica.

“Hemos podido llevar la comprensión mundial, la comprensión de concepto general, de Géminis 2.0 a la robótica”, dijo Kanishka Rao, investigadora de robótica en Google Deepmind que dirigió el trabajo, en una sesión informativa antes del anuncio de hoy.

Google Deepmind dice que el nuevo modelo puede controlar diferentes robots con éxito en cientos de escenarios específicos que no se incluyeron previamente en su entrenamiento. “Una vez que el modelo de robot tiene una comprensión de concepto general, se vuelve mucho más general y útil”, dijo Rao.

Los avances que dieron lugar a poderosos chatbots, incluidos los chatgpt de OpenAi y Géminis de Google, en los últimos años han aumentado la esperanza de una revolución similar en la robótica, pero quedan grandes obstáculos.

Fuente