Los robots están aprendiendo tareas complejas con solo ver cómo los humanos las hacen

Los robots están aprendiendo tareas complejas con solo ver cómo los humanos las hacen


Los robots industriales solían ser grandes, difíciles de manejar y peligrosos, pero los nuevos robots «seguros para humanos» son ahora comunes en las líneas automovilísticas, trabajando junto a las personas. Sin embargo, estos robots son compañeros de trabajo incómodos; conviven con nosotros pero no colaboran de manera significativa. A menudo, los robots necesitan que se les diga explícitamente cómo ser útiles o cuándo mantenerse fuera del camino — cosas que los compañeros de equipo humanos parecen aprender intuitivamente. Un buen aprendiz humano es un observador entusiasta, inferyendo reglas y costumbres tácitas, observando cómo funcionan los demás, y luego generalizando este conocimiento para nuevas situaciones. Somos capaces de lograr esto en parte porque la mente humana es capaz de procesar información muy compleja de manera muy eficiente. Este tipo de inferencia ha sido tradicionalmente difícil de realizar para las máquinas.

Investigaciones recientes indican que estamos en un punto de inflexión en cómo los robots observan y procesan los datos y, por lo tanto, cómo trabajan con las personas.

Los robotizadores están empezando a hacer ingeniería inversa de la mente humana traduciendo los modelos cognitivos que los humanos usan intuitivamente en modelos computacionales que las máquinas pueden usar. Con este enfoque, los robots y los humanos que trabajan en parejas han sido capaces de realizar tareas complejas igual o mejor que los equipos humanos.

Las implicaciones son enormes. Imagine un robot que participe como miembro del equipo en la planificación de un despliegue de respuesta de emergencia. El robot escucha la conversación del equipo humano para aprender automáticamente el plan de juego. Tal robot no tendría que esperar hasta después de la reunión para que se le diga qué hacer — inmediatamente podría tomar la iniciativa para llevar a cabo tareas que ayudan al equipo a alcanzar sus objetivos. Esta habilidad básica se espera de los humanos que trabajan en la respuesta de emergencia y otras situaciones críticas en el tiempo, pero es transformadora para los robots.

El reto es que el diálogo colaborativo es complejo: se desarrolla en ciclos, los acuerdos son fluidos y las propuestas a menudo se comunican y aceptan implícita o pasivamente. El equipo puede considerar y rechazar muchas opciones y revisar el plan muchas veces. Es difícil para una máquina inferir nuestros planes de manera eficiente; el robot puede tener que considerar y explorar billones de planes posibles incluso para un escenario simple con sólo unos pocos miembros del equipo y algunos objetivos.

Por el contrario, los miembros del equipo humano no necesitan horas después de una reunión para averiguar lo que se acordó. Por lo general, podemos salir de las reuniones con una imagen clara del plan. Hacemos esto empleando un andamio mental para armar la conversación. Cada miembro del equipo está motivado por los mismos objetivos y tiene el mismo conocimiento básico de las capacidades del equipo, y cada sugerencia que hace un miembro del equipo se considera en contexto.

Mi grupo de investigación, el Grupo de Robotics Interactive del MIT, aprovechó esta visión para diseñar un modelo computacional que reproduce la estructura inherente en la forma en que un equipo discute y negocia un plan. Le dimos a la máquina un poco de información, por ejemplo, el número de miembros del equipo, sus capacidades, los objetivos del equipo e información sobre las tareas. La máquina utilizó esta información para inferir el plan final uniendo el plan más probable que fuera válido, dado el contexto del problema. Por ejemplo, si se le dijo a la máquina que el equipo tiene cuatro miembros pero ocho tareas se deben realizar simultáneamente, podría inferir que los compañeros de equipo van a realizar varias tareas o que el plan debe revisarse en torno a las tareas que se realizan en secuencia. El enfoque resultó satisfactorio para la planificación de la respuesta de emergencia. Los equipos de personas tenían la tarea de formular un plan de respuesta de equipo complejo, y la máquina fue capaz de inferir el plan final con hasta un 86% de precisión, en promedio.

El mismo enfoque también permite a los robots aprender planes complejos simplemente observándonos tomar decisiones en nuestros trabajos. De hecho, nuestros estudios más recientes muestran que los robots pueden aprender las complejas estrategias de toma de decisiones de expertos que realizan tareas del mundo real en defensa y salud.

La clave era diseñar la estructura de nuestro modelo para hacer un uso muy eficiente de cada observación del experto humano. Cada decisión que toma un experto proporciona una gran cantidad de información, revelando cómo se priorizó esa opción en particular sobre otras opciones. Diseñamos un modelo para aprovechar esta estructura lógica transformando los datos observados en clasificaciones pares de opciones. Este enfoque mejoró sustancialmente la capacidad de la máquina para aprender de manera eficiente un modelo de alta calidad de la estrategia de toma de decisiones del experto humano.

Esta técnica se aplicó con éxito en dos configuraciones.

En el primero, los expertos de dominio jugaron un juego serio en el que los barcos fueron defendidos de un conjunto de amenazas de misiles. Una máquina puede necesitar días o semanas para resolver bien este tipo de problemas, pero los expertos humanos son capaces de tomar buenas decisiones muy rápidamente. Utilizando nuestro modelo computacional estructurado, la máquina fue capaz de aprender estrategias efectivas con sólo 16 demostraciones de expertos humanos. De hecho, la máquina fue capaz de superar el puntaje promedio de expertos en muchas de las tareas de defensa contra misiles.

En el segundo contexto, una máquina aprendió estrategias para coordinar la atención al paciente en una unidad hospitalaria por parte de profesionales de la salud. Específicamente, aprendió estrategias de toma de decisiones para dónde y cuándo trasladar a los pacientes entre los tipos de habitación y cómo asignar enfermeras en condiciones variables de carga de trabajo. La tecnología fue evaluada a través de experimentos en los que un robot proporcionó apoyo de decisión a enfermeros y médicos mientras tomaban decisiones sobre la atención al paciente en una simulación de alta fidelidad. Las enfermeras y los médicos cumplieron con las recomendaciones del robot en un tasa del 90%, una fuerte indicación de que el robot había aprendido estrategias de alta calidad para la tarea.

Estos avances recientes indican que existe un enorme potencial para que las máquinas colaboren con nosotros de maneras ricas que amplíen y mejoren la capacidad humana en muchos sectores de la economía. Los robots del futuro no tendrán que sentarse al margen o esperar a que se les diga qué hacer. Los robots estarán verdaderamente a nuestro servicio, listos, dispuestos y capaces de aprender mirándonos. Trabajarán hombro a hombro en las líneas de montaje, en los hospitales y en las primeras líneas de respuesta de emergencia. Los robots incómodos del pasado serán reemplazados por miembros valiosos del equipo.

Escrito por Julie Shah