Gripper aprende ... a través de prueba y error

Dec 26, 2019

Inspirado en la mano humana, el LearningGripper tiene cuatro dedos. Con la ayuda del software de aprendizaje automático, esta pinza puede dominar una acción compleja como recoger y orientar un artículo. Las posiciones básicas de los dedos y la función de retroalimentación del entorno deben definirse de antemano; la pinza aprende todas las demás secuencias de movimiento por ensayo y error.

La tarea de LearningGripper, como se ilustra, era girar la pelota hasta que el logotipo esté en la parte superior. Al principio, la pinza movió la pelota al azar. Un sensor de posición en la pelota proporcionó información sobre qué tan lejos estaba el logotipo de la "palma" de la pinza. El LearningGripper recibió una recompensa basada en un sistema de puntos; los puntos se procesan en el software de aprendizaje automático. Con el tiempo, el software desarrolló una estrategia de movimiento y la pinza aprendió qué acción tomar en un punto en particular. Cambia sus movimientos para recibir la mayor cantidad de comentarios positivos posible y finalmente encuentra una solución confiable para su tarea. Si la estrategia de una pinza se transfiere a otra, la segunda pinza la usa como base de conocimiento para aprender su propia estrategia de manera más eficiente.

LearningGripper demuestra cómo los sistemas en el futuro podrán resolver tareas complejas de forma autónoma sin una programación compleja. Los sistemas de autoaprendizaje como el LearningGripper se pueden instalar en una línea de producción y luego se les permite optimizar su comportamiento de forma independiente