Aprendizaje por refuerzo en vivo para robots móviles

Santiago Asensio Huonder; Vicente Arévalo Espejo; Ana Cruz Martín; Juan Antonio Fernández Madrigal

Journal ArticleOPEN ACCESS

Aprendizaje por refuerzo en vivo para robots móviles

Asensio Huonder S
Arévalo Espejo V
Cruz Martín A
et al.

Jornadas de Automática (2024) (45)

DOI: 10.17979/ja-cea.2024.45.10898

N/ACitations

6Readers

Abstract

En este trabajo se propone una arquitectura de reflejos ante estímulos sensoriales para que el aprendizaje por refuerzo en vivo para robots móviles mejore su adaptación a cambios en la tarea, aumente su autonomía para regresar a estados seguros tras errores y reduzca, en general, la supervisión por parte del humano. El trabajo se ha enfocado en la navegación de un robot móvil con evitación de obstáculos y hemos utilizado una versión modificada de los algoritmos de aprendizaje por refuerzo Q-learning y True On-Line SARSA (lambda). Se ha estudiado adicionalmente un aprendizaje que traslada lo aprendido en simulación al aprendizaje en vivo, llamado aprendizaje híbrido. Los resultados muestran que nuestra arquitectura mejora la seguridad del robot y su adaptabilidad a cambios en la tarea, minimiza la intervención humana y extiende el tiempo de entrenamiento sin supervisión.

Cite

CITATION STYLE

APA

Asensio Huonder, S., Arévalo Espejo, V., Cruz Martín, A., & Fernández Madrigal, J. A. (2024). Aprendizaje por refuerzo en vivo para robots móviles. Jornadas de Automática, (45). https://doi.org/10.17979/ja-cea.2024.45.10898

Aprendizaje por refuerzo en vivo para robots móviles

Abstract

Cite

Register to see more suggestions