Aprendizaje por refuerzo en vivo para robots móviles: mejoras de la autonomía y la autoadaptación

Asensio Huonder, Santiago

Aprendizaje por refuerzo en vivo para robots móviles: mejoras de la autonomía y la autoadaptación

dc.centro	Escuela de Ingenierías Industriales	es_ES
dc.contributor.advisor	Arévalo-Espejo, Vicente Manuel
dc.contributor.advisor	Fernández-Madrigal, Juan Antonio
dc.contributor.author	Asensio Huonder, Santiago
dc.date.accessioned	2025-01-21T20:16:05Z
dc.date.available	2025-01-21T20:16:05Z
dc.date.issued	2023-09
dc.departamento	Ingeniería de Sistemas y Automática
dc.description.abstract	El presente trabajo se centra en la explicación de mejoras implementables para el aprendizaje por refuerzo en vivo en robots móviles, como el aumento de la autonomía del robot para retornar a estados seguros tras un resultado erróneo en el aprendizaje, la adaptación a cambios en la tarea de aprendizaje y ahorro de batería; todo ello se traduce en un menor tiempo de operación supervisada del robot, uno de los problemas que presenta el aprendizaje por refuerzo en vivo. Para ello se diseña una tarea de aprendizaje consistente en la navegación de un robot móvil (Turtlebot2) hasta un objetivo evitando choques con obstáculos cercanos. El trabajo hace uso de varios algoritmos bien conocidos y propone una versión modificada de Q-learning y True On-Line SARSA mediante la inclusión de reflejos que se desencadenan automáticamente ante la recepción de ciertos estímulos sensoriales en cualquier paso de ejecución de los algoritmos. Se ha realizado una fase inicial de experimentación en un entorno de simulación muy similar al entorno real elegido para llevar a cabo el aprendizaje en vivo en pos de reducir el coste temporal que supone la obtención de una parametrización de los algoritmos en caso de llevarse a cabo mediante un robot físico, al mismo tiempo que se evitan daños en el hardware robótico. Posteriormente, se ha llevado a cabo la fase de experimentación en vivo y se ha completado, de forma adicional, un aprendizaje híbrido (aprendizaje en vivo a partir de un aprendizaje en simulación previo) basado en el algoritmo True On-Line SARSA. El resultado final de este trabajo es el desarrollo de un método de aprendizaje en vivo que mejora la seguridad del robot en relación con las colisiones con obstáculos y proporciona adaptabilidad a cambios en la tarea. Requiere una intervención humana mínima, aumenta el tiempo de entrenamiento gracias a los reflejos incluidos y mejora el ahorro de energía.	es_ES
dc.identifier.uri	https://hdl.handle.net/10630/36688
dc.language.iso	spa	es_ES
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 Internacional	*
dc.rights.accessRights	open access	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Robótica - Trabajos fin de grado	es_ES
dc.subject	MATLAB - Trabajos fin de grado	es_ES
dc.subject.other	Aprendizaje por refuerzo en vivo	es_ES
dc.subject.other	ROS	es_ES
dc.subject.other	Q-learning	es_ES
dc.subject.other	True on-line SARSA	es_ES
dc.title	Aprendizaje por refuerzo en vivo para robots móviles: mejoras de la autonomía y la autoadaptación	es_ES
dc.title.alternative	Live reinforcement learning for mobile robots: improvements in autonomy and self-adaption	es_ES
dc.type	bachelor thesis	es_ES
dspace.entity.type	Publication
relation.isAdvisorOfPublication	cf1946c0-b96f-4a4a-b8da-88a0ee27182c
relation.isAdvisorOfPublication	91c6945f-bd8f-4027-80dd-8708bfa9e68c
relation.isAdvisorOfPublication.latestForDiscovery	cf1946c0-b96f-4a4a-b8da-88a0ee27182c

Files

Original bundle

Now showing 1 - 1 of 1

Name:: tfg_Asensio_Huonder_Santiago-6083.pdf ok.pdf
Size:: 4.82 MB
Format:: Adobe Portable Document Format
Description:

Download

Collections

Trabajos Fin de Grado