Aprendizaje por refuerzo del balanceo de un robot de dos ruedas con microcontrolador de bajas prestaciones

dc.centroEscuela de Ingenierías Industriales
dc.contributor.advisorFernández-Madrigal, Juan Antonio
dc.contributor.advisorCruz-Martín, Ana María
dc.contributor.authorLucena Alonso, Eduardo
dc.date.accessioned2026-04-16T07:00:19Z
dc.date.issued2025-06
dc.departamentoIngeniería de Sistemas y Automática
dc.description.abstractEn este Trabajo Fin de Máster se ha desarrollado un sistema de control por aprendizaje por refuerzo para lograr el equilibrio autónomo de un robot de dos ruedas. El sistema se implementa sobre el robot Balboa 32U4 de Pololu, que cuenta con un microcontrolador de bajas prestaciones, sensores inerciales y motores de corriente continua como actuadores. El proyecto aplica el algoritmo Q-Learning para que el robot aprenda a mantenerse en equilibrio sin modelo matemático ni controladores clásicos como el PID. Se han evaluado distintas definiciones del espacio de estados, a partir de los sensores inerciales integrados, junto con un conjunto discreto de acciones que ajustan la velocidad de los motores. Una de las características clave del trabajo es que el entrenamiento se realiza íntegramente en el sistema real, sin simuladores. El aprendizaje tiene lugar en tiempo real sobre el microcontrolador, por lo que se han analizado en profundidad las limitaciones del hardware y las condiciones físicas del entorno. Para el desarrollo e implementación se ha utilizado el entorno de programación Arduino, compatible con el microcontrolador ATmega32U4 del robot. Esta compatibilidad, junto con el uso de librerías oficiales del fabricante, ha facilitado el acceso al hardware y ha condicionado la metodología experimental del proyecto.
dc.description.abstractThis Master Thesis presents the development of a reinforcement learning-based control system designed to achieve autonomous balancing of a two-wheeled robot. The system is implemented on the Pololu Balboa 32U4 robot, which integrates a low-performance microcontroller, inertial sensors, and DC motors as actuators. The project applies the Q-Learning algorithm, enabling the robot to learn how to maintain balance without relying on a mathematical model or classical control strategies such as PID. Various definitions of the state space have been evaluated, using data from the onboard inertial sensors, along with a discrete set of actions corresponding to different motor speeds. A key feature of this work is that training is carried out entirely on the physical system, without the use of simulators. The learning process runs in real time on the microcontroller, thus we have copied with the hardware limitations and the challenges of the physical environment. The development and implementation have been deployed on the Arduino programming environment, which is compatible with the robot’s ATmega32U4 microcontroller. This compatibility, along with the use of official libraries provided by the manufacturer, has facilitated access to the hardware and shaped the experimental methodology followed throughout the project.
dc.identifier.urihttps://hdl.handle.net/10630/46388
dc.language.isospa
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectAprendizaje automático (Inteligencia artificial) - Trabajos fin de máster
dc.subjectRobots autónomos - Trabajos fin de máster
dc.subjectMicrocontroladores - Trabajos fin de máster
dc.subject.otherAprendizaje por refuerzo
dc.subject.otherQ-learning
dc.subject.otherRobot balanceador
dc.subject.otherEntrenamiento en tiempo real
dc.subject.otherArduino
dc.subject.otherRobot de dos ruedas
dc.subject.otherControl de equilibrio
dc.subject.otherReinforcement learning
dc.subject.otherBalancing robot
dc.subject.otherReal-time training
dc.subject.otherTwo-wheeled robot
dc.subject.otherBalance control
dc.titleAprendizaje por refuerzo del balanceo de un robot de dos ruedas con microcontrolador de bajas prestaciones
dc.typemaster thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication91c6945f-bd8f-4027-80dd-8708bfa9e68c
relation.isAdvisorOfPublication20a90df2-406e-4323-bc8a-ebce8cd01d8d
relation.isAdvisorOfPublication.latestForDiscovery91c6945f-bd8f-4027-80dd-8708bfa9e68c

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
tfm_Lucena_Alonso_Eduardo-549.pdf
Size:
3.14 MB
Format:
Adobe Portable Document Format