El objetivo de este proyecto consiste en la implementación de un algoritmo de
aprendizaje por refuerzo para la resolución de un problema de seguimiento de paredes en
un entorno, en un robot LEGO con pocos recursos hardware (un sensor de distancia lateral
y un giroscopio).
Se ha realizado un estudio teórico sobre el aprendizaje por refuerzo para dar un
contexto al algoritmo usado, en concreto SARSA. Para ello, se han hecho varias versiones
de este que cambian en las técnicas de exploración utilizadas y la variación de parámetros
dentro del aprendizaje.
Finalmente se muestran los resultados obtenidos y un análisis y comparación de las
técnicas implementadas. Este análisis de datos proporcionará información para entender
cómo se comportan este tipo de implementaciones y la capacidad de aprendizaje en este
tipo de problema.