El objetivo de este proyecto consiste en la implementación de un algoritmo de Aprendizaje
por Refuerzo (AR) para un robot formado por una plataforma móvil y un brazo robótico,
para realizar una comparación con otros modelos y con una programación explícita. Además,
buscábamos la puesta a punto de una plataforma de experimentación, ya que el AR no se ha
utilizado todavía en el brazo manipulador de dicho robot. Para ello, hemos utilizado el framework
de desarrollo robótico Robot Operating System (ROS), con el lenguaje de programación
C++.
En concreto, hemos implementado el algoritmo de AR Q-Learning, mostrando ventajas
sobre la programación explícita. La principal ventaja que aporta este algoritmo es la amplitud
de situaciones abarcadas por el robot sin tener que tenerlas en cuenta en la implementación.
También hemos puesto a punto una plataforma de experimentación con el simulador Gazebo
y la del robot real (aunque finalmente solo se ha trabajado con la simulada, para no
dañar el robot real durante el proceso de aprendizaje), así como ajustado los parámetros del
algoritmo y realizado experimentos para un correcto aprendizaje.