RT Generic T1 Estudio experimental de diversos algoritmos de aprendizaje por refuerzo T2 Experimental study of some algorithms of Reinforcement Learning A1 García Carrasco, Alejandro Jesús K1 Algoritmos computacionales K1 Interacción hombre-ordenador K1 Aprendizaje automático (Inteligencia artificial) K1 Informática - Trabajos Fin de Grado K1 Grado en Ingeniería Informática - Trabajos Fin de Grado AB Los algoritmos desarrollados en este trabajo pretenden resolver mediante aprendizaje porrefuerzo tres entornos distintos (Taxi, Cartpole y MountainCar) proporcionados por elframework OpenAI Gym [1] y hacer una comparativa del rendimiento de estos algoritmos.Para ello, una vez implementados los distintos algoritmos, se ejecutarán un númerodeterminado de veces con el fin de poder evitar el factor aleatoriedad y poder hacer unacomparativa sobre las mismas condiciones.El código a desarrollar se podría dividir principalmente en dos partes, el Agente contienela mayor parte de código y es el “cerebro”, el encargado de resolver el problema y llegarencontrar una solución dado un entorno. Y una segunda parte encargada de reportar los datosdel entrenamiento del agente, tanto en forma de gráfica para ver el rendimiento, como en formade tabla para poder hacer una mejor comparativa.Para la implementación se utilizan el framework OpenAI Gym, Python 3.7 [2] así comodiversas librerías y el entorno PyCharm YR 2021 FD 2021-01-18 LK https://hdl.handle.net/10630/20718 UL https://hdl.handle.net/10630/20718 LA spa DS RIUMA. Repositorio Institucional de la Universidad de Málaga RD 19 ene 2026