RT Generic
T1 Estudio experimental de diversos algoritmos de aprendizaje por refuerzo
T2 Experimental study of some algorithms of Reinforcement Learning
A1 García Carrasco, Alejandro Jesús
K1 Algoritmos computacionales
K1 Interacción hombre-ordenador
K1 Aprendizaje automático (Inteligencia artificial)
K1 Informática - Trabajos Fin de Grado
K1 Grado en Ingeniería Informática - Trabajos Fin de Grado
AB Los algoritmos desarrollados en este trabajo pretenden resolver mediante aprendizaje porrefuerzo tres entornos distintos (Taxi, Cartpole y MountainCar) proporcionados por elframework OpenAI Gym [1] y hacer una comparativa del rendimiento de estos algoritmos.Para ello, una vez implementados los distintos algoritmos, se ejecutarán un númerodeterminado de veces con el fin de poder evitar el factor aleatoriedad y poder hacer unacomparativa sobre las mismas condiciones.El código a desarrollar se podría dividir principalmente en dos partes, el Agente contienela mayor parte de código y es el “cerebro”, el encargado de resolver el problema y llegarencontrar una solución dado un entorno. Y una segunda parte encargada de reportar los datosdel entrenamiento del agente, tanto en forma de gráfica para ver el rendimiento, como en formade tabla para poder hacer una mejor comparativa.Para la implementación se utilizan el framework OpenAI Gym, Python 3.7 [2] así comodiversas librerías y el entorno PyCharm
YR 2021
FD 2021-01-18
LK https://hdl.handle.net/10630/20718
UL https://hdl.handle.net/10630/20718
LA spa
DS RIUMA. Repositorio Institucional de la Universidad de Málaga
RD 14 may 2026