2026-05-27T23:27:06Zhttps://riuma.uma.es/rest/oai/request

oai:riuma.uma.es:10630/207182026-02-03T10:26:35Zcom_10630_1685col_10630_38055

García Carrasco, Alejandro Jesús 2021-01-18T07:37:37Z 2021-01-18T07:37:37Z 2021-01-18 https://hdl.handle.net/10630/20718 Los algoritmos desarrollados en este trabajo pretenden resolver mediante aprendizaje por refuerzo tres entornos distintos (Taxi, Cartpole y MountainCar) proporcionados por el framework OpenAI Gym [1] y hacer una comparativa del rendimiento de estos algoritmos. Para ello, una vez implementados los distintos algoritmos, se ejecutarán un número determinado de veces con el fin de poder evitar el factor aleatoriedad y poder hacer una comparativa sobre las mismas condiciones. El código a desarrollar se podría dividir principalmente en dos partes, el Agente contiene la mayor parte de código y es el “cerebro”, el encargado de resolver el problema y llegar encontrar una solución dado un entorno. Y una segunda parte encargada de reportar los datos del entrenamiento del agente, tanto en forma de gráfica para ver el rendimiento, como en forma de tabla para poder hacer una mejor comparativa. Para la implementación se utilizan el framework OpenAI Gym, Python 3.7 [2] así como diversas librerías y el entorno PyCharm spa http://creativecommons.org/licenses/by-nc-nd/4.0/ open access Attribution-NonCommercial-NoDerivatives 4.0 Internacional Algoritmos computacionales Interacción hombre-ordenador Aprendizaje automático (Inteligencia artificial) Informática - Trabajos Fin de Grado Grado en Ingeniería Informática - Trabajos Fin de Grado Estudio experimental de diversos algoritmos de aprendizaje por refuerzo bachelor thesis