Comparación de algoritmos de aprendizaje por refuerzo  basados en Q-Learning

Caponera De Cobellis, Romolo Rosario

Preguntas frecuentes Manual de uso Derechos de autor Contacto/Sugerencias

dc.contributor.advisor	Pérez-de-la-Cruz-Molina, José Luis
dc.contributor.author	Caponera De Cobellis, Romolo Rosario
dc.contributor.other	Lenguajes y Ciencias de la Computación	es_ES
dc.date.accessioned	2021-12-09T11:11:54Z
dc.date.available	2021-12-09T11:11:54Z
dc.date.issued	2021-06
dc.identifier.uri	https://hdl.handle.net/10630/23354
dc.description.abstract	El presente Trabajo de Fin de Grado se centra en el Aprendizaje por Refuerzo, y más concretamente en el algoritmo QLearning[1], comparando tres de sus variantes más populares (Épsilon-greedy [2], SoftMax [3] y Upper Confidence Bound [4]), en el entorno FrozenLake [5] ofertado por el framework OpenAI Gym[6]. La finalidad del proyecto no es únicamente la de mostrar las diferencias, tanto en implementación como en rendimiento, que se puedan evidenciar entre los algoritmos, sino ofrecer una aplicación que permita al usuario final inspeccionar los procesos de entrenamiento y resolución del problema, tomando sus propias mediciones, e incluso experimentar variando los parámetros de los algoritmos, mediante una interfaz intuitiva y visual. Se ha desarrollado un software que pretende suplir estas necesidades, ofreciendo la posibilidad de observar el proceso de entrenamiento de manera visual e intuitiva, y la posibilidad de ver, a través de varios gráficos, métricas sobre el entrenamiento que permitirán discernir la efectividad y calidad del mismo. La implementación del software se ha realizado siguiendo buenas prácticas y patrones de diseño que permiten a cualquier usuario, con los conocimientos técnicos necesarios, añadir sus propias variantes del algoritmo con cierta flexibilidad, y compararlas con las que ya están incluidas en la aplicación. El software se ha implementado en el lenguaje de programación Python [7], utilizando el Entorno de Desarrollo Integrado (IDE de ahora en adelante) Pycharms [8], y las plataformas OpenAI Gym para la obtención del entorno, y PyQt5 [9] para la Interfaz Gráfica de Usuario. Todo el contenido de este proyecto se ha publicado en la plataforma GitHub [10], que permite el acceso y explotación colaborativos al público.	es_ES
dc.language.iso	spa	es_ES
dc.rights	info:eu-repo/semantics/openAccess	es_ES
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Inteligencia artificial	es_ES
dc.subject	Aprendizaje automático (Inteligencia artificial)	es_ES
dc.subject	Informática - Trabajos Fin de Grado	es_ES
dc.subject	Grado en Ingeniería del Software - Trabajos Fin de Grado	es_ES
dc.subject.other	QLearning	es_ES
dc.subject.other	Reinforcement Learning	es_ES
dc.subject.other	Artificial Intelligence	es_ES
dc.subject.other	Python	es_ES
dc.title	Comparación de algoritmos de aprendizaje por refuerzo basados en Q-Learning	es_ES
dc.title.alternative	Comparison of Q-Learning-based reinforcement learning algorithms	es_ES
dc.type	info:eu-repo/semantics/bachelorThesis	es_ES
dc.centro	E.T.S.I. Informática	es_ES
dc.rights.cc	Attribution-NonCommercial-NoDerivatives 4.0 Internacional	*

Ficheros en el ítem

Nombre:: Caponera de Cobellis, Romolo ...
Tamaño:: 2.067Mb
Formato:: PDF

Este ítem aparece en la(s) siguiente(s) colección(ones)

LCC - Trabajos fin de grado

Mostrar el registro sencillo del ítem

Excepto si se señala otra cosa, la licencia del ítem se describe como Attribution-NonCommercial-NoDerivatives 4.0 Internacional