Algoritmos heurísticos para procesos de decisión de Markov

dc.centroE.T.S.I. Informáticaes_ES
dc.contributor.advisorPérez-de-la-Cruz-Molina, José Luis
dc.contributor.authorRuiz Valverde, Antonio
dc.date.accessioned2023-02-16T12:29:45Z
dc.date.available2023-02-16T12:29:45Z
dc.date.issued2022-09
dc.departamentoArquitectura de Computadores
dc.description.abstractEn la actualidad se conocen un gran cúmulo de aplicaciones y prestaciones para la inteligencia artificial, es innegable la influencia residente en este campo en lo relativo al futuro de la informática. Pero hay que puntualizar que no todos los problemas son iguales, y, por lo tanto, tampoco la metodología más precisa para resolverlos. En este TFG estudiaremos concretamente un área del aprendizaje automático, conocida como aprendizaje por refuerzo, que trata de optimizar la toma de decisiones mediante la maximización de una recompensa o la minimización de un coste, a través de los procesos de decisión de Markov. Como veremos adelante, este sistema está basado en la idea de que, en problemas concretos, no podemos tener en cuenta la toma de decisiones como un proceso riguroso y sin fallos, si no que el proceso transitorio que arraiga en la toma de decisiones también puede llevar a error. Por ejemplo, aunque el algoritmo de un sistema autónomo móvil decida moverse en una dirección concreta para alcanzar su destino, es necesario tener en cuenta factores ambientales que sugieren un margen de error en el movimiento. El estudio se llevará a cabo mediante la implementación de una serie de algoritmos heurísticos para procesos de decisión de Markov, y, posteriormente, se hará una comparativa de estos algoritmos a través de la definición de una serie de casos de prueba con el fin de comprobar sus prestaciones y obtener conclusiones acerca de la optimalidad en su uso. En la memoria se detallará la teoría detrás de los procesos de Markov, así como la referente a los algoritmos implementados con pseudocódigo incluido. También se graficará los datos obtenidos en la aplicación de los algoritmos sobre los casos de prueba y se facilitará una copia del código para el interesado.es_ES
dc.identifier.urihttps://hdl.handle.net/10630/25975
dc.language.isospaes_ES
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.accessRightsopen accesses_ES
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectAprendizaje automático (Inteligencia artificial)es_ES
dc.subjectMarkov, Procesos dees_ES
dc.subjectInformática - Trabajos Fin de Gradoes_ES
dc.subjectGrado en Ingeniería Informática - Trabajos Fin de Gradoes_ES
dc.subject.otherAprendizaje automáticoes_ES
dc.subject.otherHeurísticoes_ES
dc.subject.otherProceso de decisión de Markoves_ES
dc.subject.otherCasos de pruebaes_ES
dc.subject.otherAprendizaje por refuerzoes_ES
dc.titleAlgoritmos heurísticos para procesos de decisión de Markoves_ES
dc.title.alternativeHeuristic algorithms for Markov Decision Processeses_ES
dc.typebachelor thesises_ES
dspace.entity.typePublication
relation.isAdvisorOfPublicationb7e65043-46cc-445b-8d8f-b4c7ad4f1c06
relation.isAdvisorOfPublication.latestForDiscoveryb7e65043-46cc-445b-8d8f-b4c7ad4f1c06

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Ruiz Valverde Antonio Memoria.pdf
Size:
1.4 MB
Format:
Adobe Portable Document Format
Description: