RT Generic T1 Algoritmos heurísticos para procesos de decisión de Markov T2 Heuristic algorithms for Markov Decision Processes A1 Ruiz Valverde, Antonio K1 Aprendizaje automático (Inteligencia artificial) K1 Markov, Procesos de K1 Informática - Trabajos Fin de Grado K1 Grado en Ingeniería Informática - Trabajos Fin de Grado AB En la actualidad se conocen un gran cúmulo de aplicaciones y prestaciones para lainteligencia artificial, es innegable la influencia residente en este campo en lo relativo alfuturo de la informática. Pero hay que puntualizar que no todos los problemas son iguales, y,por lo tanto, tampoco la metodología más precisa para resolverlos.En este TFG estudiaremos concretamente un área del aprendizaje automático, conocidacomo aprendizaje por refuerzo, que trata de optimizar la toma de decisiones mediante lamaximización de una recompensa o la minimización de un coste, a través de los procesos dedecisión de Markov. Como veremos adelante, este sistema está basado en la idea de que, enproblemas concretos, no podemos tener en cuenta la toma de decisiones como un procesoriguroso y sin fallos, si no que el proceso transitorio que arraiga en la toma de decisionestambién puede llevar a error. Por ejemplo, aunque el algoritmo de un sistema autónomomóvil decida moverse en una dirección concreta para alcanzar su destino, es necesario teneren cuenta factores ambientales que sugieren un margen de error en el movimiento.El estudio se llevará a cabo mediante la implementación de una serie de algoritmosheurísticos para procesos de decisión de Markov, y, posteriormente, se hará unacomparativa de estos algoritmos a través de la definición de una serie de casos de pruebacon el fin de comprobar sus prestaciones y obtener conclusiones acerca de la optimalidad ensu uso.En la memoria se detallará la teoría detrás de los procesos de Markov, así como la referentea los algoritmos implementados con pseudocódigo incluido. También se graficará los datosobtenidos en la aplicación de los algoritmos sobre los casos de prueba y se facilitará unacopia del código para el interesado. YR 2022 FD 2022-09 LK https://hdl.handle.net/10630/25975 UL https://hdl.handle.net/10630/25975 LA spa DS RIUMA. Repositorio Institucional de la Universidad de Málaga RD 20 ene 2026