Algoritmos heurísticos para procesos de decisión de Markov

Ruiz Valverde, Antonio

Algoritmos heurísticos para procesos de decisión de Markov

Files

Ruiz Valverde Antonio Memoria.pdf (1.4 MB)

Identifiers

URI: https://hdl.handle.net/10630/25975

Publication date

2022-09

Authors

Ruiz Valverde, Antonio

Advisors

Pérez-de-la-Cruz-Molina, José Luis

Metrics

Share

Export

Center

E.T.S.I. Informática

Department/Institute

Arquitectura de Computadores

Keywords

Aprendizaje automático (Inteligencia artificial)
Markov, Procesos de
Informática - Trabajos Fin de Grado
Grado en Ingeniería Informática - Trabajos Fin de Grado

Abstract

En la actualidad se conocen un gran cúmulo de aplicaciones y prestaciones para la inteligencia artificial, es innegable la influencia residente en este campo en lo relativo al futuro de la informática. Pero hay que puntualizar que no todos los problemas son iguales, y, por lo tanto, tampoco la metodología más precisa para resolverlos. En este TFG estudiaremos concretamente un área del aprendizaje automático, conocida como aprendizaje por refuerzo, que trata de optimizar la toma de decisiones mediante la maximización de una recompensa o la minimización de un coste, a través de los procesos de decisión de Markov. Como veremos adelante, este sistema está basado en la idea de que, en problemas concretos, no podemos tener en cuenta la toma de decisiones como un proceso riguroso y sin fallos, si no que el proceso transitorio que arraiga en la toma de decisiones también puede llevar a error. Por ejemplo, aunque el algoritmo de un sistema autónomo móvil decida moverse en una dirección concreta para alcanzar su destino, es necesario tener en cuenta factores ambientales que sugieren un margen de error en el movimiento. El estudio se llevará a cabo mediante la implementación de una serie de algoritmos heurísticos para procesos de decisión de Markov, y, posteriormente, se hará una comparativa de estos algoritmos a través de la definición de una serie de casos de prueba con el fin de comprobar sus prestaciones y obtener conclusiones acerca de la optimalidad en su uso. En la memoria se detallará la teoría detrás de los procesos de Markov, así como la referente a los algoritmos implementados con pseudocódigo incluido. También se graficará los datos obtenidos en la aplicación de los algoritmos sobre los casos de prueba y se facilitará una copia del código para el interesado.

Collections

Trabajos Fin de Grado

Creative Commons license

Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional

Full item page

Algoritmos heurísticos para procesos de decisión de Markov

Files

Identifiers

Publication date

Reading date

Authors

Collaborators

Advisors

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Share

Export

Research Projects

Organizational Units

Journal Issue

Center

Department/Institute

Keywords

Abstract

Description

Bibliographic citation

Collections

Endorsement

Review

Supplemented By

Referenced by

Creative Commons license