Algoritmos heurísticos para procesos de decisión de Markov
| dc.centro | E.T.S.I. Informática | es_ES |
| dc.contributor.advisor | Pérez-de-la-Cruz-Molina, José Luis | |
| dc.contributor.author | Ruiz Valverde, Antonio | |
| dc.date.accessioned | 2023-02-16T12:29:45Z | |
| dc.date.available | 2023-02-16T12:29:45Z | |
| dc.date.issued | 2022-09 | |
| dc.departamento | Arquitectura de Computadores | |
| dc.description.abstract | En la actualidad se conocen un gran cúmulo de aplicaciones y prestaciones para la inteligencia artificial, es innegable la influencia residente en este campo en lo relativo al futuro de la informática. Pero hay que puntualizar que no todos los problemas son iguales, y, por lo tanto, tampoco la metodología más precisa para resolverlos. En este TFG estudiaremos concretamente un área del aprendizaje automático, conocida como aprendizaje por refuerzo, que trata de optimizar la toma de decisiones mediante la maximización de una recompensa o la minimización de un coste, a través de los procesos de decisión de Markov. Como veremos adelante, este sistema está basado en la idea de que, en problemas concretos, no podemos tener en cuenta la toma de decisiones como un proceso riguroso y sin fallos, si no que el proceso transitorio que arraiga en la toma de decisiones también puede llevar a error. Por ejemplo, aunque el algoritmo de un sistema autónomo móvil decida moverse en una dirección concreta para alcanzar su destino, es necesario tener en cuenta factores ambientales que sugieren un margen de error en el movimiento. El estudio se llevará a cabo mediante la implementación de una serie de algoritmos heurísticos para procesos de decisión de Markov, y, posteriormente, se hará una comparativa de estos algoritmos a través de la definición de una serie de casos de prueba con el fin de comprobar sus prestaciones y obtener conclusiones acerca de la optimalidad en su uso. En la memoria se detallará la teoría detrás de los procesos de Markov, así como la referente a los algoritmos implementados con pseudocódigo incluido. También se graficará los datos obtenidos en la aplicación de los algoritmos sobre los casos de prueba y se facilitará una copia del código para el interesado. | es_ES |
| dc.identifier.uri | https://hdl.handle.net/10630/25975 | |
| dc.language.iso | spa | es_ES |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
| dc.rights.accessRights | open access | es_ES |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
| dc.subject | Aprendizaje automático (Inteligencia artificial) | es_ES |
| dc.subject | Markov, Procesos de | es_ES |
| dc.subject | Informática - Trabajos Fin de Grado | es_ES |
| dc.subject | Grado en Ingeniería Informática - Trabajos Fin de Grado | es_ES |
| dc.subject.other | Aprendizaje automático | es_ES |
| dc.subject.other | Heurístico | es_ES |
| dc.subject.other | Proceso de decisión de Markov | es_ES |
| dc.subject.other | Casos de prueba | es_ES |
| dc.subject.other | Aprendizaje por refuerzo | es_ES |
| dc.title | Algoritmos heurísticos para procesos de decisión de Markov | es_ES |
| dc.title.alternative | Heuristic algorithms for Markov Decision Processes | es_ES |
| dc.type | bachelor thesis | es_ES |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | b7e65043-46cc-445b-8d8f-b4c7ad4f1c06 | |
| relation.isAdvisorOfPublication.latestForDiscovery | b7e65043-46cc-445b-8d8f-b4c7ad4f1c06 |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Ruiz Valverde Antonio Memoria.pdf
- Size:
- 1.4 MB
- Format:
- Adobe Portable Document Format
- Description:

