Aprendizaje por refuerzo profundo aplicado a datos obtenidos de sensores de IA desarrollados para la industria de defensa
Loading...
Identifiers
Publication date
Reading date
Authors
Robles de Molina, Teodoro
Collaborators
Advisors
Tutors
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Share
Department/Institute
Abstract
El aprendizaje por refuerzo se ha consolidado como una técnica fundamental en el desarrollo de modelos de inteligencia artificial actuales. Su capacidad para optimizar decisiones en entornos dinámicos lo convierte en una herramienta especialmente valiosa en aplicaciones industriales, donde la interacción continua con el medio y la maximización del rendimiento son elementos clave.
Se basa en un proceso de prueba y error mediante el cual un agente interactúa con su
entorno para lograr un objetivo. A partir de la observación del estado de lo que lo rodea, toma decisiones ejecutando acciones y recibe una recompensa que indica el nivel de acierto. Con el tiempo, este proceso permite ajustar su comportamiento para maximizar la recompensa obtenida. Si a este análisis le incluimos redes neuronales obtenemos aprendizaje por refuerzo profundo.
En este Trabajo de Fin de Grado se desarrolla un modelo de aprendizaje por refuerzo
profundo aplicado al tratamiento de señales obtenidas mediante sensores utilizados en la industria de la defensa. El conjunto de datos que se utiliza para la realización del modelo ha sido extraído de la plataforma Kaggle. A partir de esta base, se realiza un análisis exhaustivo del comportamiento del sistema, con especial atención a la definición de la recompensa y su impacto en el rendimiento del modelo.
Este trabajo se centra en varios aspectos clave: en primer lugar, se realiza un análisis exploratorio de los datos extraídos del repositorio; posteriormente, se analiza el rendimiento de los mismos con redes neuronales, se diseña el modelo de aprendizaje profundo y se configura el agente de aprendizaje por refuerzo. Todo ello con el objetivo de determinar qué configuración de recompensa resulta más eficaz para optimizar el rendimiento del agente.
Description
Bibliographic citation
Collections
Endorsement
Review
Supplemented By
Referenced by
Creative Commons license
Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional











