RT Generic
T1 Aprendizaje por refuerzo profundo aplicado a datos obtenidos de sensores de IA desarrollados para la industria de defensa
A1 Robles de Molina, Teodoro
K1 Aprendizaje automático (Inteligencia artificial) - Trabajos fin de grado
K1 Industria militar - Trabajos fin de grado
AB El aprendizaje por refuerzo se ha consolidado como una técnica fundamental en el desarrollo de modelos de inteligencia artificial actuales. Su capacidad para optimizar decisiones en entornos dinámicos lo convierte en una herramienta especialmente valiosa en aplicaciones industriales, donde la interacción continua con el medio y la maximización del rendimiento son elementos clave.Se basa en un proceso de prueba y error mediante el cual un agente interactúa con suentorno para lograr un objetivo. A partir de la observación del estado de lo que lo rodea, toma decisiones ejecutando acciones y recibe una recompensa que indica el nivel de acierto. Con el tiempo, este proceso permite ajustar su comportamiento para maximizar la recompensa obtenida. Si a este análisis le incluimos redes neuronales obtenemos aprendizaje por refuerzo profundo.En este Trabajo de Fin de Grado se desarrolla un modelo de aprendizaje por refuerzoprofundo aplicado al tratamiento de señales obtenidas mediante sensores utilizados en la industria de la defensa. El conjunto de datos que se utiliza para la realización del modelo ha sido extraído de la plataforma Kaggle. A partir de esta base, se realiza un análisis exhaustivo del comportamiento del sistema, con especial atención a la definición de la recompensa y su impacto en el rendimiento del modelo.Este trabajo se centra en varios aspectos clave: en primer lugar, se realiza un análisis exploratorio de los datos extraídos del repositorio; posteriormente, se analiza el rendimiento de los mismos con redes neuronales, se diseña el modelo de aprendizaje profundo y se configura el agente de aprendizaje por refuerzo. Todo ello con el objetivo de determinar qué configuración de recompensa resulta más eficaz para optimizar el rendimiento del agente.
YR 2025
FD 2025-06
LK https://hdl.handle.net/10630/40952
UL https://hdl.handle.net/10630/40952
LA spa
DS RIUMA. Repositorio Institucional de la Universidad de Málaga
RD 4 may 2026