Aprendizaje por refuerzo profundo aplicado a datos obtenidos de sensores de IA desarrollados para la industria de defensa

Loading...
Thumbnail Image

Identifiers

Publication date

Reading date

Authors

Robles de Molina, Teodoro

Collaborators

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Google Scholar

Share

Research Projects

Organizational Units

Journal Issue

Abstract

El aprendizaje por refuerzo se ha consolidado como una técnica fundamental en el desarrollo de modelos de inteligencia artificial actuales. Su capacidad para optimizar decisiones en entornos dinámicos lo convierte en una herramienta especialmente valiosa en aplicaciones industriales, donde la interacción continua con el medio y la maximización del rendimiento son elementos clave. Se basa en un proceso de prueba y error mediante el cual un agente interactúa con su entorno para lograr un objetivo. A partir de la observación del estado de lo que lo rodea, toma decisiones ejecutando acciones y recibe una recompensa que indica el nivel de acierto. Con el tiempo, este proceso permite ajustar su comportamiento para maximizar la recompensa obtenida. Si a este análisis le incluimos redes neuronales obtenemos aprendizaje por refuerzo profundo. En este Trabajo de Fin de Grado se desarrolla un modelo de aprendizaje por refuerzo profundo aplicado al tratamiento de señales obtenidas mediante sensores utilizados en la industria de la defensa. El conjunto de datos que se utiliza para la realización del modelo ha sido extraído de la plataforma Kaggle. A partir de esta base, se realiza un análisis exhaustivo del comportamiento del sistema, con especial atención a la definición de la recompensa y su impacto en el rendimiento del modelo. Este trabajo se centra en varios aspectos clave: en primer lugar, se realiza un análisis exploratorio de los datos extraídos del repositorio; posteriormente, se analiza el rendimiento de los mismos con redes neuronales, se diseña el modelo de aprendizaje profundo y se configura el agente de aprendizaje por refuerzo. Todo ello con el objetivo de determinar qué configuración de recompensa resulta más eficaz para optimizar el rendimiento del agente.

Description

Bibliographic citation

Endorsement

Review

Supplemented By

Referenced by

Creative Commons license

Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional