SVM y árboles de decisión: una aplicación práctica en una base de datos real

Loading...
Thumbnail Image

Identifiers

Publication date

Reading date

Authors

Moral Fernández, Teresa

Collaborators

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Google Scholar

Share

Research Projects

Organizational Units

Journal Issue

Abstract

Este trabajo tiene como objetivo introducir los principios fundamentales del aprendizaje supervisado, en particular, se centrará en la clasificación binaria. Para ello, se presentan y comparan dos modelos de clasificación: uno de carácter lineal resuelto a partir de un problema de optimización, conocido como Máquinas de Vectores Soporte, y otro de naturaleza heurística y carácter no lineal, los Árboles de Decisión. Ambas metodologías se aplican a una base de datos real. El Capítulo 1 introduce los conceptos fundamentales del aprendizaje automático, distinguiendo entre sus principales tipologías. En particular, se profundiza en el aprendizaje supervisado y se presenta el concepto de clasificación binaria, que será el enfoque adoptado a lo largo del trabajo. En el Capítulo 2 se estudia la clasificación binaria mediante el uso de Máquinas de Vectores Soporte (en inglés, Support Vector Machines). Se analizan tanto el caso de datos linealmente separables, conocido como SVM de margen duro, como el caso más general en el que se permiten ciertos errores en la clasificación, abordado mediante el SVM de margen blando. El Capítulo 3 se centra en los ´Arboles de Decisión como técnica alternativa de clasificación. Se describen sus elementos fundamentales, así como el proceso de construcción y entrenamiento del modelo. Asimismo, se explica en detalle el funcionamiento del algoritmo CART, utilizado para su resolución. El Capítulo 4 presenta los experimentos computacionales realizados. Se entrenan y evalúan los modelos introducidos en los capítulos anteriores utilizando una base de datos real procedente de la estación meteorológica de la Base Naval de Rota (Cádiz). Además, se comparan ambos modelos aplicándolos a diferentes combinaciones de variables de entrada. Por ´último, el Capítulo 5 recoge las conclusiones extraídas del estudio y plantea posibles líneas futuras de trabajo.

Description

Bibliographic citation

Endorsement

Review

Supplemented By

Referenced by

Creative Commons license

Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internaciona