Prospección de datos, aprendizaje computacional y técnicas estadísticas para la obtención de reglas

Loading...
Thumbnail Image

Identifiers

Publication date

Reading date

Collaborators

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Google Scholar

Share

Research Projects

Organizational Units

Journal Issue

Center

Abstract

Este trabajo se enmarca dentro del área de descubrimiento de conocimiento, concretamente en el área de la prospección de datos. En los últimos años, la capacidad de generar y almacenar datos ha crecido de una forma considerable llegando a cantidades enormes. Por lo tanto, surge la necesidad de desarrollar nuevas técnicas con la capacidad para analizar de manera automática grandes volúmenes de datos y cuyo fin es obtener información útil y valiosa. Dentro del descubrimiento de conocimiento se encuentra el área de la prospección de datos. Este trabajo se centra en las tareas de asociación, clasificación y prospección en la red. En el capitulo 1 hacemos un rápido recorrido por las nociones básicas utilizadas en los siguientes capítulos. En el capitulo 2 incluimos como primera aportación de este trabajo la generalización de la búsqueda en bases de datos de conjuntos frecuentes con atributos positivos y negativos. En primer lugar, se formaliza el problema introduciendo un lenguaje, una relación de especialización y un predicado adecuados. A partir de ahí, se introducen las definiciones necesarias para los ítem sets con atributos negativos para a continuación presentar las proposiciones que nos llevaran a los algoritmos que se han desarrollado para obtener todos los conjuntos frecuentes con el menor esfuerzo computacional, es decir, evitado evaluar directamente cada conjunto en la base de datos y calculando su frecuencia a partir de las frecuencias ya calculadas de determinados conjuntos. En el capitulo 3 adaptamos los algoritmos de aprendizaje de árboles de decisión para considerar las experiencias que tienen valores desconocidos en algún atributo. Definimos un criterio general de división, asignamos valores a los valores desconocidos teniendo en cuenta la información dado por los valores del atributo y de la clase y estudiamos la predicción de observaciones con valores desconocidos.

Description

Bibliographic citation

Collections

Endorsement

Review

Supplemented By

Referenced by