Se ha implementado una API en R para la generación de árboles de
decisión. Se ha trabajado con un fichero de datos, con una serie de síntomas que han
provocado una enfermedad, que ha sido depurado posteriormente. Hemos
implementado una función en la que, a partir del fichero de datos y un conjunto de
síntomas ordenados a nuestra elección, se crea el árbol de decisión que en cada
elección escogerá el síntoma indicado anteriormente.
El siguiente paso ha sido crear dos funciones de predicción que nos sirvan para
comparar los resultados reales con los resultados obtenidos por el árbol de decisión.
Tras construir el árbol y las funciones de predicción, crearemos una función que
unificará ambas tareas.
Este método será la validación cruzada que nos permitirá obtener mejores resultados.
Finalmente, se ha realizado una comparación de los resultados obtenidos con nuestro
método y los resultados extraídos por los algoritmos existentes hasta la actualidad. La
implementación de todas las funciones se ha llevado a cabo con el programa
estadístico R, mientras que para la comparación de resultados se ha utilizado la
herramienta de minería de datos Weka.