Paralelización de algoritmos de minería de textos con Hadoop
| dc.centro | E.T.S.I. Informática | en_US |
| dc.contributor.advisor | Navas-Delgado, Ismael | |
| dc.contributor.advisor | Aldana-Montes, José Francisco | |
| dc.contributor.author | Carrasco Barrios, Elena | |
| dc.date.accessioned | 2018-02-21T11:47:28Z | |
| dc.date.available | 2018-02-21T11:47:28Z | |
| dc.date.created | 2014-10 | |
| dc.date.issued | 2018-02-21 | |
| dc.departamento | Lenguajes y Ciencias de la Computación | |
| dc.description.abstract | Este Trabajo Fin de Grado (TFG) tiene como objetivos paralelizar algoritmos de minería de textos para poder permitir su ejecución con una gran cantidad de textos en el menor tiempo posible y con usuarios concurrentes, y la creación de un modelo de datos RDF con las anotaciones generadas por el algoritmo en los documentos. La paralelización se ha realizado siguiendo la filosofía MapReduce. En la fase del mapper se realiza la ejecución del algoritmo de minería de textos sobre el texto de entrada y se genera el modelo RDF asociado a ese texto. La fase del reducer se encarga de unir todos los modelos RDF que hagan referencia a textos de un documento en un único modelo global. El resultado de la ejecución de este programa son pares <nombre del documento, modelo RDF>. Para cumplir con el segundo objetivo se ha desarrollado otra aplicación que une todos los modelos generados por el programa anterior en un solo modelo. El desarrollo del sistema se ha realizado usando Java SE y las tecnologías Apache Hadoop, Gate y Apache Jena. En este trabajo se expondrán un sistema capaz de paralelizar algoritmos de minería de textos desarrollados en GATE y crear el modelo RDF correspondiente a las anotaciones generadas a partir de los textos, las conclusiones alcanzadas a raíz de este trabajo y algunas propuestas de trabajos futuros. | en_US |
| dc.identifier.uri | https://hdl.handle.net/10630/15217 | |
| dc.language.iso | spa | en_US |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 Internacional | * |
| dc.rights.accessRights | open access | en_US |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
| dc.subject | Paralelismo (Informática) | en_US |
| dc.subject | Informática - Trabajos Fin de Grado | en_US |
| dc.subject | Grado en Ingeniería Informática - Trabajos Fin de Grado | en_US |
| dc.subject.other | Paralelización | en_US |
| dc.subject.other | Algoritmo de minería de textos | en_US |
| dc.subject.other | MapReduce | en_US |
| dc.subject.other | Algoritmo de reconocimiento de nombres de entidades | en_US |
| dc.subject.other | Modelo RDF | en_US |
| dc.title | Paralelización de algoritmos de minería de textos con Hadoop | en_US |
| dc.title.alternative | Parallelization of text mining algorithms using Hadoop | en_US |
| dc.type | bachelor thesis | es_ES |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | 4e298ef9-8825-4aa8-be87-ac0f8adbf1b7 | |
| relation.isAdvisorOfPublication | 7eac9d6a-0152-4268-8207-ea058c82e531 | |
| relation.isAdvisorOfPublication.latestForDiscovery | 4e298ef9-8825-4aa8-be87-ac0f8adbf1b7 |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Memoria_TFG.pdf
- Size:
- 1.75 MB
- Format:
- Adobe Portable Document Format
- Description:

