Plataforma de noticias enriquecidas con el uso de LLM
| dc.centro | E.T.S.I. Informática | |
| dc.contributor.advisor | Guzmán-de-los-Riscos, Eduardo Francisco | |
| dc.contributor.author | Ruiz Sierras, José Francisco | |
| dc.date.accessioned | 2026-03-17T13:14:42Z | |
| dc.date.created | 2025-09 | |
| dc.date.issued | 2025-09 | |
| dc.departamento | Lenguajes y Ciencias de la Computación | |
| dc.description.abstract | Este Trabajo de Fin de Grado se centra en el desarrollo de una plataforma web de noticias enriquecidas mediante el uso de modelos de lenguaje extensos (Large Language Model LLM). El objetivo principal es automatizar la recolección, procesamiento y generación de artículos periodísticos a partir de fuentes digitales para ofrecer al usuario contenido actualizado y detallado. Para la adquisición de información se han implementado técnicas de web scraping1 que permiten extraer noticias relevantes de distintos periódicos españoles. Posteriormente, la información de divide en fragmentos de texto que son transformados en representaciones vectoriales mediante el modelo de embeddings2 intfloat/multilingual-e5-large-instruct, y almacenados en una base de datos vectorial, Qdrant. Con esta estructura se habilita un flujo de generación aumentada por recuperación (Retrieval-Augmented Generation, RAG), en el que el modelo Gemini usa dichos fragmentos para generar artículos coherentes y de mayor calidad informativa. El sistema se completa a través de una arquitectura web basada en FastAPI con Python para el backend, React con Vite y Typescript para el frontend y MongoDB para el almacenamiento de artículos generados. Además, se incluye un servicio de suscripción que envía diariamente al usuario, por correo electrónico, noticias a cuya categoría está suscrito. | |
| dc.identifier.uri | https://hdl.handle.net/10630/46083 | |
| dc.language.iso | spa | |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.accessRights | open access | |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Informática - Trabajos Fin de Grado | |
| dc.subject | Grado en Ingenería del Software - Trabajos Fin de Grado | |
| dc.subject.other | Base de datos vectorial | |
| dc.subject.other | Generación aumentada por recuperación (RAG) | |
| dc.subject.other | Modelo de lenguaje extenso (LLM) | |
| dc.subject.other | Web scraping | |
| dc.title | Plataforma de noticias enriquecidas con el uso de LLM | |
| dc.title.alternative | Enriched news platform using LLM | |
| dc.type | bachelor thesis | |
| dspace.entity.type | Publication | |
| relation.isAdvisorOfPublication | 4e6e1c0f-4b04-4899-981f-e581587b0176 | |
| relation.isAdvisorOfPublication.latestForDiscovery | 4e6e1c0f-4b04-4899-981f-e581587b0176 |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Ruiz Sierras, José Francisco Memoria.pdf
- Size:
- 1.25 MB
- Format:
- Adobe Portable Document Format

