Plataforma de noticias enriquecidas con el uso de LLM

dc.centroE.T.S.I. Informática
dc.contributor.advisorGuzmán-de-los-Riscos, Eduardo Francisco
dc.contributor.authorRuiz Sierras, José Francisco
dc.date.accessioned2026-03-17T13:14:42Z
dc.date.created2025-09
dc.date.issued2025-09
dc.departamentoLenguajes y Ciencias de la Computación
dc.description.abstractEste Trabajo de Fin de Grado se centra en el desarrollo de una plataforma web de noticias enriquecidas mediante el uso de modelos de lenguaje extensos (Large Language Model LLM). El objetivo principal es automatizar la recolección, procesamiento y generación de artículos periodísticos a partir de fuentes digitales para ofrecer al usuario contenido actualizado y detallado. Para la adquisición de información se han implementado técnicas de web scraping1 que permiten extraer noticias relevantes de distintos periódicos españoles. Posteriormente, la información de divide en fragmentos de texto que son transformados en representaciones vectoriales mediante el modelo de embeddings2 intfloat/multilingual-e5-large-instruct, y almacenados en una base de datos vectorial, Qdrant. Con esta estructura se habilita un flujo de generación aumentada por recuperación (Retrieval-Augmented Generation, RAG), en el que el modelo Gemini usa dichos fragmentos para generar artículos coherentes y de mayor calidad informativa. El sistema se completa a través de una arquitectura web basada en FastAPI con Python para el backend, React con Vite y Typescript para el frontend y MongoDB para el almacenamiento de artículos generados. Además, se incluye un servicio de suscripción que envía diariamente al usuario, por correo electrónico, noticias a cuya categoría está suscrito.
dc.identifier.urihttps://hdl.handle.net/10630/46083
dc.language.isospa
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectInformática - Trabajos Fin de Grado
dc.subjectGrado en Ingenería del Software - Trabajos Fin de Grado
dc.subject.otherBase de datos vectorial
dc.subject.otherGeneración aumentada por recuperación (RAG)
dc.subject.otherModelo de lenguaje extenso (LLM)
dc.subject.otherWeb scraping
dc.titlePlataforma de noticias enriquecidas con el uso de LLM
dc.title.alternativeEnriched news platform using LLM
dc.typebachelor thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication4e6e1c0f-4b04-4899-981f-e581587b0176
relation.isAdvisorOfPublication.latestForDiscovery4e6e1c0f-4b04-4899-981f-e581587b0176

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Ruiz Sierras, José Francisco Memoria.pdf
Size:
1.25 MB
Format:
Adobe Portable Document Format