Plataforma de noticias enriquecidas con el uso de LLM
Loading...
Identifiers
Publication date
Reading date
Authors
Collaborators
Tutors
Editors
Journal Title
Journal ISSN
Volume Title
Publisher
Share
Center
Department/Institute
Abstract
Este Trabajo de Fin de Grado se centra en el desarrollo de una plataforma web de noticias enriquecidas mediante el uso de modelos de lenguaje extensos (Large Language Model LLM). El objetivo principal es automatizar la recolección, procesamiento y generación de artículos periodísticos a partir de fuentes digitales para ofrecer al usuario contenido actualizado y detallado.
Para la adquisición de información se han implementado técnicas de web scraping1 que permiten extraer noticias relevantes de distintos periódicos españoles. Posteriormente, la información de divide en fragmentos de texto que son transformados en representaciones vectoriales mediante el modelo de embeddings2 intfloat/multilingual-e5-large-instruct, y almacenados en una base de datos vectorial, Qdrant. Con esta estructura se habilita un flujo de generación aumentada por recuperación (Retrieval-Augmented Generation, RAG), en el que el modelo Gemini usa dichos fragmentos para generar artículos coherentes y de mayor calidad informativa.
El sistema se completa a través de una arquitectura web basada en FastAPI con Python para el backend, React con Vite y Typescript para el frontend y MongoDB para el almacenamiento de artículos generados. Además, se incluye un servicio de suscripción que envía diariamente al usuario, por correo electrónico, noticias a cuya categoría está suscrito.
Description
Bibliographic citation
Collections
Endorsement
Review
Supplemented By
Referenced by
Creative Commons license
Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 International










