Plataforma de noticias enriquecidas con el uso de LLM

Loading...
Thumbnail Image

Identifiers

Publication date

Reading date

Collaborators

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Google Scholar

Share

Research Projects

Organizational Units

Journal Issue

Abstract

Este Trabajo de Fin de Grado se centra en el desarrollo de una plataforma web de noticias enriquecidas mediante el uso de modelos de lenguaje extensos (Large Language Model LLM). El objetivo principal es automatizar la recolección, procesamiento y generación de artículos periodísticos a partir de fuentes digitales para ofrecer al usuario contenido actualizado y detallado. Para la adquisición de información se han implementado técnicas de web scraping1 que permiten extraer noticias relevantes de distintos periódicos españoles. Posteriormente, la información de divide en fragmentos de texto que son transformados en representaciones vectoriales mediante el modelo de embeddings2 intfloat/multilingual-e5-large-instruct, y almacenados en una base de datos vectorial, Qdrant. Con esta estructura se habilita un flujo de generación aumentada por recuperación (Retrieval-Augmented Generation, RAG), en el que el modelo Gemini usa dichos fragmentos para generar artículos coherentes y de mayor calidad informativa. El sistema se completa a través de una arquitectura web basada en FastAPI con Python para el backend, React con Vite y Typescript para el frontend y MongoDB para el almacenamiento de artículos generados. Además, se incluye un servicio de suscripción que envía diariamente al usuario, por correo electrónico, noticias a cuya categoría está suscrito.

Description

Bibliographic citation

Endorsement

Review

Supplemented By

Referenced by

Creative Commons license

Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 International