RT Generic T1 Uso de modelos de visión y lenguaje a gran escala en la desambiguación de mapas semánticos probabilísticos para robótica móvil. T2 Use of Large-Scale Vision and Language Models in the Disambiguation of Probabilistic Semantic Maps for Mobile Robotics A1 Torremocha Doblas, Adrián K1 E.T.S.I. Informática - Trabajos Fin de Grado K1 Grado en Ingeniería del Software - Trabajos Fin de Grado AB Los mapas semánticos son representaciones del entorno de trabajo de un robotmóvil que incluyen información tanto sobre la geometría de los elementos dela escena como de su semántica, por ejemplo, las categorías de los objetos presentes(silla, televisor, vaso, microondas, etc.). El proceso de construcción de dichosmapas se ve afectado fundamentalmente por errores en el sensor y el modelo decategorización empleado, lo que resulta en mapas con objetos categorizados demanera imprecisa. Habitualmente, esta imprecisión en las categorías se explicitamediante distribuciones probabilísticas.Este Trabajo Fin de Grado propone un método para refinar mapas semánticosprobabilísticos mediante la desambiguación de objetos con alta incertidumbre ensu categorización. Para ello se emplea Voxeland, un marco que modela probabilísticamentedicha incertidumbre sobre las categorías de los objetos, interpretadascomo opiniones subjetivas según la Teoría de la Evidencia.La propuesta identifica las instancias ambiguas mediante el cálculo de la entropíay, para cada una de ellas, selecciona sus categorías más probables y unconjunto reducido de imágenes representativas. Estas se suministran, junto conun prompt estructurado, a un Modelo de Visión y Lenguaje a Gran Escala (LVLM),que devuelve nuevas opiniones sobre la categoría del objeto.Las respuestas del LVLM se integran de vuelta en el mapa como nuevas evidencias,actualizando las probabilidades de cada categoría. Las pruebas sobre elconjunto de datos SceneNN muestran mejoras en la clasificación de objetos y unareducción clara de la incertidumbre, fortaleciendo la fiabilidad de los mapas generadospara su uso en robótica móvil en entornos humanos. YR 2025 FD 2025-07 LK https://hdl.handle.net/10630/44912 UL https://hdl.handle.net/10630/44912 LA spa DS RIUMA. Repositorio Institucional de la Universidad de Málaga RD 3 mar 2026