Kafka-ML open-source framework using distributed, incremental, and federated machine learning techniques based on data streams

dc.centroE.T.S.I. Informática
dc.contributor.advisorDíaz-Rodríguez, Manuel
dc.contributor.advisorMartín-Fernández, Cristian
dc.contributor.authorCarnero Hijano, Alejandro
dc.date.accessioned2026-02-05T10:42:38Z
dc.date.issued2025-11-24
dc.date.submitted2025-12-16
dc.departamentoLenguajes y Ciencias de la Computación
dc.description.abstractEsta tesis aborda la integración de técnicas avanzadas de aprendizaje profundo con flujos de datos continuos en entornos del Internet de las Cosas (IoT). El trabajo parte de la necesidad de afrontar limitaciones habituales en sistemas distribuidos, como la latencia en la comunicación, la capacidad de cálculo reducida en dispositivos perimetrales, la adaptación de los modelos ante datos no estacionarios y la preservación de la privacidad en escenarios colaborativos. Estas cuestiones constituyen la motivación central de la investigación. Como punto de partida, se analiza un caso de estudio aplicado a la inspección de aspas de aerogeneradores mediante visión por computador, dispositivos IoT y modelos profundos. Este análisis permite identificar requisitos prácticos para integrar de forma eficiente sensores, flujos de datos y procesos de inferencia, proporcionando la base empírica del marco propuesto. A partir de estas conclusiones, la tesis amplía la plataforma Kafka-ML para habilitar el entrenamiento y despliegue de redes neuronales profundas distribuidas a lo largo del continuo Cloud–Fog–Edge. Mediante la partición de modelos y el uso de salidas tempranas, se reducen la latencia de inferencia y el volumen de datos enviados a la nube. Sobre esta infraestructura distribuida se incorpora aprendizaje incremental, permitiendo actualizar los modelos conforme llegan nuevos datos y mitigando, en lo posible, el olvido catastrófico sin necesidad de reentrenamientos completos. Finalmente, se integra el aprendizaje federado con los enfoques distribuido e incremental, posibilitando el entrenamiento colaborativo sin intercambio de datos sensibles. Esta combinación se evalúa en un escenario V2X, mostrando su viabilidad en contextos con participantes heterogéneos, movilidad y restricciones de privacidad. En conjunto, la tesis presenta una arquitectura unificada para aprendizaje profundo distribuido, continuo y federado sobre flujos IoT. La bibliografía consultada abarca trabajos recientes en aprendizaje profundo, computación perimetral, aprendizaje incremental, aprendizaje federado y procesamiento de flujos, proporcionando el marco teórico que sustenta las contribuciones desarrolladas.
dc.identifier.urihttps://hdl.handle.net/10630/45198
dc.language.isoeng
dc.publisherUMA Editorial
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.accessRightsopen access
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectInternet de los objetos - Tesis doctorales
dc.subject.otherInternet of Things (IoT)
dc.subject.otherAprendizaje profundo distribuido
dc.subject.otherAprendizaje incremental
dc.subject.otherAprendizaje federado
dc.subject.otherProcesamiento de flujos de datos
dc.titleKafka-ML open-source framework using distributed, incremental, and federated machine learning techniques based on data streams
dc.typedoctoral thesis
dspace.entity.typePublication
relation.isAdvisorOfPublication87398907-4bbf-4287-8d0b-e2c84852c57f
relation.isAdvisorOfPublicationbf2870d3-5cc6-414d-8d71-60e242c18554
relation.isAdvisorOfPublication.latestForDiscovery87398907-4bbf-4287-8d0b-e2c84852c57f

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
TD_CARNERO_HIJANO_Alejandro.pdf
Size:
11.32 MB
Format:
Adobe Portable Document Format

Collections