Kafka-ML open-source framework using distributed, incremental, and federated machine learning techniques based on data streams

Carnero Hijano, Alejandro

Kafka-ML open-source framework using distributed, incremental, and federated machine learning techniques based on data streams

Files

TD_CARNERO_HIJANO_Alejandro.pdf (11.32 MB)

Identifiers

URI: https://hdl.handle.net/10630/45198

Publication date

2025-11-24

Reading date

2025-12-16

Authors

Carnero Hijano, Alejandro

Advisors

Díaz-Rodríguez, Manuel

Martín-Fernández, Cristian

Publisher

UMA Editorial

Metrics

Share

Export

Center

E.T.S.I. Informática

Department/Institute

Lenguajes y Ciencias de la Computación

Keywords

Internet de los objetos - Tesis doctorales

Abstract

Esta tesis aborda la integración de técnicas avanzadas de aprendizaje profundo con flujos de datos continuos en entornos del Internet de las Cosas (IoT). El trabajo parte de la necesidad de afrontar limitaciones habituales en sistemas distribuidos, como la latencia en la comunicación, la capacidad de cálculo reducida en dispositivos perimetrales, la adaptación de los modelos ante datos no estacionarios y la preservación de la privacidad en escenarios colaborativos. Estas cuestiones constituyen la motivación central de la investigación. Como punto de partida, se analiza un caso de estudio aplicado a la inspección de aspas de aerogeneradores mediante visión por computador, dispositivos IoT y modelos profundos. Este análisis permite identificar requisitos prácticos para integrar de forma eficiente sensores, flujos de datos y procesos de inferencia, proporcionando la base empírica del marco propuesto. A partir de estas conclusiones, la tesis amplía la plataforma Kafka-ML para habilitar el entrenamiento y despliegue de redes neuronales profundas distribuidas a lo largo del continuo Cloud–Fog–Edge. Mediante la partición de modelos y el uso de salidas tempranas, se reducen la latencia de inferencia y el volumen de datos enviados a la nube. Sobre esta infraestructura distribuida se incorpora aprendizaje incremental, permitiendo actualizar los modelos conforme llegan nuevos datos y mitigando, en lo posible, el olvido catastrófico sin necesidad de reentrenamientos completos. Finalmente, se integra el aprendizaje federado con los enfoques distribuido e incremental, posibilitando el entrenamiento colaborativo sin intercambio de datos sensibles. Esta combinación se evalúa en un escenario V2X, mostrando su viabilidad en contextos con participantes heterogéneos, movilidad y restricciones de privacidad. En conjunto, la tesis presenta una arquitectura unificada para aprendizaje profundo distribuido, continuo y federado sobre flujos IoT. La bibliografía consultada abarca trabajos recientes en aprendizaje profundo, computación perimetral, aprendizaje incremental, aprendizaje federado y procesamiento de flujos, proporcionando el marco teórico que sustenta las contribuciones desarrolladas.

Collections

Tesis doctorales

Creative Commons license

Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 International

Full item page

Kafka-ML open-source framework using distributed, incremental, and federated machine learning techniques based on data streams

Files

Identifiers

Publication date

Reading date

Authors

Collaborators

Advisors

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Share

Export

Research Projects

Organizational Units

Journal Issue

Center

Department/Institute

Keywords

Abstract

Description

Bibliographic citation

Collections

Endorsement

Review

Supplemented By

Referenced by

Creative Commons license