Influencia del orden de presentación de ejemplos de entrenamiento en aprendizaje computacional

Loading...
Thumbnail Image

Identifiers

Publication date

Reading date

Authors

Díaz Pérez, Daniel Miguel

Collaborators

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Google Scholar

Share

Research Projects

Organizational Units

Journal Issue

Abstract

Este TFG se centra en analizar y optimizar la velocidad de aprendizaje de modelos de machine learning, manteniendo constante la arquitectura del modelo para que cualquier mejora provenga exclusivamente de la estrategia de presentación de los datos. El objetivo es lograr que el modelo alcance un buen rendimiento en menos tiempo o con menos iteraciones de entrenamiento, sin recurrir a un aumento de la complejidad del propio modelo. Para ello, se estudian diferentes formas de organizar y presentar los datos durante el entrenamiento, poniendo especial énfasis en el uso de técnicas de curriculum learning. Esta metodología, inspirada en el aprendizaje humano, consiste en presentar primero ejemplos sencillos y, progresivamente, ejemplos de mayor dificultad. La dificultad de los datos se mide utilizando la distancia entre centroides de las distintas clases, una métrica sencilla y de bajo coste computacional, adecuada para conjuntos de datos con un número de clases conocido. El trabajo compara el aprendizaje del modelo bajo distintas estrategias: presentación aleatoria de los datos y mezclas de ejemplos fáciles y difíciles. Se emplean dos conjuntos de datos de reconocimiento de dígitos manuscritos con características similares y niveles de dificultad para evaluar cómo estas estrategias de organización y presentación afectan a la calidad del aprendizaje del modelo. Los resultados obtenidos muestran que la influencia de la presentación de los datos en función de la complejidad puede tener un impacto positivo o negativo en la eficiencia y la generalización del aprendizaje dependiendo del contexto, por lo que su utilidad debe evaluarse siempre en función de las características específicas del problema y del dataset.

Description

Bibliographic citation

Endorsement

Review

Supplemented By

Referenced by

Creative Commons license

Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 Internacional