Análisis del rendimiento de redes neuronales de detección aplicando test-time augmentation con zoom.

Loading...
Thumbnail Image

Identifiers

Publication date

Reading date

Collaborators

Tutors

Editors

Journal Title

Journal ISSN

Volume Title

Publisher

Metrics

Google Scholar

Share

Research Projects

Organizational Units

Journal Issue

Abstract

En este trabajo se ha estudiado el impacto de aplicar Test-Time Augmentation (TTA) mediante zoom en la evaluación de modelos de detección de objetos, utilizando como base el conjunto de validación de COCO 2017. Se han generado distintos grupos de predicciones: las predicciones originales del modelo, las obtenidas a partir de las imágenes aumentadas, combinaciones de ambas, y versiones filtradas mediante supresión de no máximos (NMS), incluyendo variantes con prioridad para mantener las predicciones originales. Se compararon los resultados cuantitativos y cualitativos utilizando métricas de precisión (Average Precision, AP) y exhaustividad (Average Recall, AR), considerando además el tamaño de los objetos detectados. Los resultados muestran que el TTA mediante zoom incrementa la exhaustividad, especialmente en objetos pequeños, mientras que la precisión de las predicciones aumentadas no supera a la de las originales. El estudio del umbral de IoU permitió comprender cómo ajustar este parámetro según el objetivo principal, ya sea maximizar la precisión o la exhaustividad. Este trabajo demuestra que la aplicación de TTA puede ser beneficiosa en escenarios donde detectar todos los objetos es prioritario y el tiempo de ejecución no es una limitación, y establece bases para futuras investigaciones que exploren distintos modelos, transformaciones y técnicas de filtrado de detecciones repetidas.

Description

Bibliographic citation

Endorsement

Review

Supplemented By

Referenced by

Creative Commons license

Except where otherwised noted, this item's license is described as Attribution-NonCommercial-NoDerivatives 4.0 International