La aplicación de métodos de aprendizaje profundo relacionados con la visión por computador ha dado lugar a importantes mejoras en muchas aplicaciones industriales. Algunas de las aplicaciones relacionadas pueden ser la mejora en sistemas de videovigilancia, así como la estimación de la concurrencia en lugares.
Entre las diferentes líneas de investigación emergentes, este trabajo se centra en la prevención de accidentes a través de las secuencias captadas por los sistemas de videovigilancia, estimando la velocidad de los vehículos que circulan por estas
vías.
Los métodos más comunes para la estimación de velocidad se basan en usos de sensores, como por ejemplo los dispositivos lidar, pero estos implican un mayor coste en el presupuesto. Por esa misma razón en este trabajo se propone un método
que utilizando cámaras de videovigilancia, las cuáles ya están ampliamente instaladas en una gran cantidad de calles y carreteras, se pueda obtener una estimación fiable.
En este trabajo, se presenta una propuesta para obtener una estimación fiable y suave de la velocidad de un vehículo mediante redes neuronales convolucionales, CNN, y regresión por kernel. En primer lugar, se realiza una homografía del plano
capturado por la cámara y, para detectar vehículos de forma instantánea, se utiliza un método de detección de objetos basado en CNN. A continuación, se aplica un kernel de regresión para estimar suavemente la velocidad de los vehículos a partir
de las coordenadas junto con la marca de tiempo capturada. Para comprobar la fiabilidad del procedimiento presentado, se han realizado varias pruebas con vídeos seleccionados del conjunto de datos BrnoCompSpeed.