Este trabajo va enfocado a la aplicación de Big Data en Smart Cities (Ciudades Inteligentes). Se pretende facilitar la gestión el tráfico de una ciudad y en este caso se ha escogido la ciudad de Santander.
Santander dispone de una colección de datos abiertos (Open Data), accesibles para cualquier usuario y actualizados en tiempo real. En esta colección de datos podemos encontrar, entre otros, conjuntos de datos referentes a:
sensores de la intensidad del tráfico
sensores de parking
señales de tráfico
calles de la ciudad
condiciones meteorológicas
paradas de taxis
El trabajo, también, tiene como objetivo analizar, comparar y estudiar el comportamiento de tres sistemas de gestión de bases de datos idóneos para grandes volúmenes de datos: MongoDB, Apache Cassandra y Apache Hive.
El sistema desarrollado tiene tres funcionalidades:
Recolección en tiempo real de los recursos proporcionados por las fuentes de datos.
Almacenamiento en base de datos de los recursos procesados y evaluación del comportamiento de los distintos sistemas de gestión de bases de datos.
Representación gráfica de los datos almacenados.
Para la recolección y el almacenamiento de los datos se hará uso de la herramienta Apache Spark. Esta herramienta nos permite realizar descargas de datos en tiempo real (streaming), así como procesarlos y almacenarlos de manera muy rápida.
Por último, para que la representación de los datos sea más comprensible e intuitiva, se hará uso de la API de Google,la cual nos permitirá ver los datos representados en el mapa de Santander.