Caso de Estudio: Bicing

Estamos realizando un pequeño caso de estudio. El objetivo es explorar y comparar diferentes opciones de visualización y cómo, visualizando un mismo set de datos se puede aportar más o menos información más o menos relevante.

Para ello me voy a basar en los datos de diferentes servicios de bicicletas públicas  que proporciona http://www.citybik.es/ y que mi compañero Xavi @xgumara ha recoplidato.  De hecho Xavi recoge datos de diferentes ciudades pero para un primer estudio nos centraremos en el servicio del Bicing de Barcelona.

Tenemos un proceso ETL que carga los datos y que compone un datamart con las siguientes perspectivas de análisis y métricas a analizar:


Ciertamente es un set de datos reducido y en parte esa es la gracia de este ejercicio.  Extraerle el máximo de información a este set de datos reducido.


Cual va a ser el primer enfoque? Pues el claro y evidente:

Evolución de las bicicletas disponibles a lo largo del tiempo. 

Pero al lo largo del tiempo ¿Que quiere decir?, la comparación de la media de bicicletas disponibles en diferentes días o la evolución durante un día? Cómo siempre: Lo quiero todo






Que nos permite ver esta vista?


De hecho, si nos fijamos en una de las peores estaciones notamos un marcado acento en esta posibilidad:



Pero hay más puntos de vista interesantes:
Cómo veis hay mucha información que extraer.