¿Se pueden resolver los problemas de movilidad con Big Data?

¿ Qué es Big Data y qué uso tiene en la movilidad? Hoy hablaremos de estos conceptos tan de moda hoy en día: Big Data, minería de datos e inteligencia artificial……pero esta vez aplicados a movilidad.

Si conoces éste termino, sabrás que la importancia de los Big Data es creciente y se dan cifras tan impresionantes como que se estima que para 2020 cada individuo creará 1,7 megabytes de información nueva por segundo y que para ese año al menos la tercera parte de todos los datos pasarán por la nube, una red de servidores conectada mediante el Internet.

Para hablar de ello, contamos con dos expertos como Alfredo Garcia Hernandez-Díaz, Catedrático (acreditado) de la Universidad Pablo Olavide y con Juan Carlos Rubio, Socio-Director de qosITconsulting.

Esta empresa trabaja con otras empresas y organizaciones de muchos mercados y sectores en la resolución de problemas de optimización de procesos o de predicción de determinados eventos relacionados con su cadena de valor mediante la aplicación de metodologías y soluciones de analítica de datos a medida de cada situación particular.

Tras leer esta entrevista, entenderás:

  • Qué es Big Data
  • Los problemas reales que presenta hoy en día la movilidad urbana
  • Cómo se pueden aplicar los Big Data a los problemas de movilidad.

Te dejo con ellos pero antes te anuncio que firmamos en octubre desde mi empresa S3Transportation un convenio con la empresa qosITconsulting para el desarrollo de un proyecto conjunto revolucionario que os iremos mostrando en la primavera de este año y en el que se aplican los Big Data a los problemas de la movilidad urbana como podéis ver en esta noticia

1. ¿ Qué es Big Data ?

Entendemos importante remarcar la diferencia entre los escenarios donde los modelos de analítica de datos y las herramientas convencionales para el almacenamiento, gestión y procesamiento de los datos implicados son suficientes, y aquellos otros en los que estos mismos modelos y herramientas se muestran insuficientes. Para estos casos la resolución es fácil usando Big Data.

Creemos relevante aportar en este punto lo que para el equipo de Big Data y Analítica de qosITconsulting define e identifica la naturaleza de un escenario de Big Data, en el que se requieren conocimientos, herramientas y procesos diferentes de aquellos en los que realmente estamos tratando con un problema de Analítica de Datos, por mucho que el volumen de datos a tratar sea muy elevado.

Tradicionalmente siempre se ha considerado que estamos hablando de un escenario de Big Data cuando coincidían tres características básicas:

  • Volumen: la cantidad de datos generados, almacenados y que deben ser procesados es muy elevada.
  • Velocidad: la velocidad a la que estos datos son generados y deben ser almacenados y gestionados y procesados es muy elevada.
  • Variedad: el número de orígenes de datos y los tipos diferentes de datos que se producen son muy elevados.

A estas tres “Vs”, que podemos decir que siguen permitiéndonos identificar de un modo muy básico un problema de Big Data, la evolución del mercado y de los retos a los que nos enfrentamos hoy en día ha ido gradualmente añadiendo hasta cuatro “Vs” más, que nos ayudan a entender mejor el concepto y nos deben permitir completar la visión y las prioridades de este tipo de estrategias tecnológicas:

  • Variabilidad: dentro de los diferentes tipos de datos que la “Variedad” nos asegura, pueden darse variaciones muy importantes del mismo dato en función del contexto en el que se produce, y nuestra estrategia deberá asegurar su identificación y correcta interpretación.
  • Veracidad: de nada servirá la aplicación de complejas soluciones de Big Data sobre ingentes cantidades de datos si no aseguramos la limpieza y veracidad de los mismos. Nuestro escenario deberá incorporar medidas para garantizar que confiamos en los datos que manejamos, para que los análisis que hagamos sobre ellos nos aporten información veraz y permitan tomas de decisiones correctas.
  • Visualización: es igualmente imprescindible para una estrategia de Big Data realmente valiosa que los análisis realizados sean presentados de manera comprensible y útil para los fines que se pretenda conseguir. Paradójicamente, la correcta presentación o visualización de un análisis de datos puede en muchas ocasiones no ser la parte más compleja técnicamente del proceso, pero puede resultar una de las más complejas al requerir de un muy elevado conocimiento funcional y de las que pueden acabar por marcar la diferencia. Este es una de las áreas en las que el futuro del Big Data tiene una proyección mayor, ya que una correcta visualización de resultados del análisis de datos nos permite identificar de un modo natural cuestiones y detalles que inicialmente no se planteaban.
  • Valor: siendo una propiedad muy evidente de toda solución tecnológica, en estos escenarios debemos siempre asegurar que centramos el diseño y la estrategia alrededor de los datos y tipos de datos que mayor valor aportan al escenario, desde la certeza de que todos los datos que maneja internamente una organización, y todos los datos que tanto interna como externamente afectan a sus procesos incluyen un valor potencial cierto que cada organización puede convertir en valor real utilizando las estrategias adecuadas.

Estas últimas cuatro “Vs” no son necesariamente definitorias e imprescindibles para determinar el encaje o no de un problema dentro de una estrategia de Big Data, pero indudablemente nos ayudan a asegurar la adecuada atención a los ángulos imprescindibles a la hora del diseño e implantación de un modelo de Big Data en nuestras organizaciones.

2 . Los problemas reales que presenta hoy en día la movilidad urbana

La movilidad en las ciudades y áreas metropolitanas requiere cada vez más actuaciones decisivas en favor de una movilidad sostenible de acuerdo con las directrices europeas.

Éstas actuaciones, en un entorno tan complejo como es el de las áreas urbanas, debe basarse en una amplia toma de datos que fundamenten la toma decisiones. Además, una gran cantidad de datos y de calidad permite defender mejor los proyectos, no solo fundamentarlos.

Son, pues, un instrumento en los procesos de participación ciudadana y concertación tan importantes en planes de movilidad urbana sostenibles, y vemos como, del mismo modo que ocurre en cada proceso de negocio de un impacto relevante, los datos y la óptima gestión de los mismos toman una importancia capital.

Conocer las necesidades de movilidad y desplazamientos de los ciudadanos, así como los motivos y costes relacionados ayudaría a realizar planificaciones más acertadas y a tomar decisiones más útiles para la ciudadanía.

Nuestros impuestos no se malgastarían en infraestructuras poco útiles ni en servicios de baja demanda, sino que cada euro se invertiría en necesidades reales y demandadas por los ciudadanos.

No obstante, conocer u obtener esta información es todo un reto para los gestores de las empresas del sector, así como para las administraciones públicas pues la movilidad es dinámica, cambiante minuto a minuto, depende del día de la semana, del mes e incluso de la hora del día.

Lógicamente, una gran parte de la movilidad, sus características y necesidades, es “estable”, se repite en el tiempo y puede ser detectada, modelada y se puede predecir.

Por supuesto existe otra parte de la movilidad que podríamos clasificar como aleatoria o caprichosa difícilmente predecible pero que lógicamente no representa un volumen relevante.

Para estructurar todos estos procesos que sustentes tan estratégicas tomas de decisión, tradicionalmente se han venido realizando amplias campañas de trabajo de campo, y una gran parte de las misma se basa en encuestas donde un encuestador, previamente formado y equipado, realiza una encuesta de 15 o 20 minutos a todos los ciudadanos de una muestra previamente seleccionada.

En Europa, hasta hace unos años, estos procesos se basaban en encuestas domiciliarias o a pie de calle, presenciales, modelo que prácticamente se han abandonado sustituyéndose en la actualidad por encuestas telefónicas, si bien siguen teniendo una serie de problemas:

  • El precio y, como consecuencia, la muestra reducida.
  • Cada vez hay menos hogares con teléfono fijo y las bases de datos de móviles no son tan sencillas de manejar.
  • Siguen dependiendo del hogar cuando la movilidad depende en realidad del individuo.
  • Sólo aporta información, en general, de un día laborable tipo o medio.

De esta forma, los retos principales que este escenario nos presenta son:

  • Resolver un problema de captura de información de movilidad que dificulta los procesos de toma de decisión y de desarrollo de soluciones en aras de una movilidad sostenible.
  • Disponer de una herramienta que permite cambiar la forma de captura de datos para estudiar la demanda de movilidad y desarrollar planes de transporte. Esto debe basarse en procedimiento innovador basado en la tecnología Big Data para la creación de bases de datos de movilidad urbana y metropolitana
  • Disponer de una herramienta que, a coste competitivo, aporte información de una muestra mayor número de personas y tipo de día que permita una fotografía de la situación actual de la movilidad en el aria de estudio correspondiente.

3.  Aplicación de Big Data a los retos de la movilidad: la propuesta de qosITconsulting

Desde el área de I+D de qosITconsulting, y trabajando en estrecha colaboración con expertos sectoriales en movilidad urbana e interurbana, estamos trabajando en el análisis y el diseño de soluciones que proporcionen un valor disruptivo en este contexto, desde el convencimiento de la aplicabilidad de las tecnologías y métodos de la Analítica de Datos y de Big Data para mejorar de un modo notable los procesos de toma de decisión en este sector.

Nuestro proceso, que planteamos con el rigor y la atención al detalle que entendemos imprescindible, (y que metodológicamente podría ser empleado para el análisis de requisitos y modelado del proceso necesario para otros escenarios en diferentes sectores con diferentes objetivos), pasa por los siguientes hitos:

  • Identificación del valor final objetivo que podemos considerar como el objetivo último del ejercicio. En este caso concreto: “conocer la movilidad de los ciudadanos de un área urbana específica”. Nuestro trabajo requiere convertir este objetivo en un modelo funcional y tecnológico, que, como resultado, nos permita entregar un servicio que se pueda identificar con “conocer la movilidad de los ciudadanos” de esa área concreta.
  • Identificar, desde la experiencia y el conocimiento profundo y profesional del sector, las herramientas que serían capaces de proporcionar este servicio. En nuestro caso, se trataría de generar una matriz “O/D” (origen/destino) de la movilidad de los ciudadanos de esa área, con el mayor detalle posible.
  • Análisis de los datos y tipos de datos que el entregable objetivo debe incluir. De nuevo la experiencia y el conocimiento de este sector nos indicarán con exactitud los mínimos y óptimos a cubrir (sexo, situación socio-económica, motivo del desplazamiento, punto de origen y destino, coste del desplazamiento…).
  • Identificación de los diferentes modos y canales para obtener esos datos de la manera más sencilla, efectiva, exacta y amplia posible. Estamos trabajando en diferentes mecanismos y modelos para que los datos básicos necesarios estén disponibles para acometer el proceso de analítica y extracción del valor objetivo, y es en esta fase del proceso donde empezamos a identificar que al menos las tres “Vs” básicas de un escenario de Big Data se comienzan a concretar al respecto de los datos que anticipamos recopilar sobre la movilidad de los ciudadanos: Volumen, Velocidad y Variedad.
  • Identificación de los métodos y modelos que deberemos emplear para analizar estos datos y obtener los resultados esperados. Nuestros procesos de estudio y análisis, sobre los avances que se han alcanzado al respecto de estos puntos anteriores en los últimos meses, nos permiten ser razonablemente optimistas sobre la aplicabilidad de potentes y modernos métodos de Aprendizaje de Máquina (Machine Learning), la Minería de Datos (Data Mining) e Inteligencia Artificial (Artificial Intelligence) para extraer de éstos las respuestas a nuestras preguntas. Los datos recopilados son apropiadamente combinados con otras fuentes de información externas nos ayudan a responder las cuestiones anteriores alcanzando nivel de precisión muy altos
  • Análisis, arquitectura y diseño de la infraestructura tecnológica necesaria para soportar todo el procesamiento necesario. Este entorno deberá apoyarse de manera inexorable en una capacidad de almacenamiento, cómputo y presentación muy elevadas, escalables y seguras, para lo que nos apoyaremos en soluciones tecnológicas cloud del más alto nivel.

En definitiva, podemos avanzar que estamos creando el germen de un proyecto de Big Data y Analítica disruptivo e innovador que esperamos pueda representar una aportación relevante a este sector y servir como un ejemplo más de la aplicabilidad de las técnicas más innovadoras en la recopilación, procesamiento y análisis de los datos para generar valor.

Bueno, esta es la opinión de los expertos consultados y ahora que sabes Qué es Big Data, te animo a que comentes cual es tu visión .

Además, te recuerdo el mensaje que da el consultor de negocios en Big Data, análisis y rendimiento empresarial y exitoso autor, Bernard Marr explica en Forbes.com :

.

Marr sentencia diciendo, “la pregunta no es si el Big Data ha llegado para quedarse; la pregunta es si estás listo para ello”. ¿Y tú? ¿Estás listo?

Como ves, algunos ya nos estamos poniendo en primera línea en Big Data en el campo de la movilidad.

Opt In Image
¿Quieres saber más sobre Movilidad?
¡Estás en el lugar indicado!

Únete al grupo de Movilidad y Transporte y forma parte de la red que sigue creciendo en España y Latinoamérica.  Sólo por suscribirte recibirás contenidos GRATUITOS sobre Movilidad Sostenible y Sistemas de Transporte.