Sevilla, España.
[dropcap style=»default, circle, box, book»]C[/dropcap]on este artículo iniciamos una serie dedicada a mostrar los errores más comunes que se cometen en los estudios de movilidad debidos en gran medida a la falta de formación matemática y así como a los a los procesos de simplificación que muchas veces se aplican por falta de presupuestos. A continuación, expondremos esos problemas y revelaremos el método para lograr un proceso de elaboración de estudios de movilidad más rigurosos. Son, en definitiva, los “False friends” a la hora de hacer este tipo de estudios y con los que tenemos que tener especial cuidado. Los temas que trataremos en esta serie serán:
- Este primero de errores muestrales y sesgos en el diseño de las encuestas. Cuando tenemos que realizar una encuesta en una ciudad, por ejemplo, es imposible preguntar a todos los habitantes de la misma, sino que para facilitar el proceso tendremos que seleccionar una muestra de dicha población, que sea significativa a la hora de obtener resultados. La elección de los encuestados por tanto debe hacerse correctamente, aunque eso no siempre ocurre, como explicaremos.
- Determinación de matrices Origen-Destino. Es muy importante determinar el tamaño de dicha matriz en función de la muestra seleccionada para llevar a cabo la encuestación. Un error muy típico es construir una matriz de 100*100 casillas, o sea 10.000 celdas, con una encuesta a 2.000 individuos solo expandiéndola. Ya veremos qué otros errores se cometen y cuál es la solución. No os preocupéis que también explicaremos los conceptos básicos, no olvidamos que nuestro blog es para todos los públicos o queremos que así lo sea.
- Elasticidades de los que no pagan. Se ha estudiado muy bien qué pasa si en el transporte público se sube la tarifa general de 1 a 1,2 euros. Podemos determinar con cierta precisión qué pasa si se sube el 20%, qué efecto tendría en la demanda, cuanta gente dejaría de usar el transporte público. Pero hay tarifas sociales para determinados grupos, por ejemplo de la tercera edad, que a veces son gratis. ¿Qué pasa si se sube esa tarifa de 0 euros a 20 céntimos? Estos efectos no están bien estudiados y las técnicas son muy complejas. Nosotros las aclararemos.
- ¿Cómo es la movilidad de festivos? Muchas veces se diseñan las ofertas (las líneas, los recorridos, las frecuencias, etc.) de transporte en el supuesto de que la movilidad de fines de semana es la misma que en días laborables, pero un poco más reducida. Como si los motivos, los orígenes y destinos y los horarios fueran los mismos. Craso error que también explicaremos.
Estos artículos los escribo con José Javier Muruzabal, Dr. Ingeniero de Caminos, Canales y Puertos y profesor de estadística de la Universidad Politécnica de Madrid.
Algunos conceptos básicos
En los estudios de movilidad se usan técnicas estadísticas y modelos de simulación que no son mas que herramientas matemáticas que permiten evaluar escenarios de futuro o de actuación. Es decir, permiten hacer previsiones de los efectos que pueden producir algunas medidas o el paso del tiempo. Para ello es necesario disponer de buenos datos, pero como los presupuestos son reducidos, no es posible investigar a toda la población (llamado en estadística, Universo) sino a unos cuantos individuos representativos elegidos adecuadamente (muestra).[pullquote align=»left»]Para desarrollar estudios de movilidad, es necesario disponer de «buenos» datos representativos de la población[/pullquote]
Para que seamos conscientes del problema, os damos unas cifras: realizar una buena encuesta a un solo individuo en su domicilio, puede costar entre 5-10 euros (incluye costes de organización, grabación de datos, depuración, no vayas a querer cambiar de oficio pensando en que un encuestador gana por encuesta eso). En Madrid, la ultima encuesta domiciliaria de movilidad se hizo a 75.000 personas, así que calculad lo que costó. Éste es uno de los motivos por los que solo se encuesta a una muestra de la población, asumiendo un cierto error que se debe minimizar. Es común hablar de más o menos un 5% de error global con un intervalo de confianza del 95%. Pero no entraremos en estos detalles, ya daremos un curso sobre la materia. veamos qué errores se comenten.
¿Qué criterios debe seguir la elección de la muestra?
En una Encuesta Domiciliaria de Movilidad (en adelnate, EDM) se investiga la movilidad de las personas, por lo que se muestrean personas, con técnicas estadísticas que pretenden acotar el error en la estimación del número de viajes de cada zona de transporte.
La muestra está constituida, por tanto, por una parte de la población y para que sea válida ha de ser una muestra denominada en estadística “aleatoria simple”, lo que implica dos condiciones:
- Todos los individuos de la población deben tener la misma probabilidad de ser seleccionados para formar parte de la muestra
- La elección de un determinado individuo no debe condicionar cuál es el siguiente individuo a seleccionar
Por otra parte, la muestra ha de cumplir dos características:
- Debe ser suficiente, es decir, debe implicar un error asumible (y prefijado, por ejemplo el 5% que hemos comentado antes) en las estimaciones del universo que se infieren a partir de ella
- Debe ser representativa, es decir, debe carecer de sesgos. Por ejemplo, uno muy usual es que si la encuesta domiciliaria se hace por las mañanas se encuestan fundamentalmente a amas de casa y personas de la tercera edad jubiladas. Esto es un sesgo.
¿Cuáles son los sesgos que se producen en una Encuesta Domiciliaria de Movilidad (EDM)?
Los sesgos son prácticamente imposibles de evitar en toda investigación muestral. Lo importante es saber reconocerlos y corregirlos en la expansión; en caso contrario se incurriría en lo que Estadística se denomina error tipo II (aceptar como válida una hipótesis falsa), lo que podría inducir a graves errores.
En una Encuesta Domiciliaria de Movilidad (en general) puede haber dos tipos de sesgos:
- Sesgos en la selección de hogares
- Sesgos por hogares incompletos
Nos centraremos en el primer caso en este artículo. Como ya hemos apuntado, en una EDM Se deberían muestrear, o sea, seleccionar, personas. La movilidad depende del tipo de persona: no es lo mismo hombre que mujer (estas suelen usar mas el transporte público). Tampoco es lo mismo una persona en situación de desempleo que una persona activa laboralmente, que se mueve más generalmente. Pero por una cuestión de costes se muestrean hogares (así se seleccionan los individuos de la muestra no de uno en uno sino de tres en tres, lo que representa una reducción significativa de costes).
En las antiguas Encuestas Domiciliarias de Movilidad presenciales (ibas a la casa a encuestar, ahora no te abre nadie en Europa, al menos) la representatividad se obtenía realizando una selección aleatoria (es decir, al azar, para evitar sesgos que comentábamos) a partir del censo de población en cada área en que se dividía la ciudad.
En una telefónica (única forma de hacerla realmente viable en la actualidad en países desarrollados) la muestra está constituida por una selección aleatoria de números de teléfono de hogares de cada zona de transporte (existen empresas que facilitan esa información a partir de bases de datos que se han construido de la mayor parte de ciudades europeas).
¿Y cómo se resuelven estos problemas de sesgos?
Estas son las claves:
- Elección verdaderamente aleatoria de la muestra, repetimos, al azar.
- Ejercer un control adecuado sobre la estratificación de la muestra. Estratificar es repartir la muestra entre grupos de población (según variables censales, como sexo, edad y tamaño familiar).
- Controlar la evolución durante la encuesta de variables como, , el número medio de personas entrevistadas por hogar o distribución de los encuestados según número de viajes diarios. Así vemos el esfuerzo que están haciendo los encuestadores y la calidad del trabajo.
Con estas 3 claves evitaremos caer en los errores típicos (sesgos o desviaciones) en la elección de la muestra, logrando un diseño adecuado del proceso de expansión (entendido como el paso de la muestra al total de la población) que reproduzca el universo y sus diferentes grupos de población o áreas estudiadas.
Como se ve, se trata de un problema que parece simple, pero requiere de expertos en la materia para hacerlo con rigor. Ahora os animo a que preguntéis las dudas o discutáis los principios expuestos si lo consideráis.
Este artículo ha sido escrito con José Javier Muruzábal, Doctor Ingeniero de Caminos y Socio-Director General de TÁRYET.