viernes, 31 de enero de 2014

Las encuestas, sus errores y su interpretación: el caso de la EPA

En este post vamos a hablar sobre encuestas, y de como interpretar los resultados que aparecen en las mismas. Tomaremos como ejemplo la Encuesta de Población Activa (EPA), y veremos cómo se pueden obtener no únicamente estimaciones de tipo puntual (es decir con un único valor), sino también con una horquilla de valores (lo que se denomina un intervalo de confianza).

Aunque ha sufrido diferentes críticas, la EPA es casi seguro, la mejor encuesta que se hace en España. Como tal encuesta, permite, entrevistando a una parte muy pequeña de la población, estimar con precisión datos económicos de interés. 

Los encuestadores del INE completan personalmente o por teléfono un cuestionario amplio para describir la situación personal y las pretensiones y cualificaciones de cada persona del hogar. La encuesta gira cada trimestre sobre 65.000 hogares y 180.000 personas seleccionadas de entre 3.600 secciones censales de las 30.000 en las que divide España.


Ahora bien, las encuestas no son mágicas, y no permiten calcular exactamente cuantos ocupados o parados tenemos, sino únicamente estimar de forma aproximada. Toda encuesta tiene errores, ya que se estudia una muestra, y no toda la población.


En los medios de comunicación y en dicho informe, se tiene que el número de ocupados se ha estimado en 16.758.200 personas. Los márgenes de error pueden ser consultados a partir de las tablas del INE. Veáse que el error de muestreo que se tiene para este trimestre es del 0.38%, por lo que se puede decir que:

  • El número de ocupados estimado a nivel nacional es de 16.758.200 personas, con un error de muestreo estimado de 0.38% (63.681 personas). 
  • Si se desea estimar con un intervalo de confianza (al 95%), es decir, estimar dando una horquilla de resultados, se tiene que el margen de error para dicha horquilla a un nivel de confianza del 95% es de (2 x 63.681) = 127.362 personas.  
  • Por tanto, tenemos una confianza del 95% en que el verdadero número se encuentra en el intervalo (redondeando) entre 16.630.838 y 16.885.562 personas (es decir, 16.758.200 ± 127.362)

Cuando se comenta y se escribe de una encuesta, a la hora de expresar los resultados, se suele utilizar únicamente un valor de la horquilla de datos que se han estimado. 

Ahora bien, cuando esos datos se usan para hacer comparaciones entre diferentes momentos en el tiempo, hay que tener en cuenta el margen de error, ya que no se puede certificar que lo que vemos como aumentos/descensos en el número de ocupados, sea real, o sea simplemente resultado del azar. 

Analizamos esta idea a continuación: 

Cuando se trabaja con datos del tercer trimestre de 2013 se habla de un total de 16.823.200 ocupados y la estimación al 95% de confianza es de un total de ocupados entre 16.698.708 y 16.947.672 personas (el error de muestreo es del 0.37% en este trimestre).
En el gráfico, podemos observar la evolución de la serie de ocupados en el último trimeste de 2012 y todo 2013 (en azul), junto con los valores de las horquillas (en rosa los intervalos de confianza).
 
En la comparativa entre el cuarto y el tercer trimestre en el número de ocupados se habla de una bajada de la ocupación de 65.000 personas. No obstante, hay que tener en cuenta que esta estimación proviene de una encuesta y como tal, tiene un margen de error, que es de 127.362 personas. 

 Así, en realidad, con una bajada tan pequeña en la comparativa entre trimestres, y teniendo en cuenta ambas horquillas en la estimación, no se puede afirmar categóricamente que han bajado los ocupados del tercer al cuarto trimestre, ya que el número de ocupados podría hasta haber aumentado.

Si se realiza un análisis análogo para el cuarto trimestre de 2012 para llevar a cabo una comparativa interanual, y teniendo en cuenta que el error de muestreo que se tiene para ese trimestre es también de 0.38% se tiene que: 

El número de ocupados estimado a nivel nacional es de 16.957.100 personas, con un error de muestreo estimado de 0.38% (64.437 personas). El margen de error para un intervalo con un nivel de confianza del 95% es por tanto de (2 x 64.437) = 128.874 personas.  Por tanto, tenemos una confianza del 95% de que el verdadero número de ocupados se encuentra en el intervalo (redondeando) entre 16.828.226 y 17.085.974 (es decir,  16.957.100 ± 128.874).
Comparando las series interanulaes, se tiene una bajada de 16.823.200 - 16.957.100 = 198.900 personas, valor que ya se sale fuera de los márgenes de error de la encuesta, lo cual nos permite afirmar, que efectivamente, sí se ha producido una caída en el número total de ocupados en 2013.

1 comentario:

  1. Hola, feliciades por el articulo. He de interpretar entonces que bajo vuestro ptonde vistabes arriesgado como ofrecen los datos los medios y se interpretan por los gobiernos sin las matizaciones adecuadas que proporcioan los errores asumidos????

    ResponderEliminar