APRENDIENDO A MUESTREAR

Jorge AndradeESTADISTICALeave a Comment

En el año 2000 trabajaba como director de proyectos especiales en Pearson S.A. de C.V. una de las principales agencias de investigación en México y estaba encargado de los estudios de opinión que se hacían para el PRI (Partido Revolucionario Institucional); el último proyecto que hicimos ese año para este partido fue un conteo rápido o quick count que se utiliza para conocer los resultados de una elección, muchas horas antes de que se den las cifras oficiales, y el PRI deseaba conocer con anticipación al ganador de la elección para Presidente de la República Mexicana.

Este proyecto era sin duda el más grande y complejo y representaba la culminación de bastantes meses de trabajo y desvelo. El concepto de un conteo rápido es simple pero la metodología y la logística que implican son otra cosa; así que mi jefe por aquel entonces Manolo Barberena siguió el consejo de los Beatles “with a little help from my friends” y decidió que viéramos a Roy Campos. Las técnicas “quick count” y “exit poll” fueron desarrolladas por Warren Mitofsky de los Estados Unidos de Norteamérica y en México se dieron a conocer por el Dr. Roy Campos de la empresa Consulta Mitofsky, así que quién mejor que él para explicarnos.

Roy nos habló con bastante apertura sobre los puntos más importantes de un conteo rápido, nos comentó de la necesidad de ponderar (en algún otro post te hablaré de ponderación), del call center, sobre las secciones electorales, el conteo de votos, la forma en que recibiríamos los resultados, entre otros muchos aspectos pero lo que nos explicó sobre muestreo y el programa que usaba para obtener sus muestras fue lo que sin duda captó más nuestra atención. El programa podía seleccionar muestras aleatorias mediante un muestreo sistemático estratificado por conglomerados (sé que suena fuerte esto pero aguántate tantito y ahorita vas a ver que no es tan pantera como parece). Salimos de las oficinas de Roy mucho más confiados y por supuesto agradecidos por el “quick count for dummies” que nos acaba de dar y no recuerdo si Manolo le preguntó a Roy si vendía su programa de muestreo pero a mi sí me lo comentó y le respondí que era un magnifico programa pero que no era algo muy difícil de hacer y me acuerdo que me preguntó ¿Tú sabes hacer eso? Le dije que sí y después de eso me envío a un curso sobre muestreo a los Estados Unidos, cosa por la que yo también le estoy muy agradecido. ¡No te preocupes! no pienso contarte como me fue allá, voy ir directo al grano sobre cómo hacer un muestra para un estudio político. Sin embargo, sí te voy a pedir que leas a pierna suelta para que no se te haga densa la explicación.

Para fines electorales, México se divide en poco más 64,000 secciones y 300 distritos electorales dentro de los 32 Estados, incluyendo al Distrito Federal; las secciones electorales son de tres tipos: rurales, mixtas y urbanas y están compuestas por un número de electores que puede ir de 50 a 1500. La información sobre las secciones electorales es básica porque es la que se usa para sacar la muestra de tu estudio político ya sea éste un quick count, exit poll, preferencia electoral o cualquier otro.

Supón que sólo tienes 10 secciones electorales y hay únicamente 3 partidos políticos PAN, PRD y PRI; asimismo, tienes los resultados de la última votación por partido político en cada una de esas secciones. Si yo te pidiera que extrajeras una muestra al azar del 30%, o sea 3 secciones de las 10 que tienes para estimar como votaron los electores ¿cómo le harías para darme la mejor muestra o la más exacta? La forma más sencilla de hacerlo es, como en la escuela, elaborar 10 papelitos, cada uno de ellos con el número de una sección electoral distinta, doblarlos, meterlos en un recipiente, revolverlos y luego extraer 3 de ellos; a eso se le llama muestreo aleatorio simple y la única condición es que obtengas al azar tus secciones donde vas a ir a levantar tus entrevistas o a hacer el quick count. Ahora ¿qué tan exacta crees que puede ser tu muestra? para responderte necesito que veas el cuadro de abajo en él vienen nuestras 10 secciones electorales imaginarias y los resultados por partido.

Muestreo de estudios políticos

Como puedes observar en la tabla anterior el PAN tiene un 37% de los votos totales, el PRI el 43% y el PRD el 13%; imagina que las secciones que obtuviste al azar en tu muestreo aleatorio simple fueron la 3, 5 y 6, si sumas los resultados de esas secciones y obtienes el porcentaje total de votos de cada partido te darás cuenta que es totalmente inexacta tu muestra: el ganador es el PAN con 41% de la votación y no el PRI con el 39% aunque el PRD obtiene el mismo resultado (ve la tabla de abajo).

Muestreo aleatorio simple de estudios políticos

El truco para obtener una muestra más exacta es utilizar otro tipo de muestreo que se llama sistemático o de salto sistemático con un arranque aleatorio y hacerlo con base a la diferencia de votos que hay entre los principales partidos políticos; es decir, aquellos que captan el mayor número de votos, en este caso el PAN y el PRI. El procedimiento es simple, réstale los votos del PAN al PRI en cada sección y ordena las secciones electorales de menor a mayor o a la inversa, después obtén el salto sistemático mediante la fórmula “N/n” donde “N” es igual al número de secciones electorales y “n” es igual al tamaño de tu muestra; si tienes 10 secciones y el tamaño de tu muestra es de 3, entonces el salto sería de cada 3.33 secciones (no te fijes en los decimales y piensa que el salto sería de cada 3 secciones); posteriormente, saca un número al azar entre el 1 y el 10 o sea de entre el total de secciones, supón que obtuviste el 2, allí es donde debe empezar tu muestra y seleccionar la siguiente sección electoral cada 3 secciones como dice tu salto. Las secciones “afortunadas” son la 8, 5 y 2, como en la tabla de abajo.

Muestreo de estudios políticos por diferencias

Confío que hasta aquí no te hayas perdido. Lo único que hicimos fue ordenar por diferencia y seleccionar las secciones de acuerdo a ese orden, aunque debes ser observador y darte cuenta que con este método se seleccionan de forma automática las secciones electorales que tienen mayor y menor diferencia de votos así como las intermedias. En estadística a eso se le llama reducir varianza, y ese es el truco, una muestra será más exacta en la medida en que reduzcas la varianza. Mira la tabla siguiente y dime si los resultados no son más exactos: PAN (38%), PRD (12%) y PRI (44%).

Muestreo sistemático de estudios políticos

!Un momento¡ ¿Puedes hacer el muestreo más exacto? Claro, si conoces que variables influyen en la forma de votar de los electores. Por ejemplo, dijimos que hay secciones urbanas, mixtas y rurales y sabes que la gente del campo no vota igual que la de las ciudades o de las zonas semirurales (mixtas), entonces lo que tienes que hacer es dividir tus secciones en rurales, mixtas y urbanas y obtener una muestra de cada una de ellas de acuerdo al tamaño que representan; en otras palabras, si necesitas una muestra de 100 secciones electorales y sabes que el 60% son urbanas, el 10% mixtas y el 30% restante rurales tu muestra tendría que ser de 60 secciones urbanas, 10 mixtas y 30 rurales a ese procedimiento se le llama estratificar; así que tu muestra sería sistemática y estratificada, pero ¿y de dónde viene la fama de conglomerados? bueno, desde el momento en que seleccionas secciones electorales y no personas estás hablando de conglomerados aunque esos conglomerados pueden irse haciendo más y más pequeños. Cómo cuando seleccionas estados, luego dentro de los estados secciones y dentro de las secciones manzanas decimos que fue muestreo polietápico de 3 etapas y como dice el buen Aleks Syntek Sha-la-la, Sha-la-la, Sha-la-la.

Ya sólo para resumir y no quedarme con las ganas de contarte otra asúntacho. Efectivamente, se usan los datos de las elecciones pasadas para obtener la muestra para el siguiente estudio, si es para presidente pues usa esos resultados, si es para cámara de representantes usa los correspondientes a las elecciones de diputados y senadores; obtén varias muestras con el procedimiento que te describí compáralas entre si y la muestra que mejor pronostique o sea más exacta esa es la que debes utilizar.

¡Perdón! un último asunto y ya con ese cierro, lo prometo ¿Qué tan exactos son los resultados de un conteo rápido (quick count)? Déjame decírtelo de esta forma, cuando tuve que entregar la base de datos a nuestro cliente el PRI, me dí cuenta que había cualquier cantidad de errores de captura; muchos errores quiero decir, lo cual es comprensible por la rapidez con la que se deben entregar los resultados; y sin embargo, el resultado que dimos fue extremadamente preciso, muy parecido al de otras agencias. Ese mismo día alguien me comentó y que me perdone pero no recuerdo su nombre, que con semejante tamaño de muestra nadie, ninguna agencia podía equivocarse; por eso, hasta el día de hoy me preguntó ¿por qué en el 2006 una agencia, que fue la única que dio resultados a la opinión pública del exit poll que hizo con una mega muestra de votantes, se “equivocó” y dijo que el ganador de las elecciones presidenciales era el candidato del PRD? La verdad, esa agencia necesitaría haber hecho las cosas con las patas para haberse equivocado con semejante tamaño de muestra; no lo sé, igual y sí, o ¿tienes alguna hipótesis alternativa?

Cualquier comentario es bienvenido, hasta la próxima.

¡Compártelo a tus amigos(as)!...Tweet about this on TwitterShare on LinkedInShare on FacebookShare on Google+Email this to someone
Jorge AndradeAPRENDIENDO A MUESTREAR

Leave a Reply

Your email address will not be published. Required fields are marked *