Tag Archives: conteo rápido

INSTRUMENTOS DE CONFIANZA

Se dice que la ONU hizo una encuesta a nivel mundial sobre alimentación y en ella se obtuvo una cantidad muy pequeña de respuestas en la pregunta clave, la cual era: “Dígame, por favor, con toda honestidad, su opinión sobre la escasez de alimentos en el resto del mundo”. Debido a esta baja tasa de respuesta los investigadores se pusieron a indagar qué es lo que había fallado en el estudio y descubrieron que la gente no había respondido a esa pregunta porque no la entendieron. Los argentinos sencillamente no entendieron qué era “por favor”, lo mismo les pasó a los cubanos con la palabra “opinión”, a los europeos con “escasez”, a los africanos con “alimento”, a los norteamericanos con “resto del mundo” y a los mexicanos…bueno allí todavía se sigue debatiendo en la cámara de diputados que es honestidad.

Creo que ningún tipo de estudio genera más polémica en México que las encuestas sobre las preferencias electorales. Cómo decía el chavo del ocho las hay de limón que parecen de jamaica pero con sabor a tamarindo ¿Están bien hechas? ¿Se hicieron de verdad? ¿Su metodología es correcta? ¿Están copeteadas? etcétera. Pos quién sabe. Creo que eso sólo lo saben algunos de los involucrados, llámense encuestadores, partido y/o empresa que encargó la encuesta, agencia de investigación, entre otros pero de lo que si estoy casi seguro es que el público en general no tiene ni la más remota idea de cómo se hacen. Este post es una explicación breve para ese público que desea conocer un poco más sobre el tema sin que tenga que esperar a que los diputados terminen de debatir sobre él. Así que comencemos.

A parte de los estudios en los cuales te preguntan: “Si el día de hoy fueran las elecciones ¿por cuál de estos candidatos o partidos votaría usted?”, existen otras herramientas demoscópicas, o sea que se emplean para evaluar aspectos de una democracia, entre los más comunes están:

1. Encuesta de salida o exit poll.
2. Conteo rápido o quick count.
3. Monitoreo de medios electrónicos (televisión y radio).
4. Análisis de prensa.

Paso a explicar brevemente el primero. Una encuesta de salida se hace el mismo día de las votaciones, en ella los encuestadores esperan a que el elector emita su voto, una vez que éste se retira se le intercepta y se le pregunta si votó, por quién lo hizo, cómo decidió su voto, entre otros datos sociodemográficos. Cómo comprenderás estos datos tienen que ser capturados a la voz de ya para que los partidos, el IFE o quien haya encargado el estudio pueda tener una idea de cómo se perfilan los resultados de la votación, es decir, antes de que ésta concluya. Este tipo de estudios pueden ayudar a saber cómo se votó por sexo, edad, estatus socioeconómico, la forma en que el votante decide su voto (lo hizo el mismo día, ya lo tenía pensado, etc.), esos datos, por supuesto, no los puedes obtener revisando o contando únicamente los votos que es lo que se hace en un conteo rápido. En general, si el estudio estuvo bien levantado y la muestra es probabilística (al azar pa’que me entiendas) y suficientemente grande el resultado va a coincidir con las cifras del IFE (Instituto Federal Electoral) en su famoso PREP (Programa de Resultados Electorales Preliminares) si no sucede así la encuesta es una porquería, el IFE miente o las fuerzas oscuras de Darth Vader están actuando otra vez.

encuesta de salida

El conteo rápido. Este estudio es más simple que la encuesta de salida, sin embargo, los investigadores tenemos aquí más presión pues los resultados se tienen que obtener en un lapso de tiempo menor. En general, el asunto se desenvuelve así. Los encuestadores esperan a que se terminen las votaciones y que los representantes de casilla cuenten los votos y peguen las mantas donde dan a conocer al público en general los resultados de su votación en su sección electoral, en ese momento el encuestado anota los resultados y los transmite a la agencia de investigación mediante señales de humo, jajaja, mentira, lo hace por teléfono, principalmente (¿se utilizarán dispositivos móviles en esta elección?), la agencia captura en sus sistema esta información y la procesa para estimar el resultado a nivel general. Cabe señalar que al igual que en la encuesta de salida se emplea una muestra de secciones electorales.

prep ife

En ambos tipos de estudios hay un par de aspectos claves que debo subrayar: la muestra y la ponderación de datos. En el primer caso cada agencia tiene su propio algoritmo (método matemático) de muestreo el cual varía en exactitud; sin embargo, dado que las muestras son muy grandes es poco probable que se obtengan resultados diferentes. Te pongo un ejemplo para que me entiendas, en el conteo rápido los datos se capturan a una velocidad vertiginosa lo que ocasiona una cantidad más o menos importante de errores no obstante la muestra es tan grande que estos tienden a anularse dando como resultado un estimador muy preciso. Suena curioso que un estudio tan grande se deba ponderar ¿verdad? pero no lo es tanto si tomas en cuenta que la gente de diversas regiones vota de manera distinta y dado que vas contra reloj algunos datos de esas regiones no se alcanzan a completar en la encuesta de salida o conteo rápido lo cual debes equilibrar utilizando el método de ponderación. Contrario a lo que puedes pensar la ponderación no cambia de manera importante los datos pero si los afina.

Seguramente, has escuchado que tal candidato o partido ya rebasó los topes financieros de campaña que estipula el IFE ¿Qué les da valor a los que dicen eso? Bueno, se fijan en las actividades de promoción, publicidad y propaganda que hacen dichos candidatos o partidos y evalúan más o menos lo que cuesta pagar por esas actividades. El IFE hace una cosa similar aunque se concentra básicamente en la televisión y la radio, es a lo que llama monitoreo de medios electrónicos. La idea es grabar noticiarios de televisión y radio y de allí codificar las veces que aparece cada uno de los candidatos o partidos, el tratamiento que se les da, es decir, si aparecen en imágenes cerradas, abiertas, de archivo, en vivo, el tiempo total en que aparecen, entre otros asuntos. La idea es que debe haber un trato equitativo por parte de los medios electrónicos a los candidatos y partidos. Por supuesto que no se pueden grabar todos los noticiarios del país por lo cual se emplea también una muestra de ellos. La obligación del IFE es mostrar los resultados de este monitoreo a la sociedad así como la metodología empleada. Quizá hablo sin fundamento pero tengo entendido que en las últimas elecciones no le han salido muy bien las cosas al IFE en este renglón.

¿Qué se hace en el análisis de prensa? La intención es inferir la opinión pública a través de las notas periodísticas para esto se recopilan diariamente las notas sobre los candidatos o partidos o cualquier otro asunto que nos interese que aparecen en los principales diarios; dentro de cada nota se codifican los mensajes, se les asigna una calificación y se agrupan por temas; hay otras variables que también se revisan pero desde mi punto de vista son menos importantes: el periodista, periódico que publicó la nota, tamaño de la nota en cm2, entre otros. Una vez hecho lo anterior se procesa la información y se pondera por la lectoría (porcentaje de personas que leen cada medio donde apareció la nota), nuestro resultado final mostrará qué temas son de los que se habla más, cuáles son los mensajes dentro de esos temas, cuánto tiempo están vigentes en la prensa y si son negativos o positivos.

Ahora si, vámonos con los estudios donde te preguntan por quién vas a votar, éstos pueden tener 2 propósitos:

a. Conocer quién va arriba en la preferencia electoral. Por mucho este es el tipo de encuestas que más se hacen en una campaña electoral y son con las que te bombardean los medios un día si y al otro también. En la farándula de la investigación de mercados se les nombre carrera de caballos.

b. Sentar las bases de una estrategia para la campaña electoral de un candidato y/o partido. Este estudio normalmente se hace antes de iniciar la campaña pues te ayuda a determinar la cantidad de votos que necesitas, de donde obtenerlos, bajo que ofrecimientos, quienes son tus votantes seguros, probables, entre muchos otros aspectos.

¿La diferencia entre uno y el otro? Déjame ponerlo en estos términos; si te fajas a un(a) chavo(a) sin decirle si quiere ser tu novio(a) entonces es como si estuvieras haciendo un estudio del tipo “a”, como quién dice “a lo que te truje Chencha” (traducción: vamos a hacer aquello para lo que te traje Vicenta) por el contrario si le pides que sea tu novio(a), también te lo(a) vas a agasajar pero tienes otros planes en mente. Seguramente, le vas invertir más tiempo y recursos a tu estudio, lo que se traduce en una muestra y cuestionario más grandes. No obstante estas diferencias, en ambos tipos de estudios las preguntas típicas a los posibles votantes son:

1. Qué tanto conocen a cada uno de los candidatos.
2. Qué imagen tienen de los candidatos o partidos.
3. Qué problemas hay en su comunidad, estado y/o país.
4. Cómo evalúan las propuestas de campaña, slogans, frases, etc.
5. Por cuál partido o candidato piensan votar.
6. Cuál es su edad, sexo, nivel socio-económico, estado civil, etcétera.

Para cada una de esas preguntas ya hay estándares muy bien establecidos sobre como plantearlas por lo que la mayoría de las empresas se parecen en este punto; sin embargo, donde si hay diferencias, y donde los cocólazos se ponen de a peso, es en la forma de procesar los resultados de esas encuestas. En particular me voy a referir a 2 cuestiones. La primera es sobre los que dicen las agencias de investigación de opinión pública son los que van a votar pero que al final no votan (probables votantes) y la segunda se refiere a los que dicen que no van votar y al final si votan (los indecisos), la forma en que se tratan y clasifiquen unos y otros hace la diferencia en el resultado.

Primer caso. Es obvio que para votar debes tener credencial de elector actualizado de la sección electoral donde dices que vas a votar y donde te están haciendo la encuesta. La primer pregunta que surge aquí es ¿cómo le hacen las empresas que realizan sondeos de opinión por teléfono para verificar esto? Hay va otra un poco menos obvia, ¿Cuál es la probabilidad de que vayas a votar en estas elecciones si en otras ocasiones no has votado? ¿No sabes? yo te lo digo, la probabilidad es baja. Por esa razón algunas empresas le hacen la pregunta al individuo acerca de si fue a votar durante las elecciones pasadas. Si pasas estos 2 filtros entonces es posible que si vayas a votar ¿La última vez que te hicieron una encuesta política recuerdas si te preguntaron si habías votado anteriormente? Si no fue así, entonces ya tienes un argumento para desacreditar esa encuesta.

Segundo caso ¿Qué hacen las agencias de investigación con los sujetos que dijeron no saber por quién iban a votar o no dieron respuesta? Algunos empresas los eliminan democráticamente como en las últimas encuestas donde dicen que 52% votará por Enrique Peña Nieto, el 23% por Josefina Vázquez Mota y el 21% Por Andrés Manuel López Obrador ¿Es verdad que no van a votar? Por supuesto que no. Si ya te dijeron que tienen credencial y han votado anteriormente entonces si lo van a hacer en esta ocasión pero el asunto es saber por quién. Esta parte es la que genera mayor escozor pues cada quien tiene su forma de matar las pulgas y es difícil saber qué algoritmo de clasificación de indecisos funciona mejor. Aquí te dejo un artículo sencillo para que te des una idea más precisa de lo que estoy hablando.

José Woldenberg, decía en el libro, “La Construcción de la Democracia” que “Las encuestas electorales bien hechas, las que se despliegan con profesionalismo y sentido ético, no son sólo ni principalmente un reto técnico, un logro de la estadística o de la ciencia de la demoscopía; las encuestas de calidad son todavía más importantes porque su concurrencia en el escenario político es parte de una empresa mayor: del enorme reto de construir confianza.” ¿Qué tan lejos estamos de crear instrumentos de confianza? La tecnología desde hace mucho tiempo ya no es problema tampoco creo que lo sean los profesionales capacitados para hacer buenos estudios ¿Entonces qué está fallando? La sociedad. No aquélla que vemos como independiente o ajena a nosotros sino donde estás tú, yo, él, nosotros, todos y no se trata de ir a votar, desde mi punto de vista eso es irrelevante, se trata de informarnos, de declararle la guerra a nuestra ignorancia, de ser mejores seres humanos y de que dejemos de hacernos los occisos fingiendo que no sabemos de qué se nos habla cuando nos mencionan “honestidad”.

Hasta la próxima y nuevamente muchas gracias por aguantarnos y leernos.

APRENDIENDO A MUESTREAR

En el año 2000 trabajaba como director de proyectos especiales en Pearson S.A. de C.V. una de las principales agencias de investigación en México y estaba encargado de los estudios de opinión que se hacían para el PRI (Partido Revolucionario Institucional); el último proyecto que hicimos ese año para este partido fue un conteo rápido o quick count que se utiliza para conocer los resultados de una elección, muchas horas antes de que se den las cifras oficiales, y el PRI deseaba conocer con anticipación al ganador de la elección para Presidente de la República Mexicana.

Este proyecto era sin duda el más grande y complejo y representaba la culminación de bastantes meses de trabajo y desvelo. El concepto de un conteo rápido es simple pero la metodología y la logística que implican son otra cosa; así que mi jefe por aquel entonces Manolo Barberena siguió el consejo de los Beatles “with a little help from my friends” y decidió que viéramos a Roy Campos. Las técnicas “quick count” y “exit poll” fueron desarrolladas por Warren Mitofsky de los Estados Unidos de Norteamérica y en México se dieron a conocer por el Dr. Roy Campos de la empresa Consulta Mitofsky, así que quién mejor que él para explicarnos.

Roy nos habló con bastante apertura sobre los puntos más importantes de un conteo rápido, nos comentó de la necesidad de ponderar (en algún otro post te hablaré de ponderación), del call center, sobre las secciones electorales, el conteo de votos, la forma en que recibiríamos los resultados, entre otros muchos aspectos pero lo que nos explicó sobre muestreo y el programa que usaba para obtener sus muestras fue lo que sin duda captó más nuestra atención. El programa podía seleccionar muestras aleatorias mediante un muestreo sistemático estratificado por conglomerados (sé que suena fuerte esto pero aguántate tantito y ahorita vas a ver que no es tan pantera como parece). Salimos de las oficinas de Roy mucho más confiados y por supuesto agradecidos por el “quick count for dummies” que nos acaba de dar y no recuerdo si Manolo le preguntó a Roy si vendía su programa de muestreo pero a mi sí me lo comentó y le respondí que era un magnifico programa pero que no era algo muy difícil de hacer y me acuerdo que me preguntó ¿Tú sabes hacer eso? Le dije que sí y después de eso me envío a un curso sobre muestreo a los Estados Unidos, cosa por la que yo también le estoy muy agradecido. ¡No te preocupes! no pienso contarte como me fue allá, voy ir directo al grano sobre cómo hacer un muestra para un estudio político. Sin embargo, sí te voy a pedir que leas a pierna suelta para que no se te haga densa la explicación.

Para fines electorales, México se divide en poco más 64,000 secciones y 300 distritos electorales dentro de los 32 Estados, incluyendo al Distrito Federal; las secciones electorales son de tres tipos: rurales, mixtas y urbanas y están compuestas por un número de electores que puede ir de 50 a 1500. La información sobre las secciones electorales es básica porque es la que se usa para sacar la muestra de tu estudio político ya sea éste un quick count, exit poll, preferencia electoral o cualquier otro.

Supón que sólo tienes 10 secciones electorales y hay únicamente 3 partidos políticos PAN, PRD y PRI; asimismo, tienes los resultados de la última votación por partido político en cada una de esas secciones. Si yo te pidiera que extrajeras una muestra al azar del 30%, o sea 3 secciones de las 10 que tienes para estimar como votaron los electores ¿cómo le harías para darme la mejor muestra o la más exacta? La forma más sencilla de hacerlo es, como en la escuela, elaborar 10 papelitos, cada uno de ellos con el número de una sección electoral distinta, doblarlos, meterlos en un recipiente, revolverlos y luego extraer 3 de ellos; a eso se le llama muestreo aleatorio simple y la única condición es que obtengas al azar tus secciones donde vas a ir a levantar tus entrevistas o a hacer el quick count. Ahora ¿qué tan exacta crees que puede ser tu muestra? para responderte necesito que veas el cuadro de abajo en él vienen nuestras 10 secciones electorales imaginarias y los resultados por partido.

Muestreo de estudios políticos

Como puedes observar en la tabla anterior el PAN tiene un 37% de los votos totales, el PRI el 43% y el PRD el 13%; imagina que las secciones que obtuviste al azar en tu muestreo aleatorio simple fueron la 3, 5 y 6, si sumas los resultados de esas secciones y obtienes el porcentaje total de votos de cada partido te darás cuenta que es totalmente inexacta tu muestra: el ganador es el PAN con 41% de la votación y no el PRI con el 39% aunque el PRD obtiene el mismo resultado (ve la tabla de abajo).

Muestreo aleatorio simple de estudios políticos

El truco para obtener una muestra más exacta es utilizar otro tipo de muestreo que se llama sistemático o de salto sistemático con un arranque aleatorio y hacerlo con base a la diferencia de votos que hay entre los principales partidos políticos; es decir, aquellos que captan el mayor número de votos, en este caso el PAN y el PRI. El procedimiento es simple, réstale los votos del PAN al PRI en cada sección y ordena las secciones electorales de menor a mayor o a la inversa, después obtén el salto sistemático mediante la fórmula “N/n” donde “N” es igual al número de secciones electorales y “n” es igual al tamaño de tu muestra; si tienes 10 secciones y el tamaño de tu muestra es de 3, entonces el salto sería de cada 3.33 secciones (no te fijes en los decimales y piensa que el salto sería de cada 3 secciones); posteriormente, saca un número al azar entre el 1 y el 10 o sea de entre el total de secciones, supón que obtuviste el 2, allí es donde debe empezar tu muestra y seleccionar la siguiente sección electoral cada 3 secciones como dice tu salto. Las secciones “afortunadas” son la 8, 5 y 2, como en la tabla de abajo.

Muestreo de estudios políticos por diferencias

Confío que hasta aquí no te hayas perdido. Lo único que hicimos fue ordenar por diferencia y seleccionar las secciones de acuerdo a ese orden, aunque debes ser observador y darte cuenta que con este método se seleccionan de forma automática las secciones electorales que tienen mayor y menor diferencia de votos así como las intermedias. En estadística a eso se le llama reducir varianza, y ese es el truco, una muestra será más exacta en la medida en que reduzcas la varianza. Mira la tabla siguiente y dime si los resultados no son más exactos: PAN (38%), PRD (12%) y PRI (44%).

Muestreo sistemático de estudios políticos

!Un momento¡ ¿Puedes hacer el muestreo más exacto? Claro, si conoces que variables influyen en la forma de votar de los electores. Por ejemplo, dijimos que hay secciones urbanas, mixtas y rurales y sabes que la gente del campo no vota igual que la de las ciudades o de las zonas semirurales (mixtas), entonces lo que tienes que hacer es dividir tus secciones en rurales, mixtas y urbanas y obtener una muestra de cada una de ellas de acuerdo al tamaño que representan; en otras palabras, si necesitas una muestra de 100 secciones electorales y sabes que el 60% son urbanas, el 10% mixtas y el 30% restante rurales tu muestra tendría que ser de 60 secciones urbanas, 10 mixtas y 30 rurales a ese procedimiento se le llama estratificar; así que tu muestra sería sistemática y estratificada, pero ¿y de dónde viene la fama de conglomerados? bueno, desde el momento en que seleccionas secciones electorales y no personas estás hablando de conglomerados aunque esos conglomerados pueden irse haciendo más y más pequeños. Cómo cuando seleccionas estados, luego dentro de los estados secciones y dentro de las secciones manzanas decimos que fue muestreo polietápico de 3 etapas y como dice el buen Aleks Syntek Sha-la-la, Sha-la-la, Sha-la-la.

Ya sólo para resumir y no quedarme con las ganas de contarte otra asúntacho. Efectivamente, se usan los datos de las elecciones pasadas para obtener la muestra para el siguiente estudio, si es para presidente pues usa esos resultados, si es para cámara de representantes usa los correspondientes a las elecciones de diputados y senadores; obtén varias muestras con el procedimiento que te describí compáralas entre si y la muestra que mejor pronostique o sea más exacta esa es la que debes utilizar.

¡Perdón! un último asunto y ya con ese cierro, lo prometo ¿Qué tan exactos son los resultados de un conteo rápido (quick count)? Déjame decírtelo de esta forma, cuando tuve que entregar la base de datos a nuestro cliente el PRI, me dí cuenta que había cualquier cantidad de errores de captura; muchos errores quiero decir, lo cual es comprensible por la rapidez con la que se deben entregar los resultados; y sin embargo, el resultado que dimos fue extremadamente preciso, muy parecido al de otras agencias. Ese mismo día alguien me comentó y que me perdone pero no recuerdo su nombre, que con semejante tamaño de muestra nadie, ninguna agencia podía equivocarse; por eso, hasta el día de hoy me preguntó ¿por qué en el 2006 una agencia, que fue la única que dio resultados a la opinión pública del exit poll que hizo con una mega muestra de votantes, se “equivocó” y dijo que el ganador de las elecciones presidenciales era el candidato del PRD? La verdad, esa agencia necesitaría haber hecho las cosas con las patas para haberse equivocado con semejante tamaño de muestra; no lo sé, igual y sí, o ¿tienes alguna hipótesis alternativa?

Cualquier comentario es bienvenido, hasta la próxima.