Tag Archives: ponderación

PONDERACIÓN DE DATOS ¡CUESTIÓN DE PESO NO DE PESOS!

¿Cuánto gana en promedio un trabajador de la ciudad de México? ¿Qué te parece si hacemos una mini-encuesta para averiguar? Imagina que seleccionas 10 personas al azar y les preguntas cuánto ganan mensualmente. En la tabla de abajo puedes apreciar las respuestas de cada uno de tus entrevistados así como el promedio en general del ingreso mensual. No está nada mal $19,400 pesos por cholla. Con ese dinero, como diría Chava Flores, cualquiera paga la renta, el teléfono, la luz y todavía alcanza hasta para echarse un alipuz. ¡Espérate, no te esponjes! Sabemos que eso no es lo que gana un “chilango”, es sólo un supóngando que nos sirve para ilustrar la ponderación de casos.

tabla ponderacion

No sé porqué dicen ponderación de datos o de resultados si en realidad lo que se pondera son los casos y una vez hecho esto se procesa y analiza la información pero dada la costumbre hemos titulado este post ponderación de datos. ¿Para qué sirve y qué cómo se hace? Bueno lo primera respuesta es: sirve para que no andes por allí, como si fueras secretario de economía, diciendo que un mexicano gana mucho; en otras palabras para que tus estimaciones o resultados de tus encuestas sean más precisos. La segunda respuesta nos fue proporcionada por nuestro amigo y colaborador Jesús Romero, sobre todo como hacerle para ponderar en Excel utilizando tablas dinámicas, así que sigue leyendo.

Regresando a nuestra encuesta de 10 casos, imagina que hay 10 millones de personas que trabajan en la ciudad de México de esas, 7 millones son de nivel socioeconómico (nse) bajo, 2 millones de nivel medio y 1 millón de nivel alto; en otras palabras, hay más gente de nse bajo que medio y alto pero en nuestra encuesta entrevistamos a casi la misma cantidad de cada nse (véase la tabla de abajo) razón por la cual los datos que obtuvimos de $ 19,400.00 pesos en promedio están sesgados. Para corregir este “sesgo” tenemos que ponderar o sea equilibrar las cosas ¿Cómo? Si entrevistaste a 3 personas de nse bajo o sea el 30% tienes que darle el peso real; en otras palabras, hacer que esos tres casos o 30% se conviertan en siete casos o 70% ¿Por qué? Porque recuerda que hay 10 millones que trabajan en la ciudad de México de los cuáles siete millones son de nse bajo o lo que es lo mismo siete de cada diez casos; tienes que hacer exactamente los mismo para los otros dos nse y ajustarlos de acuerdo al peso que tienen en la población (10 millones de trabajadores).

Como se trata de equilibrar tenemos que repartir o dividir con base a lo que le toca a cada quien. Así el asunto se convierte en un cuánto te toca y cuánto tienes para saber cuánto te falta o te sobra. Ejemplo, en el caso del nse bajo le tocan 7 y tiene 3, entonces es 7/3 = 2.33; en el nse medio le tocan 2 y tiene 3, lo que se formula así: 2/3 = .66; y al nse alto le toca 1 y tiene 4 lo que se escribe como 1/4 = .25. Para hacer lo anterior puedes dividir por frecuencias; es decir, casos entre casos o hacerlo con porcentajes, te dará lo mismo pero no dividas casos entre porcentajes. Por ejemplo, 7 / 30% = 23.33 (hazme caso y no lo hagas así o te vas a equivocar). Asimismo, me tocó ver empresas de investigación de mercados que dividían el número de casos de la población real entre el de su encuesta (no se si todavía lo hagan o ya aprendieron) de esta forma 7,000,000/3 = 2,333,333.33; se me hacía absurdo porque cuando reportaban sus resultados no había manera de saber cuantas entrevistas hicieron en realidad; confundía sobre la verdadera importancia de los resultados ya que a lo mejor eran sólo 2 casos y decían que eran chorrocientos millones; la verdad estaba bastante loco eso ¿o está todavía? Hay dos moralejas en esta historia: primero, si hiciste 10 entrevistas tus resultados totales deben reflejar 10 entrevistas ni más ni menos y segundo siempre debes reportar la base ponderada y la base no ponderada, los casos para que me entiendas.

Mira la tabla de abajo y observa como cuando aplicamos el factor de ponderación, o sea multiplicamos el ingreso en cada caso por el factor de ponderación (número de casos reales) cambia el promedio bajo la columna que dice ingreso ponderado. Ahora tenemos que en promedio un trabajador de la ciudad de México gana $10,070.00 pesos. ¿Verdad que es cuestión de peso y no de pesos?

TABLA PONDERADA DE INGRESO

Ahora si, ya podemos empezar con las preguntas:

1. No, no es lo que ganan en realidad, este es sólo un ejemplo ficticio y cualquier semejanza con la vida real es pura coincidencia.

2. La suma total de la columna “FACTOR DE PONDERACIÓN” te da 10 porque siempre debes obtener como resultado de tu base ponderada el mismo número de casos o entrevistas que hiciste. En realidad nos dio 9.97 pero eso es por los decimales.

3. ¿Qué tanto afectan los decimales en la ponderación? Depende del programa, por ejemplo, SPSS ajusta el caso a 0 (cero) cuando es menor a 0.5 y a 1 (uno) cuando es igual o mayor que 0.5; Excel aplica el mismo criterio pero cuando utilizas la función truncar o entero, no importa si eres 0.5, 0.9 o 0.25 lo convierte en 0 (cero). En términos generales, te puedo decir que con dos decimales que incluyas en tu factor de ponderación no debes tener ningún problema.

4. ¿Qué cómo sé quién es de nse bajo, medio y alto? Bueno lo pregunté en la encuesta. Eso te lleva a que siempre debes preguntar los sociodemográficos en tus encuestas ya que las respuestas dependen del tipo de persona que entrevistas, de su sexo, edad, nse, edo civil, ciudad donde reside, etc. y si te das cuenta que entrevistaste más mujeres que hombres y sospechas de un sesgo en los resultados desearas ponderar por sexo ¿Y qué tal que no apuntaste el sexo de tus entrevistados? !Sopas carnal(a)¡ Ya valiste.

5. ¿Qué cómo sabemos el nse de la población? Por supuesto, debe haber datos disponibles sobre la población. Dependiendo de que datos desees encontrar puedes buscar en INEGI, FONHAPO, SECRETARÍA DE ECONOMÍA, AMAI (ASOSIACIÓN MEXICANA DE AGENCIAS DE INVESTIGACIÓN), IFE, etc.

6. ¿Siempre se debe ponderar? No, depende de si sospechas que hay un sesgo, de si deseas equilibrar la muestra, hacer proyecciones por regiones, a nivel nacional, etc.

7. ¿Qué es una muestra autoponderada? Un jefe que tuve me decía que un estudio hecho en varias ciudades debe estar ponderado. Tal vez, pero muchas empresas determinan el tamaño de sus muestras según el tamaño de la ciudad, las características sociodemográficas más importantes de la población de estudio. Así, si saben que van a hacer 100 entrevistas en Guadalajara, Monterrey y Ciudad de Mexico, hacen 50 en México, 30 en Guadalajara y 20 en Monterrey que corresponde al tamaño de cada una de estas ciudades (aprox.); además si saben que hay 6 mujeres por cada diez habitantes procuran entrevistar 60% de mujeres y 40% de hombres de su muestra. A eso se le llama una muestra autoponderada.

8 ¿Se puede ponderar o corregir por otras variables? Por ejemplo, si quiero equilibrar el número de hombres y mujeres dependiendo de su nse ¿puedo hacerlo? Seguro, de hecho a eso se le llama multiponderación y es la forma más fina de corregir un sesgo pero ese ejemplo, cómo ponderar en Excel y lo que se me haya quedado en el teclado lo dejamos para el próximo post ¿Quieres?

Saludos.