DIFERENCIAS ESTADÍSTICAMENTE SIGNIFICATIVAS

Si siempre pudiéramos entrevistar a toda la población no existiría la estadística; ésta nace por la imposibilidad de hacerlo porque, como sabes, cuesta mucho dinero entrevistar a toda la raza; nos tardaríamos todo una vida en ello o no podríamos acceder a todos los sujetos quizá, al momento de hacer el estudio, algunos se encuentren en alta mar o volando rumbo a Marte. En fin, existen muchos inconvenientes. El resultado que obtenemos con una muestra no es igual al de toda la población pero para efectos prácticos decimos que se parece mucho ¿Qué tan parecido? Bueno, podemos decir que se parece en un 68%, 95% o 99%, claro que entre más decimos que se parece más seguros estamos de que es igual. En los estudios de mercado y casi en toda la ciencia formal, la mayoría de los investigadores aceptan que es suficiente con que los resultados se parezcan en un 95%; por eso decimos: con un 95% de confianza el resultado es…Sin embargo, no hace falta ser mal pensado para darse cuenta de que podría no ser así ¿quién me asegura que son tan parecidos los resultados de la muestra a los de la población? ¿Debemos confiar sólo porque el investigador dice que hay un 95% de confianza de que sí se parecen?

Los mexicanos solemos decir: “a las pruebas me remito”. Esto no puede ser más cierto que en las pruebas de significancia estadística, estas sirven para probar matemáticamente que se parecen mucho y aunque el concepto es simple además de elegante, como casi todas las matemáticas, la mayoría tenemos problemas para entender estas pruebas. Vamos a tratar de explicarlo de manera coloquial para que se comprenda pero sería conveniente que se contrastará lo dicho aquí contra las formas puramente matemáticas para comprenderlo en su totalidad.

Supongamos que entrevistamos a 10 jóvenes y 7 de ellos nos dicen que les gusta el café Starbucks®, es decir, al 70% de ellos les agrada esta marca; ahora suponte que en lugar de entrevistar 10, entrevistas a 1,000 y 700 dicen que les gusta la marca Starbucks® o sea también hay un 70% que prefieren la marca ¿A cuál resultado de las dos muestras le tendrías más confianza? Si no te apellidas contreras, seguramente vas a decir que a la muestra de 1,000 casos ¿¡Lo ves!? El meollo del asunto está en el tamaño de la muestra, mientras más grande sea, mayor será la probabilidad de que se parezca a la población. Hasta aquí no hemos descubierto nada nuevo, es sólo cuestión de sentido común. Ahora, fíjate en esto otro, si haces dos estudios de 100 entrevistas cada uno y en uno de ellos el 50% te dice que va a votar por el candidato del PRI (Partido Revolucionario Institucional) y en el otro hay un 70% que te dice que votará por el PRI ¿En cuál resultado confiarías más? Recuerda que ambos estudios tienen el mismo tamaño de muestra, asimismo, fíjate que no me refiero a la confianza de que los estudios estén bien hechos, nuestro “supón” es que ambos lo están. Déjame ayudarte, porque sospecho que esta respuesta no es tan directa como la anterior. Yo confiaría más en la que dice que el 70% va a votar por el PRI. ¿Por qué? Perdona, que te confunda más, con otro ejemplo, pero es en aras de que nos vayamos entendiendo. Si tienes una novia(o) que unas veces si va a las citas que convienes con ella(él) y otras no, digamos 50% de las veces si va y 50% no ¿qué tanto confiarías en que esta vez si va a acudir a la cita? Por el contrario, si tu novia(o) ha demostrado que el 70% de las veces si acude ¿No confiarías más en esta pareja que en la que a veces viene a la cita y a veces no? Muy bien, allí lo tienes, el segundo ingrediente de las pruebas de significancia es la variación de los resultados.

En resumen, la significancia estadística depende del tamaño de la muestra y la variación que hay en los resultados. Si entendemos esto podremos entender porqué una diferencia del 15%, 10%, 5% entre dos muestras o grupos a veces puede ser significativa y a veces no. Por ejemplo, en un estudio donde se compara un grupo de jóvenes de 18-25 años contra otro de 26-35 años en cuanto a su red social favorita, encontramos que el primero prefiere Facebook en un 70% mientras que el segundo lo hace en un 60% y que este resultado es significativo estadísticamente. Observa que la diferencia entre porcentajes es del 10%. Siguiendo con el mismo ejemplo, podría suceder que con los mismos tamaños de muestras y los mismos grupos y una diferencia de también el 10% no hubiera diferencias significativas debido a que la variación dentro de cada grupo es mayor, digamos un 45% vs. un 55%; aunque también podría darse el caso de que la muestra de un grupo sea más pequeña que la del otro grupo con lo que también dejarían de existir diferencias.

Tal vez, el elemento más extraño de las pruebas de significancia y de toda la estadística clásica sea el comparativo. Ya sabemos que, a la hora de comparar muestras, su tamaño y variación son importantes pero en realidad ¿En qué nos basamos para decidir si una diferencia es significativa o no? Nos basamos en lo más natural del mundo o “normal” que hay. Si ves en México una persona alta, de piel blanca, ojos azules y cabello rubio, seguramente vas a pensar que es extranjero, dirás esto no es “normal” pero cuidado podrías equivocarte ya que, aunque no hay muchos, algunos mexicanos son así; sin embargo, tu mejor apuesta es pensar que no es mexicano; si tu hijo que siempre ha sido bien portado y sólo se dedica a sus estudios te dice de repente que va a ser estrella de rock y que ya se va a triunfar, seguramente le dirías que está loco porque no es “normal”, nunca lo has visto tocar en un grupo y además no tiene nada de rebelde pero cuidado que te podrías equivocar si tu hijo se llama Jim Morrison y toca con los Doors. ¿Me captas? Instintivamente, comparamos los eventos que observamos contra lo que creemos que es “normal”. En estadística se sabe, desde hace cientos de años, que la mayoría de los eventos naturales y ese tipo de equivocaciones (errores en estadística) tienen una regularidad predecible, es decir, se distribuyen de forma normal y su relación es probabilística. La probabilidad de que un resultado de eventos aleatorios (como hacer entrevistas mediante una muestra aleatoria) caiga en el valor verdadero de la población está definida por la cantidad de su variación; en otras palabras, la probabilidad de que un resultado esté dentro de una desviación estándar (así se dice para referirse al promedio de variación que hay en un grupo) es del 68%, de que esté en dos desviaciones estándar es del 95% y de que esté en tres desviaciones estándar es del 99%. Cuando los resultados de cualquier experimento estadístico no caen dentro de estas distribuciones que se esperan al azar se dice que hay diferencias significativas. De forma más clara, estamos diciendo que los resultados no son azarosos porque no se distribuyen de tal forma; más bien hay un elemento(s) o variables que no pertenecen al azar que están influyendo en los resultados. ¿Complicado? Qué te parece si vemos la formula más sencilla que hay sobre error de muestreo. Por favor, no te confundas con este término, a lo que se refiere es que la muestra tiene un error ¿cuál es ese error o en qué se equivoca? Pues en atinarle al verdadero valor de la población. Permíteme explicarte la fórmula y seguro vas a entender a que nos referimos. La fórmula es: 1 / raíz(n). Fácil ¿verdad? Uno entre la raíz de “n”. “n” se refiere al tamaño de muestra.

Como dijo Jack, el destripador, “vámonos por partes”; el numerador de la fórmula, ese enigmático “1”, se refiere a la variación de los resultados. Como dijimos hay una interacción entre la variación de los resultados, e interacción en el lenguaje de las matemáticas significa multiplicación; así si el 50% (.5) dice que va a votar por el PRI y el otro 50% (.5) dice que no lo hará, debemos multiplicar .5 X .5 para conocer la variación resultante que en este caso es de .25, la cual, si eres curioso, notarás que es la más grande que se puede alcanzar; es decir, no hay nada más diferente, que una población dividida: el 50% dice sí y el otro 50% dice no. Sólo para estar seguros de que captamos esto ¿Cuál es la variación si el 95% vota por el PRI y el 5% restante no? Veamos: .95 X .05 = .047. Muy poca ¿No es así? Espera un poco más antes de desvelar ese enigmático “1” del numerador. Tu bien sabes que una multiplicación altera las unidades originales, con ella obtenemos un indicador de la variación pero destruimos nuestra escala original, qué tal si, para volver a la escala inicial, sacamos raíz cuadrada, operación que, como sabes, es parecida a la multiplicación pero en reversa; el resultado es un número con más sentido que indica la variación que tienen en conjunto los que sí votan y los que no votan por el PRI. Éste sería: raíz(.25) = .5. Ya sé que vas a decir que no tiene caso dar un paso adelante y luego otro atrás sino agarramos el ritmo. En este caso es así porque recuerda que estamos hablando de la máxima variación pero en otros casos que no representan precisamente la máxima variación este meneíto si funciona, ¡hazlo y verás! Prueba por ejemplo, con .40 X .60 y luego saca la raíz cuadrada y vas a obtener un número diferente (.48) que obedece a la variación conjunta de ambos porcentajes. No desesperes, sólo nos falta un último ingrediente para llegar a ese “1”.

En nuestra fórmula calculamos que el resultado va a estar dentro de dos desviaciones estándar, o sea el 95% (por eso se dice que tenemos un 95% de confianza en que el resultado es el correcto), si no sucede así tendremos que concluir que hay diferencias significativas. Si hasta aquí todo va bien, te voy a pedir que multipliques tu desviación (variación), sí ese .50 que nos quedó al extraer la raíz cuadrada, por dos para estimar con el 95% de probabilidad la cantidad de variación que debería de haber en tus resultados; en otras palabras, la desviación la vas a duplicar porque sabes que el 95% de los resultados siempre están dentro de dos desviaciones estándar. Si ya lo hiciste te darás cuenta que de allí sale el famoso “1” (.5 X 2 = 1).

Recuerdas que en primaria nos enseñaban que en una división la parte de arriba o el numerador es lo que tenemos para repartir y que el denominador son las personas entre las cuales lo podemos hacer. Pues bien, ya te diste cuenta cuál es la variación que hay, eso es lo que tienes que repartir ¿Entre cuántos? Pues entre el número de sujetos que entrevistaste. Entonces si tienes mucha variación y pocos sujetos, el resultado será mayor cantidad de variación por cada sujeto y a la inversa si hay muchos sujetos y poca variación la cantidad en que varían tus datos será muy pequeña. Para efectos prácticos esto quiere decir que a mayor variación las diferencias significativas son poco probables mientras que a menor variación son más probables (más adelante te explico un poco más de esto). Es necesario que te des cuenta que así como la multiplicación significa interacción la división significa condición; dicho de otra forma, la cantidad de variación resultante está condicionada por el número de sujetos. Que ¿qué tiene que ver la raíz cuadrada del denominador? La explicación es la misma que con ese 95% de confianza, la función de probabilidad cambia de forma inversamente proporcional al tamaño de la muestra. ¿Necesitas que tu error de muestreo sea menor al 5%, digamos que sea del 2.5%? Entonces debes cuadruplicar tu muestra, en lugar de entrevistar a 400 sujetos, entrevista a 1,600.

La fórmula de la que estamos hablando no es oficial, es un “fast track” que utilizan los mercadólogos para obtener ese famoso error de muestreo y aunque no es súper precisa, funciona muy bien, la fórmula original es:fórmula del error estándar

En ella “Z” se refiere al número de desviaciones estándar, “P” y “Q” son los porcentajes de los que están a favor y en contra, respectivamente y “n” es el tamaño de la muestra.

La lógica que hay detrás de la prueba de significancia estadística que se usa para saber si los resultados de dos grupos de proporciones son diferentes se fundamenta en que la diferencia que hay entre ambas proporciones debe ser más grande que la cantidad de variación de ambos grupos esperada al azar con un 95% de confianza; si las variaciones, en conjunto de ambos grupos, son menores a la diferencia que hay entre sus porcentajes, seguramente vas a obtener diferencias significativas. ¿Qué tan menores? Por lo menos que éstas sean dos veces menores (recuerda 95% de confianza igual a dos desviaciones estándar). No ponemos aquí la fórmula para no abrumarte más pero si la consultas en algún texto de estadística clásica vas a encontrar un parecido muy grande con lo dicho aquí.

Gracias por leernos y hasta la próxima.

¡Compártelo a tus amigos(as)!...Tweet about this on Twitter
Twitter
Share on LinkedIn
Linkedin
Share on Facebook
Facebook
Share on Google+
Google+
Email this to someone
email

Leave a Reply

Your email address will not be published. Required fields are marked *