Category Archives: ESTADISTICA

DIFERENCIAS ESTADÍSTICAMENTE SIGNIFICATIVAS

Si siempre pudiéramos entrevistar a toda la población no existiría la estadística; ésta nace por la imposibilidad de hacerlo porque, como sabes, cuesta mucho dinero entrevistar a toda la raza; nos tardaríamos todo una vida en ello o no podríamos acceder a todos los sujetos quizá, al momento de hacer el estudio, algunos se encuentren en alta mar o volando rumbo a Marte. En fin, existen muchos inconvenientes. El resultado que obtenemos con una muestra no es igual al de toda la población pero para efectos prácticos decimos que se parece mucho ¿Qué tan parecido? Bueno, podemos decir que se parece en un 68%, 95% o 99%, claro que entre más decimos que se parece más seguros estamos de que es igual. En los estudios de mercado y casi en toda la ciencia formal, la mayoría de los investigadores aceptan que es suficiente con que los resultados se parezcan en un 95%; por eso decimos: con un 95% de confianza el resultado es…Sin embargo, no hace falta ser mal pensado para darse cuenta de que podría no ser así ¿quién me asegura que son tan parecidos los resultados de la muestra a los de la población? ¿Debemos confiar sólo porque el investigador dice que hay un 95% de confianza de que sí se parecen?

Los mexicanos solemos decir: “a las pruebas me remito”. Esto no puede ser más cierto que en las pruebas de significancia estadística, estas sirven para probar matemáticamente que se parecen mucho y aunque el concepto es simple además de elegante, como casi todas las matemáticas, la mayoría tenemos problemas para entender estas pruebas. Vamos a tratar de explicarlo de manera coloquial para que se comprenda pero sería conveniente que se contrastará lo dicho aquí contra las formas puramente matemáticas para comprenderlo en su totalidad.

Supongamos que entrevistamos a 10 jóvenes y 7 de ellos nos dicen que les gusta el café Starbucks®, es decir, al 70% de ellos les agrada esta marca; ahora suponte que en lugar de entrevistar 10, entrevistas a 1,000 y 700 dicen que les gusta la marca Starbucks® o sea también hay un 70% que prefieren la marca ¿A cuál resultado de las dos muestras le tendrías más confianza? Si no te apellidas contreras, seguramente vas a decir que a la muestra de 1,000 casos ¿¡Lo ves!? El meollo del asunto está en el tamaño de la muestra, mientras más grande sea, mayor será la probabilidad de que se parezca a la población. Hasta aquí no hemos descubierto nada nuevo, es sólo cuestión de sentido común. Ahora, fíjate en esto otro, si haces dos estudios de 100 entrevistas cada uno y en uno de ellos el 50% te dice que va a votar por el candidato del PRI (Partido Revolucionario Institucional) y en el otro hay un 70% que te dice que votará por el PRI ¿En cuál resultado confiarías más? Recuerda que ambos estudios tienen el mismo tamaño de muestra, asimismo, fíjate que no me refiero a la confianza de que los estudios estén bien hechos, nuestro “supón” es que ambos lo están. Déjame ayudarte, porque sospecho que esta respuesta no es tan directa como la anterior. Yo confiaría más en la que dice que el 70% va a votar por el PRI. ¿Por qué? Perdona, que te confunda más, con otro ejemplo, pero es en aras de que nos vayamos entendiendo. Si tienes una novia(o) que unas veces si va a las citas que convienes con ella(él) y otras no, digamos 50% de las veces si va y 50% no ¿qué tanto confiarías en que esta vez si va a acudir a la cita? Por el contrario, si tu novia(o) ha demostrado que el 70% de las veces si acude ¿No confiarías más en esta pareja que en la que a veces viene a la cita y a veces no? Muy bien, allí lo tienes, el segundo ingrediente de las pruebas de significancia es la variación de los resultados.

En resumen, la significancia estadística depende del tamaño de la muestra y la variación que hay en los resultados. Si entendemos esto podremos entender porqué una diferencia del 15%, 10%, 5% entre dos muestras o grupos a veces puede ser significativa y a veces no. Por ejemplo, en un estudio donde se compara un grupo de jóvenes de 18-25 años contra otro de 26-35 años en cuanto a su red social favorita, encontramos que el primero prefiere Facebook en un 70% mientras que el segundo lo hace en un 60% y que este resultado es significativo estadísticamente. Observa que la diferencia entre porcentajes es del 10%. Siguiendo con el mismo ejemplo, podría suceder que con los mismos tamaños de muestras y los mismos grupos y una diferencia de también el 10% no hubiera diferencias significativas debido a que la variación dentro de cada grupo es mayor, digamos un 45% vs. un 55%; aunque también podría darse el caso de que la muestra de un grupo sea más pequeña que la del otro grupo con lo que también dejarían de existir diferencias.

Tal vez, el elemento más extraño de las pruebas de significancia y de toda la estadística clásica sea el comparativo. Ya sabemos que, a la hora de comparar muestras, su tamaño y variación son importantes pero en realidad ¿En qué nos basamos para decidir si una diferencia es significativa o no? Nos basamos en lo más natural del mundo o “normal” que hay. Si ves en México una persona alta, de piel blanca, ojos azules y cabello rubio, seguramente vas a pensar que es extranjero, dirás esto no es “normal” pero cuidado podrías equivocarte ya que, aunque no hay muchos, algunos mexicanos son así; sin embargo, tu mejor apuesta es pensar que no es mexicano; si tu hijo que siempre ha sido bien portado y sólo se dedica a sus estudios te dice de repente que va a ser estrella de rock y que ya se va a triunfar, seguramente le dirías que está loco porque no es “normal”, nunca lo has visto tocar en un grupo y además no tiene nada de rebelde pero cuidado que te podrías equivocar si tu hijo se llama Jim Morrison y toca con los Doors. ¿Me captas? Instintivamente, comparamos los eventos que observamos contra lo que creemos que es “normal”. En estadística se sabe, desde hace cientos de años, que la mayoría de los eventos naturales y ese tipo de equivocaciones (errores en estadística) tienen una regularidad predecible, es decir, se distribuyen de forma normal y su relación es probabilística. La probabilidad de que un resultado de eventos aleatorios (como hacer entrevistas mediante una muestra aleatoria) caiga en el valor verdadero de la población está definida por la cantidad de su variación; en otras palabras, la probabilidad de que un resultado esté dentro de una desviación estándar (así se dice para referirse al promedio de variación que hay en un grupo) es del 68%, de que esté en dos desviaciones estándar es del 95% y de que esté en tres desviaciones estándar es del 99%. Cuando los resultados de cualquier experimento estadístico no caen dentro de estas distribuciones que se esperan al azar se dice que hay diferencias significativas. De forma más clara, estamos diciendo que los resultados no son azarosos porque no se distribuyen de tal forma; más bien hay un elemento(s) o variables que no pertenecen al azar que están influyendo en los resultados. ¿Complicado? Qué te parece si vemos la formula más sencilla que hay sobre error de muestreo. Por favor, no te confundas con este término, a lo que se refiere es que la muestra tiene un error ¿cuál es ese error o en qué se equivoca? Pues en atinarle al verdadero valor de la población. Permíteme explicarte la fórmula y seguro vas a entender a que nos referimos. La fórmula es: 1 / raíz(n). Fácil ¿verdad? Uno entre la raíz de “n”. “n” se refiere al tamaño de muestra.

Como dijo Jack, el destripador, “vámonos por partes”; el numerador de la fórmula, ese enigmático “1”, se refiere a la variación de los resultados. Como dijimos hay una interacción entre la variación de los resultados, e interacción en el lenguaje de las matemáticas significa multiplicación; así si el 50% (.5) dice que va a votar por el PRI y el otro 50% (.5) dice que no lo hará, debemos multiplicar .5 X .5 para conocer la variación resultante que en este caso es de .25, la cual, si eres curioso, notarás que es la más grande que se puede alcanzar; es decir, no hay nada más diferente, que una población dividida: el 50% dice sí y el otro 50% dice no. Sólo para estar seguros de que captamos esto ¿Cuál es la variación si el 95% vota por el PRI y el 5% restante no? Veamos: .95 X .05 = .047. Muy poca ¿No es así? Espera un poco más antes de desvelar ese enigmático “1” del numerador. Tu bien sabes que una multiplicación altera las unidades originales, con ella obtenemos un indicador de la variación pero destruimos nuestra escala original, qué tal si, para volver a la escala inicial, sacamos raíz cuadrada, operación que, como sabes, es parecida a la multiplicación pero en reversa; el resultado es un número con más sentido que indica la variación que tienen en conjunto los que sí votan y los que no votan por el PRI. Éste sería: raíz(.25) = .5. Ya sé que vas a decir que no tiene caso dar un paso adelante y luego otro atrás sino agarramos el ritmo. En este caso es así porque recuerda que estamos hablando de la máxima variación pero en otros casos que no representan precisamente la máxima variación este meneíto si funciona, ¡hazlo y verás! Prueba por ejemplo, con .40 X .60 y luego saca la raíz cuadrada y vas a obtener un número diferente (.48) que obedece a la variación conjunta de ambos porcentajes. No desesperes, sólo nos falta un último ingrediente para llegar a ese “1”.

En nuestra fórmula calculamos que el resultado va a estar dentro de dos desviaciones estándar, o sea el 95% (por eso se dice que tenemos un 95% de confianza en que el resultado es el correcto), si no sucede así tendremos que concluir que hay diferencias significativas. Si hasta aquí todo va bien, te voy a pedir que multipliques tu desviación (variación), sí ese .50 que nos quedó al extraer la raíz cuadrada, por dos para estimar con el 95% de probabilidad la cantidad de variación que debería de haber en tus resultados; en otras palabras, la desviación la vas a duplicar porque sabes que el 95% de los resultados siempre están dentro de dos desviaciones estándar. Si ya lo hiciste te darás cuenta que de allí sale el famoso “1” (.5 X 2 = 1).

Recuerdas que en primaria nos enseñaban que en una división la parte de arriba o el numerador es lo que tenemos para repartir y que el denominador son las personas entre las cuales lo podemos hacer. Pues bien, ya te diste cuenta cuál es la variación que hay, eso es lo que tienes que repartir ¿Entre cuántos? Pues entre el número de sujetos que entrevistaste. Entonces si tienes mucha variación y pocos sujetos, el resultado será mayor cantidad de variación por cada sujeto y a la inversa si hay muchos sujetos y poca variación la cantidad en que varían tus datos será muy pequeña. Para efectos prácticos esto quiere decir que a mayor variación las diferencias significativas son poco probables mientras que a menor variación son más probables (más adelante te explico un poco más de esto). Es necesario que te des cuenta que así como la multiplicación significa interacción la división significa condición; dicho de otra forma, la cantidad de variación resultante está condicionada por el número de sujetos. Que ¿qué tiene que ver la raíz cuadrada del denominador? La explicación es la misma que con ese 95% de confianza, la función de probabilidad cambia de forma inversamente proporcional al tamaño de la muestra. ¿Necesitas que tu error de muestreo sea menor al 5%, digamos que sea del 2.5%? Entonces debes cuadruplicar tu muestra, en lugar de entrevistar a 400 sujetos, entrevista a 1,600.

La fórmula de la que estamos hablando no es oficial, es un “fast track” que utilizan los mercadólogos para obtener ese famoso error de muestreo y aunque no es súper precisa, funciona muy bien, la fórmula original es:fórmula del error estándar

En ella “Z” se refiere al número de desviaciones estándar, “P” y “Q” son los porcentajes de los que están a favor y en contra, respectivamente y “n” es el tamaño de la muestra.

La lógica que hay detrás de la prueba de significancia estadística que se usa para saber si los resultados de dos grupos de proporciones son diferentes se fundamenta en que la diferencia que hay entre ambas proporciones debe ser más grande que la cantidad de variación de ambos grupos esperada al azar con un 95% de confianza; si las variaciones, en conjunto de ambos grupos, son menores a la diferencia que hay entre sus porcentajes, seguramente vas a obtener diferencias significativas. ¿Qué tan menores? Por lo menos que éstas sean dos veces menores (recuerda 95% de confianza igual a dos desviaciones estándar). No ponemos aquí la fórmula para no abrumarte más pero si la consultas en algún texto de estadística clásica vas a encontrar un parecido muy grande con lo dicho aquí.

Gracias por leernos y hasta la próxima.

TAL COMO ME GUSTA

Un hombre impresionantemente grande se acerca a una prostituta y le dice que desea contratar sus servicios, que le va a pagar lo que ella pida pero que tiene que ser tal como a él le gusta; la mujer piensa inmediatamente que un hombre tan grande algún perjuicio puede representar para su integridad física y prefiere negarse a proporcionarle sus servicios; sin embargo, le dice que espere allí en lo que le consigue alguna otra mujer, el hombre asiente y la mujer parte, rauda y veloz, a reunirse con otras mujeres y contarles sobre el generoso ofrecimiento del pobre hombre necesitado, las cuales al ver a semejante hombre optan por declinar a tan generosa oferta pero viendo la necesidad del hombre deciden ir con la Rosita Árenas, quién tenía fama de aguantadora y echada pa’delante y ésta sin pensárselo dos veces se mete al cuarto de hotel acompañada de aquel hombre; todas las mujeres deseosas de saber el desenlace y la suerte de la valerosa Rosita, se arremolinan y pegan la oreja en la puerta del cuarto donde se encuentra la Rosita y su cliente. Así, transcurren unos cuantos minutos sin que se escuche sonido alguno hasta que de pronto se oye que se rompen vidrios, sillas y cuanto artefacto hay dentro; al instante, se abre la puerta violentamente y sale corriendo el hombre desnudo, llevando entre sus manos su ropa y zapatos y tras él la Rosita vuelta una furia. Las mujeres, sin aguantarse más las ganas, le preguntan: ¿cómo lo quería? a lo que la Rosita, todavía bufando como un toro, responde: “Quería fíado el hijo de la chingada”.

El asunto es: ¿Cómo logramos que el cliente obtenga justo lo que quiere? Claro, siempre y cuando no se le ocurra pedir fíado. Las escalas de “Tal como me gusta”  (TCG) o en inglés “Just about right” (JAR) se utilizan para este propósito, principalmente en la pruebas sensoriales o de producto; las cuales por supuesto son muy demandadas en la industria de alimentos, cosméticos, bebidas, cuidado personal, etc. pues con ellas se puede evaluar que tan cerca está el producto de lo que el cliente desea; en otras palabras, qué tanto el producto se acerca al punto ideal en cuanto a sal, dulzor, color, intensidad de sabor, aroma, tostado, carbonatado, etc. sin que le sobre o le falte de esas características. Por ejemplo, hagamos de cuenta que estás evaluando un jugo para lo cual le pides a tu entrevistado que lo pruebe y te diga ¿Qué tan dulce sabe? en una escala de 5 puntos donde:

  1. Es “Mucho menos dulce de lo que me gusta”
  2. Es “Menos dulce de lo que me gusta”
  3. Es “Tal como me gusta”
  4. Es “Más dulce de lo que me gusta”
  5. Es “Mucho más dulce de lo que me gusta”

Si el entrevistado te contesta que en cuanto a dulzor es tal como a él le gusta entonces tu producto está en el punto ideal; más sin embargo, si te pasas de dulzor o te quedas por debajo de él, seguramente desearás hacer un cambio al producto para que tenga mayor aceptación.

Esta escala es muy popular debido a su simpleza y claridad tanto para el investigador como para el entrevistado además de que su tratamiento estadístico es de lo más simple; sin embargo, como pasa con todas las escalas, su utilización no está exenta de críticas. Los investigadores documentan diversas inconsistencias y problemas de validez con las mismas; en algunos casos funciona más la escala de agrado o hedónica para predecir el éxito del producto; en otros se ha encontrado que no siempre lo ideal es igual a lo que a uno le gusta más; asimismo hay situaciones en que las características evaluadas conllevan un sesgo: en cuánto a cantidad de queso para una pizza ¿hay un punto ideal o más es mejor?* Sea lo que fuere, esta escala se utiliza mucho pero se hace en conjunción con la escala de agrado general (hedónica), quizá para subsanar algunas de las debilidades que tiene. La escala de agrado general puede ir de 1 a 5, 1 a 7, 1 a 9, 0 a 10, o cualquier otra cosa que se te ocurra; sin embargo, toma en cuenta que tanto la escala de TCG como la hedónica te van a servir para obtener normas de desempeño del producto por lo que una vez que seleccionas un determinado intervalo para una escala no puedes estarla cambiando porque no podrás comparar tus resultados entre estudios. La pregunta de agrado general es muy directa, siguiendo con nuestro ejemplo de jugo se haría así: En general, ¿qué tanto le agrado el jugo que acaba de probar? Dígamelo en una escala del 1 al 9 donde 1 significa que le desagrado muchísimo y 9 que le agrado muchísimo.

¿Sabes que es lo mejor de la escala NPS (Net Promoter Score)? que para aplicarla y analizarla sólo necesitas saber sumar y restar. En una escala del 0 al 10 en la cual 0 es que no recomendarías pa’nada la marca y 10 que la recomendarías totalmente, se suman los sujetos que contestan 0 al 6, los que contestan 7 a 8 y los que responden 9 a 10, entonces restas el porcentaje de los que respondieron 9 a 10 de los que respondieron 0 a 6 y “voila” el resultado es el porcentaje o puntaje neto de promotores (NPS). ¿Estás pensando lo mismo que yo? Si sí es así, acertaste. La escala TCG es igual que la NPS, para analizarla sólo necesitas sumas y restas. ¡Verás! sumas o agrupas a los sujetos que contestaron 1 y 2 (1. “Mucho menos dulce de lo que me gusta” y 2. “Menos dulce de lo que me gusta”); a los que contestaron 4 y 5 (4. “Más dulce de lo que me gusta” y 5. “Mucho más dulce de lo que me gusta”) y dejas solos a los sujetos que contestaron 3 (3. “Tal como me gusta”) con eso vas a obtener tres grupos: los que dicen que al jugo le falta dulce, los que dicen que es tal como a ellos les gusta y aquellos que dicen que tiene mucho dulce (véase fig. de abajo).

escala tal como a mi me gusta

Ten presente que lo ideal es que ni le sobre ni le falte o sea que la mayoría estén en el grupo de los que contestaron 3. Cómo en gustos se rompen géneros, es casi imposible que todos estén de acuerdo en ello por lo tanto una regla más o menos general es que por lo menos el 75% caigan en la categoría de “tal como a mi me gusta” u otra es que el porcentaje de los que mencionan que el producto se pasó de dulce o que quedó por debajo de éste no sea igual o superior al 20% si no es así, entonces definitivamente, hay que hacer cambios en la formulación del producto. En nuestro gráfico puedes ver que estamos 11% por debajo del estándar (64% – 75% = 11%) ¿Entonces qué hay que corregir? ¿Le quitamos o le ponemos más dulce al jugo? El sentido común diría que hay que subirle pues el 20% dijo que faltaba pero como dicen que el sentido común es la cosa mejor repartida del mundo, preferimos no fiarnos de él y en su lugar emplear la técnica “Penalty Analysis” o Análisis de Penalización, también conocida como “Mean Drop” o caída de media, más adelante te vas a dar cuenta porqué esos nombres.

La idea del Penalty Analysis es relacionar el nivel de agrado general del producto con cada uno de los grupos que hiciste anteriormente; es decir, cuál de ellos tiene más agrado por el producto. Para no perder el hilo hagamos el ejercicio con nuestro ejemplo del jugo y la cantidad de dulce (véase fig. de abajo).

Penalty analysis

Si eres observador, te darás cuenta que los que mencionan que el dulce del jugo es tal como les gusta también tienden a calificar más alto su agrado por el producto. En la tabla de arriba, calificaron al producto en promedio con  8.05 mientras que el grupo que dice que le falta dulce lo califica con 4.05 y el que piensa que sobra lo hace con 5.06. Por esa razón se dice que se castiga o penaliza al producto cuando no cumple con las “expectativas” o también que hay una caida en la media. Para calcular la caida sólo se substrae el promedio del grupo que dijo tal como me gusta del promedio de cada uno de los otros dos grupos (8.05 – 4.55 = 3.51 y 8.05 – 5.06 = 2.99). La caida de ambas medias te dice que se está castigando más la falta de dulce que el exceso. Sin embargo, considera que en estadística la relevancia de un promedio está relacionado con el tamaño de la muestra o número de sujetos por lo cual es menester ponderar este factor; lo que se hace en la columna que dice Penalty es multiplicar el porcentaje de cada grupo por el promedio de la caída de la media “Mean Drop”. Así, para la característica de “Mucho y menos dulce” hay una penalización de 0.70 (20% x 3.51 = 0.70) mientras que para “Mucho y más dulce” es de 0.48 (16% x 2.99 = 0.48); en términos prácticos esto significa que si corriges la falta de dulzor tu promedio de agrado general subiría en .70.

¿No te lo dije? es fácil ¿verdad? Nuestro ejemplo se basó en una sola característica del producto pero en la práctica pueden llegar hasta casi diez características las que evalúes y probar más de un producto por lo cual es necesario sacar un indicador ponderado o lo que es lo mismo uno global para poder ordenar las características según su grado de penalización; lo que los investigadores hacen es crear 2 grupos, juntan el 1, 2, 4 y 5 de la escala de TCG y dejan solo, de nueva cuenta, el 3 y emplean la misma técnica de penalización para su análisis; en otras palabras, no importa si te pasaste o te sobró dulce se desea saber en global que tanto cae la media.

Allí te van algunas reglas prácticas más o menos aceptadas en la ejecución de estos análisis y su interpretación:

  1. Se calcula el Penalty Analysis sólo para los grupos (debajo o encima del punto ideal) que tienen un tamaño del 20% o más ¿Por qué este número? bueno como dijimos la muestra o tamaño del grupo es importante, grupos pequeños pueden llevarte a conclusiones erróneas.
  2. Se deben obtener dif. sig. utilizando una análisis de varianza o de medias conocido como t-test. ¿Por qué? La razón es que mejorar una característica no necesariamente significa que el producto vaya a gustar más, hay que ver si efectivamente existe una relación.
  3. La regresión lineal, es otro método de análisis pues indica si hay relación y más importante aún nos da un coeficiente de cambio de la proporción de la concentración de una característica, en nuestro caso dulzor, y el agrado en general. Esto se hace bajo la premisa de que hay una relación logarítmica entre la característica y la escala TCG. En otras palabras, el coeficiente de regresión que obtienes puede ser usado para ajustar la concentración del ingrediente en cuestión a fin de que se acerque a lo que el cliente quiere.

Por favor, danos tu opinión o comentarios en la misma sección de este blog a fin de que podamos enriquecerlo o mándalos a info@marketvariance.com

Hasta la próxima.

* Para una descripción más exacta de estos problemas puedes consultar el artículo de Richard Popper: “Just-About-Right Scales in Consumer Research” en la revista Chemo Sense o el capítulo, del mismo autor, titulado de la misma forma en el libro: “Novel Techniques in Sensory Characterization and Consumer Profiling”.

CORRELACIÓN DE DATOS

“Por fin comprende mi corazón: escucho un canto, contemplo una flor”…Esperamos que acabes cantando –como lo hacia el Poeta Texcocano, Rey Netzahuacoyotl– cuando acabes de leer este post y, ojalá, te lleve a comprender el concepto de correlación, que es uno de los más importantes en investigación. También esperamos tener mejor suerte que otros y que, contándote una buena historia, te vuelvas adepto al coeficiente de correlación de Pearson.

Seguramente estás midiendo de forma periódica, digamos mensual, trimestral o semestral, la compra de la marca que administras. Como no conozco los datos que has obtenido, déjame inventar unos como los del cuadro de abajo:

cuadro de compra de marca 2

Muy bien, es facilísimo observar que la compra de la marca bajó de enero a mayo 30 puntos porcentuales (45 – 15 = 30). Eso te resulta fácil porque aprendiste en la escuela primaria a sumar y restar con brinquitos de la ranita (aunque todavía no me explico cómo le hacía la condenada rana para saltar hacia atrás). Asimismo, tienes una predisposición natural a ver las cosas linealmente, de allí el nombre que se les da a los números naturales (los que nos sirven para contar). Si todos los problemas fueran unidimensionales, o sea para adelante o para atrás, no habría problema, pero no es así. En la vida real hay fuerzas que interactúan y a veces lo hacen de forma lineal, en ese caso el método de la ranita es efectivo, pero cuando estas relaciones no son lineales la rana se vuelve obsoleta.

La lealtad es una medida que interactúa con la compra de marca; ambas en conjunto son un mejor indicador de su desempeño. En el siguiente cuadro vienen los datos obtenidos de la lealtad de marca:

cuadro de lealtad de marca 2

Okey, según estos datos de enero a mayo aumentaste 15 puntos porcentuales (37 – 22 = 15). ¡Ah, caray! como que no checa, ¿verdad? Hay menos consumidores que compran la marca, pero más lealtad, ¿qué sucedió?, ¿será que no se asocian? Nosotros los investigadores sabemos que sí están relacionadas, pero quizá no lo hacen como suponemos. Nuestra hipótesis es que la lealtad se ha incrementado porque los que dejan de comprar la marca son los menos leales, de esta forma la proporción de leales aumenta.

Si empleamos el método universal de la ranita para conocer el desempeño que la marca tuvo en mayo quizá sumaríamos la compra de ese mes 15% más el 37% de la lealtad y lo podríamos dividir entre 2 para obtener un porcentaje promedio (15 + 37 = 52/2 = 26). Según nuestro cálculo, el desempeño de la marca estuvo en un 26%, pero espérame un momento, ¿no quedamos en que la lealtad aumenta cuando la compra baja? Mejor le restamos 15% a 37% porque la relación es inversa, entonces el desempeño de la marca fue de 22%. No, no convence, ¿verdad? ¿Qué pasará cuando tenga 50% de compra y 50% de lealtad? Si los resto el desempeño sería 0%. Fíjate en este otro ejemplo, si tienes un 1% de compra y 99% de lealtad y procedes como la ranita obtendrías un puntaje de 50% de desempeño de la marca: 1% + 99% / 2 = 50%. El mismo puntaje resultaría si tienes 50% de compra y 50% de lealtad: 50% + 50% / 2 = 50%. Sin embargo, si multiplicas en lugar de sumar, los puntajes que obtendrías serían totalmente distintos. En el primer caso obtendrías 0.99%: 1% x 99% = 0.99%. Mientras que en el segundo caso obtendrías 25%: 50% x 50% = 25%.

Karl Pearson, el padre de la correlación, se dio cuenta de que la forma más adecuada de cuantificar una relación como la anterior era multiplicando ambas variables; las multiplica porque supone que están interactuando; no se trata de una sola rana que brinca hacia adelante y hacia atrás; se trata de dos ranas que entran y salen de un charco, sepa Dios y Pearson en que momento y dirección. Imagina que los porcentajes de compra y lealtad son 50% para ambas variables, si los multiplicamos tenemos un desempeño de marca del 25% (50% X 50% = 25%); este indicador sí tiene sentido. En buen cristiano, significa que el 25% del mercado es de la marca; en otras palabras, uno de cada cuatro consumidores son clientes de la marca. Para Pearson ambas variables actúan en conjunto, interactúan y comparten elementos comunes por eso es necesario multiplicarlas; sin embargo, no se sabe con que fuerza y en que dirección lo hacen porque, después de todo, podría ser que la fuerza con la que se relacionan fuera nula; es decir, en realidad no hay ningún FACTOR COMÚN entre ellas; es infundada la suposición de que están interactuando.

La moraleja de las historias anteriores es que nunca debes construir modelos de mercado o investigación que se basen exclusivamente en restas y sumas (v. gr. NPS – Net Promoter Score), pero además, antes de sumar o restar dos o más variables, debes primero constatar que existe una RELACIÓN LINEAL entre ellas, determinar qué tan fuerte es esa relación y su sentido: si es positiva o negativa.

Con el fin de hacer este artículo lo menos árido posible, no vamos a incluir ninguna fórmula hasta que sea absolutamente necesario. Si te parece vamos a continuar analizando nuestros datos con el acuerdo de que es mejor multiplicar que sumar y/o restar. En la tabla de abajo se presenta el ejercicio con los datos que nos inventamos al principio: la compra, la lealtad, sus sumas y promedios, así como la multiplicación de ambas y la suma total de esos productos.

cuadro de compra por lealtad 3

De acuerdo, si multiplicamos la compra por la lealtad de cada uno de los 5 meses, los SUMAMOS y promediamos, el desempeño de la marca es del 7%. ¡Ya ves! cómo tenemos una predisposición innata a sumar sin fijarnos si las variables se relacionan. Todavía no hemos comprobado si la compra y la lealtad se relacionan pero ya las estamos sumando para obtener un promedio. Puedes alegar que en la tabla se observa que la compra baja mientras que la lealtad aumenta pero que tal si tienes cientos de casos o miles o quizá millones ¿Qué, lo podrías hacer con una simple inspección visual? No, ¿verdad?

El problema es cómo hacerle para comparar ambas medidas y es aquí donde Pearson echó a andar nuevamente la ardilla. Razonó que para saber sí una variable aumenta mientras otra disminuye o ambas aumentan o disminuyen al mismo tiempo (a eso en estadística se le llama covarianza) tenía que compararlas sobre una misma base y se le ocurrió que el promedio es el mejor indicador sobre el cual se podría comparar. El promedio o media es algo así como el punto cero para cualquier grupo de mediciones; si una observación (en este caso medición mensual) está por debajo del promedio se dice que es negativa y por el contrario si está por encima se dice que es positiva. De esta forma cada INTERACCIÓN (multiplicación) se podría sumar o restar dentro del conjunto total de datos y obtener un indicador general de la dirección de la relación: si el resultado general es negativo entonces hay una relación inversa (mientras una variable aumenta la otra disminuye), si el resultado general es positivo entonces la relación es directa (mientras una variable aumenta la otra también lo hace o si disminuye la otra también lo hace). En la siguiente tabla se ilustra el procedimiento anterior:

covarianza

En la tabla se restó la compra obtenida en cada mes a el promedio de compra general y se procedió de la misma forma con la lealtad; luego se multiplicaron ambos resultados en cada mes (desviación del promedio de compra por desviación del promedio de lealtad) y se sumaron, el resultado “-224%”; este número y su signo indica que hay una relación negativa, o sea que la compra disminuye y la lealtad aumenta o a la inversa. Vamos a analizar detenidamente la tabla. En el mes de febrero la compra estuvo por encima de la media o promedio (30-27.2 = 2.8) es decir, el resultado fue positivo; en ese mismo mes, la lealtad también obtuvo resultados positivos porque no bajo del promedio general de lealtad. Sin embargo, la multiplicación de ambos resultados nos señala que hay 0% de covarianza; en otras palabras, no hay cambio en la lealtad cuando la compra aumenta o, si deseas verlo de otra forma, la compra aumenta aunque la lealtad permanezca igual. Dirían los sabios indigenas de México: “El ave canta aunque la rama cruja”. Eso es para un solo mes pero ¿qué pasa en marzo? Tanto la compra como la lealtad disminuyeron y el porcentaje en que lo hicieron fue de 0.8%, lo cual es muy poco. Toma nota que el resultado es positivo por que la variación en conjunto va en el mismo sentido, o sea ambas son positivas o negativas. ¿Qué tal en mayo? La compra quedó por debajo del promedio (-12.2%) y la lealtad por arriba de su promedio general (9%) por eso la relación es inversa: una baja y la otra sube. Si observas, tanto el mes de enero como mayo son los meses donde hay más variación, la cuál es de tipo negativa. Sólo para que estemos seguros de esta operación, si ambos resultados (compra y lealtad) son positivos o negativos el resultado de su multiplicación será positiva (menos por menos también da más). La consecuencia de sumar todos los productos cruzados (así se llama a la multiplicación de estas desviaciones) es que los valores negativos se neutralizan con los positivos; en otras palabras, hay variaciones en las que la compra y la lealtad se mueven juntas (covarían) en la misma dirección y variaciones en las que la compra y la lealtad se mueven en sentido inverso una crece mientras la otra baja; si, y éste es el meollo del asunto, la suma de los productos cruzados, es decir, de todas las variaciones es cero se infiere que hay un relajo entre las variables a veces suben o bajan juntas; otras veces una baja mientras otra sube, no están variando conjuntamente pero si el resultado es diferente de cero y positivo tanto la compra como la lealtad se mueven en el mismo sentido, o sea que medidas por encima del promedio de compra corresponden a medidas por encima del promedio de lealtad y medidas por debajo del promedio de compra (negativas) corresponden a medidas por debajo del promedio de lealtad (negativas). Por último, si es diferente de cero y negativo, la compra baja (está por debajo del promedio) mientras la lealtad sube (está por encima del promedio) o a la inversa. Al promedio de ese sube y baja, mi estimado lector, le llaman covarianza. En este caso la covarianza es de -56% (véase su cálculo en la tabla de arriba), su fórmula es:

formula covarianza2

Recuerda que en la ecuación la “x” y la “y” son desviaciones del promedio y que la “M” acostada indica que hay que sumarlas, después de haberlas multiplicado; la “n” simboliza el número de casos y se le resta menos “1”; te pido que no te confundas con este “1”, en esencia estas promediando la variación conjunta de compra y lealtad entre el número de casos.

La covarianza es prima hermana de la correlación. La diferencia es que la correlación es más comprensible que la covarianza. Por ejemplo, ¿qué significa una covarianza de -56%? Todo lo que podemos saber es que de toda la variación que podrían tener en conjunto la compra y la lealtad sólo quedó ese -56% porque la restante variación se anuló mutuamente debido a que no había un patrón de variaciones conjuntas entre ambas variables. Por esta razón Pearson se preguntó ¿qué porcentaje de variación total queda en la covarianza? y para responder a la pregunta simplemente dividió la covarianza entre el promedio de variación total que resulta del producto de ambas variables (véase la tabla de abajo).

correlación

Nota en la tabla anterior que las desviaciones de la compra y la lealtad las elevamos al cuadrado para poder sumarlas ya que no estamos interesados en saber si las diferencias eran negativas o positivas, simplemente deseamos saber el total de desviación que hay de su promedio; por otro lado, si no se elevan al cuadrado la suma total sería cero. Este artificio debe ser removido antes de calcular la correlación, lo cual se hace sacándole raíz cuadrada a la media de los cuadrados o covarianzas de cada variable; otro aspecto que te conviene recordar es que la covarianza es un promedio de desviaciones y que obtendrías el mismo factor de correlación dividiendo las sumas de la variaciones x,y (-224) y la total (raíz de 540.8 por la raíz de 134), el resultado en ese caso sería -224/269.2 = -.83. Abajo se muestra el coeficiente de correlación obtenido usando las covarianzas:

calculo de correlacion

La correlación tiene la propiedad de ir de -1 a 1; si el resultado es “-1” significa que las variables oscilan en conjunto de forma perfecta pero en sentidos opuestos: una aumenta y la otra disminuye; si el resultado es “1” entonces las variables oscilan en la misma dirección: una aumenta y la otra también o una disminuye y la otra también. En general, se entiende cuando es “-1” o “1”que la covarianza es igual al total de la variación promedio del producto cruzado de ambas variables. Si no es exactamente “-1” o “1”, se comprende que la covarianza es sólo una parte del total de la variación. Para ilustrar este punto, observa nuestro resultado de “-.83”, en buen cristiano este número nos dice que por cada unidad o punto porcentual que aumenta o disminuye una variable la otra lo hace en sentido inverso en un 83%. Por fin, aquí te presento la fórmula de correlación de Karl Pearson:

formula correlacion

La “Vx” es la covarianza de “x” y la “Vy” es la covarianza de “y”. Si deseas saber que es eso de varianza puedes ver el artículo: Varianza y el perico jefe.

Hasta pronto.