PERFIL DE MARCA Y NORMALIZACIÓN DE DATOS

Las tablas de contingencia o de datos cruzados, en este caso marcas vs. atributos, muestran de un solo vistazo quién es la marca líder. En la tabla de abajo se aprecia que el champú Pantene es el jefe de la categoría dado que tiene los porcentajes más altos en casi todos los atributos ¿Qué más nos puedes decir a partir de una inspección visual de la tabla? Bueno, quizá cuáles son los atributos en los que tiene las calificaciones más altas o bajas; que Sedal es la segunda marca más importante en la categoría…pero ¿qué nos dices sobre la marca que tiene el tercer sitio? ¿Es Caprice, Palmolive o Head and Shoulders? ¿Cuáles son los atributos más importantes de estas marcas? Eso ya no es tan fácil ¿verdad? Casi la mayoría está de acuerdo en que analizar los datos con base en una tabla no es tan simple ni directo como parece, es más la cosa se complica si deseas observar las interacciones (asociaciones) entre atributos y marcas (renglones y columnas de la tabla). Para tener una apreciación clara de las fortalezas y debilidades de las marcas así como de esas interacciones, los investigadores de mercado utilizan el archirequetecontraconocido método de normalización de datos.

Datos de champú

Antes de explicarte como se come eso de normalización de datos, déjame hacer una aclaración. A lo largo de estos años he visto colegas que consideran que una puntuación alta en un atributo es una fortaleza de la marca y eso no es así. Un buen amigo mío que trabaja en una empresa cuyo principal producto es champú, lo explica así. Un hombre le preguntó a una sexo-servidora cuánto quería por sus servicios, la mujer pedía $500 pesos por hacer el amor en una cama, $200 pesos por hacerlo en petate (tapete tejido de fibras naturales) y $100 pesos por hacerlo en el suelo. El hombre le dijo que estaba bien que quería $500 pesos. La mujer muy contenta le contestó “Anda pillín, te gusta hacerlo en la cama” a lo que él reviró; no, lo que deseo es hacerlo 5 veces en el suelo. En otras palabras, tu marca puede tener puntuaciones muy altas en atributos que a los consumidores les importa un rábano, consecuentemente no inciden en la decisión de compra que hacen. Otro aspecto menos obvio y que muchos pasan por alto es el siguiente. Supón que eres gerente de marca Loreal y entre los atributos donde calificas más alto se encuentra “Tiene precio accesible” ¿tener un precio accesible es una fortaleza? Depende del posicionamiento que le quieras dar a la marca ¿Quieres construir una marca premium o una para mercado masivo? En pocas palabras, si los atributos en los cuales calificas alto reflejan tu estrategia y te ayudan a vender entonces si estamos hablando de una fortaleza; el dinero y esfuerzo que has invertido en investigación y desarrollo, publicidad, marketing, etc. están creando “brand equity” (capital de marca).

¡Mmm, Normalización…!Para que entiendas este término piensa en el lenguaje común que utilizas todos los días, si ves una mujer extremadamente hermosa o un hombre extremadamente guapo, les puedes llamar “mamacita, papacito, mi reina, mi rey, o cualquier otra cosa que se te ocurra pero es un hecho que no los clasificarías dentro de las personas “normales”, con respecto a su belleza, ella y él sobresalen de las demás personas. La naturaleza se manifiesta de tal forma que casi todos somos más o menos “normales”*, es decir, hay pocas personas extremadamente bellas y pocas extremadamente feas (dígase lo que se diga); pocas personas extremadamente altas y pocas extremadamente bajas; pocas extremadamente inteligentes y pocas extremadamente tontas ¿me captas? Es decir, normal significa estar en el promedio. Hagamos un “zoom” a nuestra tabla de champús a las 2 primeras marcas y los 2 primeros atributos.

Tabla de shampoo

En el post que hicimos sobre ponderación de datos te explicábamos que la cuestión se reducía a una simple ecuación que comparaba lo que tenías con lo que deberías tener ¿Recuerdas? Pues bien, normalizar los datos es exactamente el mismo caso. Fíjate bien, si sumas los porcentajes de las dos marcas en ambos atributos obtienes el total de calificaciones (297); por otro lado, sabes que son cuatro calificaciones o celdas las que sumaste y ahora quieres repartir ese total entre los cuatro para saber cuánto le debería tocar a cada celda según su tamaño; la forma para hacerlo es multiplicando el total de la fila por el total de la columna donde se encuentra la celda de la cual quieres conocer lo que le correspondería de valor si fuera “normal” y dividirlo entre el total general. Por ejemplo, si quieres saber cuánto le corresponde a Pantene en el atributo “Tiene publicidad” multiplica 178 por 155 y divídelo entre 297 -> (178 X 155) / 297 = 93. Bien, ahora viene el razonamiento, si Pantene tiene 93 y debería tener 93 para ser un champú con una publicidad “normal” ¿cuánto le falta o le sobra? Exacto, nada, está dentro de una marca “normal”. Veamos el caso de Sedal -> (119 X 155) / 297 = 62. Entonces, Sedal tiene 62 y debería tener 62 en el atributo “Tiene publicidad” lo que significa que también es “normal”. Esto cambia todo el panorama ¿verdad? Por lo menos en ese atributo Pantene no es mejor que Sedal ¿Hasta aquí vamos bien? Perfecto, lo interesante de este asunto es que ese valor “normal” en estadística se llama valor esperado y de allí se derivan el famoso Chi-cuadrado o también conocido como Ji cuadrado, el coeficiente de contingencia y muchas otras medidas más de asociación. En esencia lo que hace el Chi-cuadrado es lo mismo que hicimos, comparar esa valor esperado con el valor observado (se refiere al porcentaje real, lo que te salió en tu investigación) y dividirlo entre el valor esperado (aquí cambia el denominador, ya no es el total) para sacar una medida estandarizada**.

Si te has preguntado si el resultado es el mismo cuando usas en una tabla de contingencias porcentajes en lugar de frecuencias o viceversa, la respuesta es sí, sí es lo mismo. Sin embargo, hay algo que deberías tomar en cuenta cuando presentas datos en frecuencias***, o sea el número de personas que dijeron que tal marca se relaciona a tal atributo, no hay forma de comparar o dimensionar las diferencias pues dependen del número de sujetos de estudio ¿Qué puedes decir? ¿Qué estás por arriba o por abajo equis número de sujetos de lo normal?

Algunas personas sacan las diferencias de forma más sencilla y directa utilizando los promedios de porcentajes por cada renglón, columna y en general. Observa la tabla de abajo, para obtener el valor esperado de Pantene en el atributo “Tiene publicidad” multiplicamos el promedio general de la marca (89) por el promedio general del atributo (78) y lo dividimos entre el promedio total (74). 89 X 78 / 74 = 93. Allí lo tienes, sigue siendo el mismo valor esperado que se obtuvo utilizando el método tradicional aunque se llegó a él utilizando promedios de porcentajes que para muchas personas es más fácil y directo de entender.

tabla champu promedios

La gráfica al principio de este post muestra las diferencias de los valores observados menos los esperados del champú Pantene, con ella es fácil ver que atributos están por arriba o debajo del promedio esperado, a los atributos que tienen diferencias positivas se les denominan “fortalezas” de la marca mientras que a los que tienen diferencias negativas se les dice “debilidades”. A este gráfico se le conoce comúnmente como perfil de marca (haz clic aquí para bajar el template). En este caso el perfil de Pantene tiene 3 principales fortalezas: “Deja el cabello sin fritz”, “Es para cabello reseco” y “Protege el cabello” y tiene una “debilidad” no “Tiene precio accesible”.

En un curso que impartimos sobre mapas perceptuales, hará más de 12 años, mostramos como derivar un mapa de correspondencias a través del chi cuadrado; a algunos de los asistentes les pareció sorprendente como a raíz de una simple tabla de porcentajes se podría derivar un mapa de correspondencias (en otro post hablaremos sobre este mapa) y en realidad se puede hacer mucho más que eso ¿Porqué lo comento? La razón es que mucha gente le da poca importancia a la estadística no paramétrica pues la considera de menor nivel pero el poder que tiene es igual o superior al de las escalas que utilizamos en investigación de mercados.

Hasta pronto.

* Nota 1. La distribución normal no es la única forma en que se manifiestan los eventos en la naturaleza, aunque si la más común, hay otro tipo de distribuciones que obedecen a otras reglas estadísticas. Por ejemplo, una distribución de poder o ley de Pareto en la cual algunos casos son inmensamente superiores comparados con la gran mayoría de la población, casi todas las redes naturales o artificiales tienen este tipo de distribución una de ellas es por supuesto las redes semánticas naturales de las cuales ya hemos hecho varios posts.

formula chi cuadrado** Nota 2. El numerador del chi se eleva al cuadrado (efectivamente por eso se llama cuadrado) para convertir los valores negativos en positivos y de esta forma no neutralizar las diferencias (puedes leer el post que hicimos sobre varianza). La fórmula Chi-cuadrado es:

*** Nota 3. Cuando utilizas frecuencias en una tabla de contingencias debes tener por lo menos en cada celda 5 sujetos para poder calcular el Chi-cuadrado, a veces esto no es posible así que algunas personas para darle la vuelta a la estadística lo que hacen es convertir las frecuencias en porcentajes y asunto resuelto ¿Está bien o mal? Pos quién sabe pero hay te lo dejo a consideración.

¡Compártelo a tus amigos(as)!...Tweet about this on Twitter
Twitter
Share on LinkedIn
Linkedin
Share on Facebook
Facebook
Share on Google+
Google+
Email this to someone
email

4 thoughts on “PERFIL DE MARCA Y NORMALIZACIÓN DE DATOS

  1. Mar

    Gracias por el aporte, me está siendo de mucha ayuda.
    He intentado hacer los cálculos manualmente para entender el proceso, primero calculo los valores estimados tal y como enseñas, y una vez que los tengo aplico la fórmula del chi2 para cada casilla (fila*columna) sin el sumatorio (no sé que puedo sumar la verdad). Los signos (+-) coinciden pero no los números, ¿Qué debería hacer ahora?

    Reply
    1. Administrator

      Hola Marta, antes que nada gracias por comentar y leer nuestro blog. No estoy seguro de haber entendido tu comentario pero voy a tratar de explicarte como obtener tu Chi. ¡Mira! esencialmente, se trata de que veas a cuántos valores esperados (denominador) equivale la desviación conjunta de los datos (numerador). Cálcula el valor para cada celda de tu tabla (observado – esperado / esperado), como se explica en el artículo, eso te va a dar como resultado una tabla con desviaciones, después suma los puntajes calculados de cada celda, el número que obtienes es tu Chi. Si las puntuaciones positivas son tantas como las negativas tu chi será muy pequeña, es decir, no hay diferencias por el contrario si la suma da como resultado un numero grande (3.84 o mayor) es seguro que hay diferencias. Hay un libro muy práctico, aunque está en inglés, que te puede servir. http://www.amazon.com/Universal-Pocket-Statistical-Tool-Chi-Square-ebook/dp/B00F27HWUM/ref=sr_1_2?ie=UTF8&qid=1459174217&sr=8-2&keywords=frederick+ruland

      Reply

Leave a Reply

Your email address will not be published. Required fields are marked *