Category Archives: MODELOS Y TECNICAS

ANÁLISIS FACTORIAL

¡Play Ball! Dicen que el baseball es el Rey de los deportes y seguramente lo es. Sólo una vez, en mis 50 años de vida, he jugado este deporte, lo hice cuando era niño y como Dios manda, es decir, con uniforme, guante y en una auténtica cancha de baseball, jamás he olvidado ese juego (en esta foto salgo güerito porque todavía no me había quemado el Sol). Se dice lo mismo del análisis factorial, que es el Rey de los métodos de análisis estadístico en ciencias sociales ¿Por qué será?

Un cliente puede quedar muy satisfecho si le explicas la razón por la cual la lealtad a su marca está declinando o puede mandarte a freír espárragos si no le hace sentido lo que dices. El método “teórico” que utiliza el cliente para decidir si te abraza o te despide con un “me saludas a nunca vuelvas” se llama validez frontal. En pocas palabras, hay una inclinación innata del ser humano a validar las teorías. La teoría es maravillosa pues representa el nivel más alto de abstracción del pensamiento humano; sin embargo, parafraseando al maestro Bumy, hay métodos, metóditos y metódotes con los cuáles podemos validar nuestras teorías. ¿Qué tan difícil es “…Desafiar la investigación de mercados para proveer fundamente teórico de sus procesos de medición.”? ¿No te gustaría que así fuera la investigación de mercados? Sí, claro. Sin embargo, aún estamos en la primera base, muy lejos del home.

El análisis factorial valida las teorías pero no lo hace de la misma forma que tu cliente, lo hace a través de un método matemático puro (por eso es el Rey), al tipo de validez que obtienes con este análisis se le nombra validez de constructo, bonito nombre ¿verdad? Se ha utilizado por décadas para construir pruebas (test) sobre casi cualquier concepto que te puedas imaginar: celos, amor, vocación, locura, adicción, inteligencia y por supuesto lealtad a la marca. La idea que hay detrás de estas pruebas es hacer un inventario de las actitudes o manifestaciones más representativas de lo que se intenta medir, ¿no? Supón que deseas saber si tu novia(o) te ama, la primera pregunta que le harías es: “¿me quieres mi Lupe (Hetor, según la preferencia)? si la respuesta es sí, entonces ya llevas un punto a tu favor pero ¿no te parece que sería muy tonto de tu parte fiarte de un único sí como para ponerle casa a la susodicha o darle al Hetor lo que más desea. ¡Más seguro más marrado! ¿verdad? Haz más preguntas para saber qué tanto es tantito o sea si es amor apasionado, desbocado, alocado, maduro, comprometido o qué. Una vez que hayas hecho todas las preguntas pertinentes asegúrate de que se asocian al tipo de amor que esperas de ella(él). El análisis factorial, según San Karl Pearson, es la técnica adecuada para conocer el tipo y grado de amor que mide tu prueba.

Un modelo de investigación de mercados, popular en los países anglosajones, que mide el concepto de compromiso o lealtad a la marca es el Conversion Model este modelo se basa en una serie de preguntas para clasificar a los consumidores según su grado de compromiso con la marca. Y sí, los autores hicieron lo mismo que tú para saber qué tanto te amaba la Lupe o el Hetor, construyeron una teoría sobre lealtad, hicieron un inventario de preguntas que midiera el concepto y obtuvieron su validez de constructo (se refiere a sí la prueba mide lo que ellos dicen que mide) y luego obtuvieron la confiablidad de la prueba (con que exactitud mide lo que ellos dicen que mide) o por lo menos eso es lo que deberían haber hecho ¿qué porqué?

Imagínate que haces tu propia medida de lealtad para tarjetas de crédito, la cual está compuesta por dos preguntas: pregunta 1. Cuántas ventajas tiene la tarjeta de crédito que usas. Para ello utilizas una escala que va del 1 al 3 en la cual 1 es “La tarjeta que uso tiene más ventajas que desventajas”; 2 es “La tarjeta que uso tiene muchas ventajas pero también muchas desventajas” y 3 es “La tarjeta que uso tiene más desventajas que ventajas”. Pregunta 2. Evaluación en general de la tarjeta de crédito. Con una escala del 0 al 10 en la cual 0 significa que la tarjeta es pésima y 10 que es excelente. Tu teoría es que si la tarjeta tiene más ventajas que deventajas entonces debe tener buena calificación y eso genera lealtad pues quién abandonaría una tarjeta muy buena que además da bastantes ventajas. Así que, sumando las respuestas a ambas preguntas sabrás cuál es el nivel de lealtad del consumidor a su tarjeta ¿de acuerdo? Suena sensato y simple, o sea tiene validez frontal pero soportará el análisis matemático mediante el cual se valida un test.

Para validar tú teoría vamos a usar un “metódito”, en lugar del análisis factorial, porque usar el factorial con dos simples preguntas sería tanto como traer a Babe Ruth para jugar en tu liga infantil de baseball. En la imagen de abajo se muestra un análisis cruzado con tus dos preguntas.

tabla de cruce de lealtad

Date cuenta que la mayoría de los que calificaron a la marca con 8, 9 y 10 encuentran más ventajas que desventajas en ella; sin embargo, también perciben las mismas ventajas que desventajas y para acabarla de amolar, 2 de los 5 sujetos, que dicen que la marca tiene más deventajas que ventajas la califican con 8 y 9. Para ir directo al grano, las preguntas no se asocian ni se combinan y por lo tanto no forman parte de un mismo concepto; estas 2 preguntas no constituyen una “prueba” de lealtad y por supuesto ni se te ocurra sumarlas pues entonces sí que tu cliente te va a decir: “se va, se va, y se fue”, como en un home run pero negativo. No, definitivamente, tus preguntas no constituyen un factor.

Como mencionamos anteriormente, hay chorrocientos mil pruebas para medir igual número de conceptos por lo cual a veces es mejor buscar la prueba adecuada que construir tu propio test. El Dr. Avichai Shuv-Ami nos propone una prueba para medir compromiso a la marca:

fatores de la escala de compromiso

Observa que hay 4 factores o dimensiones teóricas que se componen de 12 reactivos, 3 preguntas por cada factor: Desempeño, Involucramiento, Satisfacción y Lealtad. La teoría subyacente de esta prueba nos hace sentido, es decir, tiene validez frontal. Dice que para que un cliente se comprometa, la marca tiene que tener buen desempeño (Desempeño) lo cual a su vez logrará captar el interés del cliente (Involucramiento) y si el desempeño es constantemente bueno es muy probable que el cliente esté satisfecho (Satisfacción) y en consecuencia sea leal a la marca (Lealtad). Como era de esperar, quisimos validar esta teoría (validez de constructo) y obtener su confiabilidad (alpha de Cronbach); para ello aplicamos los análisis factorial, mediante el método de componentes principales (este es el más usual) y de confiabilidad.

El estudio que usamos, como conejillo de indias, fue un estudio de jabones de tocador, en él encontramos 3 factores (no 4) con cargas muy buenas; una carga puede ir de -1 a 1 cuando es 1 se entiende que la variable se asocia perfectamente al factor y lo mismo sucede cuando es -1 sólo que en ese caso la relación es totalmente inversa. Por ejemplo, en el cuadro de abajo puedes ver que el reactivo (así se les llama a las preguntas en una prueba) “Es importante para mi seleccionar la marca correcta de jabón de tocador”, tiene una carga factorial de .846, o sea está para pegar brincos de gusto, y la que menos tiene dentro del factor 1 es “Mi marca tiene ventajas que otras marcas no tienen” con .604, que también es un puntaje sumamente respetable. Ahora, el problema es que no nos salieron 4 factores como había predicho el autor. ¿Este resultado significa que la prueba no sirve? No. Todo lo contrario, funciona y lo hace muy bien pues le sacamos confiabilidad sumando los tres factores y obtuvimos un alpha de Cronbach de .77 (el puntaje puede ir de 0 a 1 donde 0 significa que la prueba mide nada bien y 1 que mide perfectamente). Asimismo, qué significa factor 1, 2 y 3, pueden significar lo que desees pero los nombres que les des a los factores deberá hacer clic con los reactivos que los componen. En nuestro caso propongo que al factor 1 le llamemos “Relevancia”, al factor 2, “Lealtad” y al factor 3, “Desempeño” ¿Cómo les pondrías tú?

tabla de factores de jabón

¿En un estudio cómo utilizas los datos de esta prueba? Elemental mi querido(a) investigador si la escala que usaste va de 1 a 5 (Totalmente en desacuerdo a Totalmente de acuerdo), como en nuestro caso, agrupa a todos los sujetos que hayan obtenido un puntaje menor a 3, los puedes etiquetar como rechazantes o no leales; junta a los que hayan obtenido más de 3 y hasta 4 y ponles el nombre de neutrales, tibios u otra cosa que se te ocurra; a los que hayan sacado más de 4 clasifícalos como leales o comprometidos; por último, cruza estos grupos contra la marca que usan o compran más frecuentemente y vas a conocer los porcentajes de clientes leales a cada marca, neutrales y los que ya no te quieren; para cada uno de estos grupo implementa estrategias de retención, atracción o simplemente llévales serenata cantándoles las golondrinas (canción mexicana popular que se toca en las despedidas). El siguiente cuadro esquematiza lo que te debería de quedar:

esquema de la escala de compromiso

Hasta la próxima.

BORRIQUITO COMBO TÚ, YO SÉ MÁS DE TURF

La verdad, desde hace mucho tenía ganas de escribir este post. Gracias a mi amigo Antonio Soberón, quien trabaja en la Universidad de Toluca y quien me enseñó lo que era un neto, pude entender posteriormente lo que era turf. Para los nuevos que son borriquitos como yo, les explico rápidamente que es un neto (si tú ya sabes que es, haz clic en el video de abajo y disfruta de él mientras los borriquitos leen).

En las encuestas hay un tipo de preguntas que se llaman múltiples o multi-respuesta porque el encuestado puede dar varias respuestas a una misma pregunta. Por ejemplo, si le preguntamos “¿Cuáles son los problemas de tu comunidad?”* puede responder: “falta de agua”, “delincuencia”, “asaltos”, “desempleo”, entre otras cosas; o si hacemos esta otra pregunta “¿Qué es lo que te gusta del champú que usas?” podríamos obtener respuestas como “deja el cabello suave”, “huele rico el pelo”, “deja una fragancia a fresco”, etc. Pues bien, para analizar estas respuestas hay que resumirlas, por 3 razones básicas:

1. Las respuestas son muchas, lo que genera un listado larguísimo que es difícil de analizar.
2. Un encuestado(a) puede repetir la misma respuesta.
3. Muchas de ellas son repetitivas y/o se refieren al mismo concepto.

La manera más práctica de resumirlas es agrupándolas en conceptos y contabilizándolas una sola vez; a esos conceptos se les llama respuestas netas o simplemente netos. En el cuadro de abajo se ilustra este procedimiento utilizando el 1er ejemplo de las preguntas anteriores:

Como puedes observar, el entrevistado dio 4 respuestas, pero una vez agrupadas en respuestas netas (conceptos): criminalidad, escasez y desempleo, las respuestas se reducen a 3 debido a que delincuencia y asaltos se refieren a un mismo concepto (criminalidad). Esta agrupación es útil principalmente porque:

1. Hay un análisis más conciso de las respuestas que da la gente.
2. Permite cuantificar y dimensionar las respuestas de forma más precisa.

En nuestro negocio, esta práctica de manejar así las respuestas de las preguntas multi-respuesta es casi universal aunque en algunas ocasiones es muy útil conocer la multiplicidad (total de respuestas antes de hacer netos) pues por raro que te parezca te presenta otro ángulo que no es precisamente el opuesto por los vértices (esa se la copie a un matemático), usando otra analogía es como si los netos te dieran profundidad y la multiplicidad anchura. Sé que no me he explicado bien pero qué tal este ejemplo para que ahora si sepas de que hablo. En el cuadro de abajo se les preguntó a 5 personas las marcas de celulares que conocen.

tabla de multiplicidad turf

La multiplicidad es simplemente el total de respuestas de todos los entrevistados dividido entre el total de entrevistados (14/5). La multiplicidad en este caso fue de 2.8, eso significa que en promedio la gente retiene en su mente por lo menos 2 marcas pero difícilmente 3 ¿Y qué con eso? ¡Aja! ese es el punto. Si no eres la 1ra o 2da marca la probabilidad de que te compren se reduce drásticamente. ¿Lo ves? dos “insigths” con una sola pregunta y eso mi querido amigo es lo que te da el análisis turf, alcance y frecuencia con una sola pregunta. Sé que estoy “regando el tepache” nuevamente y que no me explico bien pero que te parece si entramos en materia y así seguro que nos entendemos.

Turf (total unduplicated reach and frequency), en términos nopaleros, pa’nosotros los mexicanos pues, significa total no duplicado de alcance y frecuencia. ¿A cuál total, alcance y frecuencia nos referimos? Aquí es donde se empieza a armar el rompecabezas. Imagínate que eres el Rey de Turfland y tienes 5 hijos, los cuales deseas casar con las princesas de los reinos vecinos para extender tus dominios pero como el tesoro del reino no tiene muy buenas fianzas sólo puedes financiar la boda de 3 de ellos. Ahora, el problema es que no sabes cuáles 3 de tus 5 hijos serán los más aceptados por los reinos vecinos y no puedes andar de reino en reino ofreciéndo a los 5 pues cada uno de ellos debe llevar obsequios a las hijas de los Reyes, por si esto fuera poco existe la posibilidad de que ninguna princesa se interese en tus hijos. ¡Menudo problema! ¿No es así? La solución simple es que antes de que marches con tus hijos a esos reinos, envíes a tus espías (investigadores de mercado) a sondear cuáles de tus cinco hijos son los más favorecidos por las princesas, lo haces así y obtienes los siguientes datos:

70% quieren con el príncipe Carlos
65% quieren con el príncipe Enrique
50% desean al príncipe Felipe
50% desean al príncipe José
47% desean al príncipe Luis

¿Mandarías a Carlos, Enrique y Felipe a la conquista? La lógica dice que sí, pero que tal que ese 47% que desea al príncipe Luis son las princesas de los reinos más ricos y además sólo quieren a Luis y a nadie más ¡Chín, ya valió! ¿verdad? Bueno, eso mismo sucede con los productos:

1. Deseas vender más y tienes varios productos que crees que le podrían gustar a tu mercado pero…
2. no puedes darte el lujo de fabricarlos todos por cuestiones de mercado y presupuesto, entonces…
3. tienes que hacer una investigación para determinar cuales productos son los más atractivos para el mercado pero…
4. al igual que con las preguntas de respuesta múltiple, algunas personas desean más de un producto mientras que otras sólo les gusta uno, en pocas palabras…
5. tienes que hacer netos para alcanzar al mayor número de personas con el número de productos que hayas decidido vender (recuerda que no puedes fabricarlos ni distribuirlos todos) y obtener la multiplicidad pues además de saber cuántos van a comprar tus productos deseas saber que cantidad de ellos van a comprar.

¿Aún no? Bueno, un restaurante de comida exótica tiene 5 opciones de aguas frescas exóticas pero por razones financieras sólo puede producir 3. Obviamente, para satisfacer a sus clientes necesita que la oferta de aguas sea la más gustada, con esto logrará dos cosas:

1. Más gente consumirá su producto.
2. La gente consumirá mayor cantidad del producto.

La tabla de abajo contiene los datos de 5 entrevistados en el “Parque Sur” y los 5 sabores exóticos de aguas frescas. Los ceros en la tabla indican que al entrevistado ese sabor no le agrada “matarilerileron” y los unos que ese sabor si le agrada “matarilerileron”. Por ejemplo, a Eric no le gusta la guanábana ni el lychee pero si los otros 3 sabores.

tabla de preferencia turf

Tú trabajo es:

1. Saber cuantos combos (combinaciones) de 3 puedes armar con estos 5 sabores de aguas frescas. En total son 10. En está página, que además es muy divertida, puedes enterarte porque son 10.

2. Obtener la respuesta neta en cada una de esas combinaciones. En el cuadro de abajo están todas las combinaciones junto con su total “neto” de cada una de ellas.

tabla de combinaciones turf

Las combinaciones 4 (guanábana, pitahaya y lychee) y 8 (pitahaya, granada y lychee) son las que tienen el mayor alcance, le gustan a todos los entrevistados; las que tienen el menor alcance son la 5,7 y 10, sólo al 60% de los entrevistados (3 sujetos) les gusta. Asimismo, si observas la tabla titulada “Agua fresca preferida” y sumas el total de veces que se mencionó cada agua en las combinaciones 4 y 8 te vas a dar cuenta que tienen una frecuencia de 6 (en el combo 4 guanábana, pitahaya y lychee se prefieren 2 veces cada uno de ellos). En otras palabras, se comprarían seis aguas frescas vendiendo cualquiera de las 2 combinaciones. El asunto, sin embargo, no se detiene allí ya que no es lo mismo Chana que Juana. El dilema ahora es: ¿nos vamos por la combinación 4 o la 8? Hay varios métodos estadísticos que te ayudan a decidir, en caso de empate, cuál combinación es la mejor, de ellos tal vez “Shapley value” (artículo en inglés) sea el más utilizado. La idea básica es obtener un valor que refleje cuántos consumidores comprarían de nuestra línea de productos por lo menos uno de ellos. Por ejemplo, si te fijas en la tabla de combinaciones, Eric compraría en todas las combinaciones; no importa cual le ofrezcas, siempre va a encontrar un producto que le guste. Haciendo el ejercicio de contar las veces que cada sujeto compra en cada combinación por cada producto obtuvimos que la combinación 4 tiene 74 apariciones mientras que la 8 tiene 72. Este procedimiento además de ayudarte a decidir mediante “penalties” que combinación es la mejor también tiene la virtud de prever situaciones más reales del mercado, como falta de abasto. Y el ganador es:

Claro que hacer TURF, como lo hace un borriquito como yo, que sólo sabe la a,e,i,o,u, está del cocol porque podríamos tener decenas de productos y miles de combinaciones y allí si no se puede pero tú puedes hacerlo con Xlstat de forma muy fácil o mejor aún con SPSS (si tienes la versión 18-21) y el add-in de Python**.

Actualización 29-ene-2015. El programa R ya cuenta con un paquete exclusivo para análisis turf.

Gracias por leernos.

* Cuando los políticos hablan de sus ofertas a los electores se basan únicamente en las respuestas que obtienen la mayor frecuencia en esta pregunta. Difícilmente hacen un análisis turf lo cuál les permitiría alcanzar mayor número de votantes.

** SPSS permite desarrollar aplicaciones a través del software libre como R, Python y .Net e integrarlos al programa como si fuera parte del mismo, algo muy parecido a lo que se hace en Excel con VBA aunque con un “alcance” mucho muy superior pues las posibilidades del software libre son ilimitadas. ¿Te das cuenta del negocio en ciernes con esta decisión de SPSS? Hay mucha ayuda en Internet sobre como instalar estos plug-ins, add-ins o simplemente complementos (aquí uno en español). Sin embargo, no es tan fácil instalarlos porque los archivos se instalan de forma automática en carpetas incorrectas. Aquí hay una solución que a mi me funcionó de maravilla en Mac, honestamente no sé si lo haga también en Windows.

ANÁLISIS DE CORRESPONDENCIAS ¡COSA DE CONTAR LOS DULCES!

Mira a un niño pequeño que aún no ha aprendido a contar y te darás cuenta que su forma de analizar las cosas se basa en clasificarlas (categorizarlas). Por ejemplo, si le das una bolsa de dulces, juntará los bombones en un lugar, los chicles en otro, los tamarindos en otro, las paletas en otro más y así por el estilo. Por ejemplo, en México existe la tradición del día de muertos en la cual los niños grandes y chicos salen a la calle a pedir dulces a los transeúntes o casa por casa (es muy parecido a la tradición del Halloween en los Estados Unidos), cuando regresan a casa lo primero que hacen es clasificar los dulces y luego contarlos. Resulta que esta forma de analizar las cosas no se pierde, no importa qué tan grande o viejo seas o qué tan bueno te hayas vuelto para contar.

Siguiendo con el ejemplo, supón que cinco niños regresan de pedir para su calaberita (así se dice en México para pedir los dulces) y cada uno de ellos clasifica y cuenta sus dulces. En la tabla de abajo puedes ver como les fue. ¡Claro! según sus propias cuentas.

tabla dulces

Antes de continuar, es necesario que hagamos un par de observaciones de lo anteriormente dicho:

1. La forma más fácil de familiarizarnos con las marcas o conceptos es clasificándoles. Por eso es tan básico e importante para los mercadólogos medir el conocimiento ayudado y “share of mind” (véase el artículo sobre conocimiento de marca).

2. Aunque el nivel de medición nominal (clasificar las cosas por categorías) es el patito feo de la investigación debido a que es el más básico, tiene la misma fuerza estadística o incluso más que los otros 2 niveles de medición: el ordinal o de intervalo y el de razón; es decir, el que usa escalas convencionales para medir las actitudes o conceptos (Totalmente de acuerdo-Totalmente en desacuerdo, Nada importante-Muy importante, Nada satisfecho-Totalmente satisfecho, etc.) y el que usa universales (peso, edad, kilómetros, tiempo, dinero, etc.), respectivamente.

Debido a lo que acabamos de decir y a la necesidad de ver como les fue a Salvador, Sandra, Carlitos, Juan e Isabel es que surgió el análisis de correspondencias, el cual ya es un viejo conocido de los investigadores de mercados. En pocas palabras, el análisis de correspondencias es un mapa perceptual en el cual puedes ver que tipo de dulces le tocó a cada quien lo que a su ves te ayuda a saber que niños se parecen más por el tipo de dulces que tienen (advertencia: no se refiere a quién tiene más dulces). Por supuesto, que esta técnica además de analizar dulces y niños sirve pa’ otras cosas. ¿Analizar marcas, conceptos, atributos? Sí o cualquier otra cosa que tengas clasificada en una tabla de contingencia. Antes de continuar y para que nos vayamos entendiendo te presento el mapa perceptual de estos singulares niños, hecho con el paquete CA de R.

mapa correspondencias de dulcesY sí, nuevamente. Este post es para explicarte las cuestiones esenciales del análisis de correspondencias y como elaborarlo con el paquete anteriormente mencionado. En general, las estadísticas que hay detrás de él son muy sencillas pero demasiado elaboradas para poderlas hacer a mano, por lo cual no voy a entrar en detalles estadísticos; sin embargo, si quieres una lectura sencilla y que te lleve de la mano acerca de cómo se elabora este mapa puedes leer el libro de (Michael Greenacre: “La Práctica del Análisis de Correspondencias”).

Casi todos los investigadores cuantitativos tenemos nuestro primer contacto con los datos de una investigación a través de una tabla de contingencia o banner, como también se le llama en el mundo de la investigación, y es casi seguro que también todos experimentamos nuestro primer ataque de ansiedad con ella por las siguientes 4 razones:

1. La tabla parece una sopa de letras, de tanto numerito que trae no más no sabemos qué buscar o ver. Para el investigador es tan básico e importante saber leer estas tablas que hay un libro, (“Dígalo con números” de Hans Zeisel) que data de mediados del siglo pasado, cuyo único propósito es explicar como interpretar estas tablas de contingencia.

2. Nos damos cuenta que hay todo un conjunto de conceptos estadísticos que medio conocemos o de plano no sabemos ni jota de ellos, como neto, diferencia significativa, multiplicidad, desviación estándar, entre una veintena de otros más. Y eso sin contar los conceptos mercadólogicos como “top of mind”, “share of mind”, “banner”, “NPS (Net Promoter Score”), etc.

3. Con tantos números que hay en la tabla o banner y nuestro desconocimiento de algunos conceptos estadísticos nos resulta muy difícil ver las relaciones que hay entre las marcas y sus atributos.

4. No está el Chapulín Colorado para que venga a ayudarnos.

Gracias a Dios y a los matemáticos existe el análisis de correspondencias para resolver esos pequeños inconvenientes, sobre todo si queremos mostrarle los datos a los gerentes o personas que no están muy familiarizadas con las tablas de contingencia.

Ahora que ya conocemos el “input” (la tabla que se usa para hacer el mapa) y el “output” (el mapa que resulta de esos datos), así como las razones para usarlo, vamos contestando algunas preguntas:

Pregunta 1. ¿Puedo usar una tabla de frecuencias o porcentajes para hacer el mapa de correspondencias? Sí, es indistinto si usas frecuencias o porcentajes y también si éstos son por renglón o por columna debido a una característica del análisis de correspondencias que analiza de forma simétrica las columnas y renglones de la tabla. Es decir, no importa si caminas parado de manos o de forma normal de todas formas caminas la misma distancia en el mismo tiempo, está chido ¿verdad? Pero eso sí, todos los datos deben estar en porcentajes o en frecuencias, nada de que unos coludos y otros rabones.

Pregunta 2. ¿Cuando debo usar este tipo de mapas? ¡Ah! esa es una excelente pregunta. La mayoría los emplea cuando tiene datos categóricos (frecuencias o porcentajes) porque piensa que es el mapa adecuado para el tipo de datos pero se olvidan que el resultado del mapa no es cuantitativo sino cualitativo; es decir, el mapa no dice qué marca es la más chipocluda sino que solamente señala que marca se distingue por qué atributo. En otras palabras, señala un posicionamiento y no un apalancamiento; debido a esto nosotros sólo lo usamos cuando las marcas ya han estado en el mercado y no para evaluar conceptos nuevos, en ese caso es mejor usar un biplot.

Pregunta 3. ¿Na’ más se puede hacer con el programa R, parece muy difícil? ¡Nelson! También se puede hacer con casi todos los programas estadísticos que conoces: SPSS, SAS, MINITAB, etc. ya que como lo comenté es un viejo conocido de los mercadólogos y es casi obligado para los desarrolladores de software tenerlo entre sus algoritmos básicos; y tampoco es difícil hacerlo en R.

Pregunta 4. ¿Y cómo se hace? Pos fácil. El siguiente video te dice cómo.

Pregunta 5. ¿Cómo se interpreta el mapa? Muy bien, si observas el mapa de arriba te darás cuenta que Sandra se asocia mucho con Bombones, esto no significa que haya recibido más bombones que otro niño, aunque podría ser, sino más bien que es el dulce que más recibió ella en su propio promedio. Por ejemplo, la misma Sandra e Isabel son las que más paletas recibieron y coincidentemente obtuvieron el mismo número de paletas (17) pero Carlitos está más cerca de las paletas que la propia Sandra, esto se debe a que en promedio a Charly le fue mejor en las paletas. En pocas palabras, donde mejor se desempeñe alguien allí es donde va a aparecer.

Pregunta 6. ¿Por qué el mapa se extiende más de manera horizontal que vertical? Debido a que entre los tamarindos y las paletas fue donde se encontraron las mayores diferencias entre los niños. Ojo no son los dulces que más se repartieron pero si los que lo hicieron de manera más inequitativa; de hecho se repartieron más bombones (66) que tamarindos (65) y paletas (60).

Pregunta 7. ¿Esa “inequitatividad” es lo que se llama varianza? !Exacto¡ Si un mapa explica el 100% de varianza quiere decir que las diferencias observadas son idénticas a las que hay en la tabla. En otras palabras, es una foto con una definición HD de los datos que se pueden ver en la tabla; lo que significa que si en el mapa te reportan que la varianza explicada es menor a 70% tal vez el mapa no se relaciona mucho con tu tabla de datos. En el caso del mapa de los dulces la varianza total explicada entre en eje “X” (86.34%) y el “Y” (13.53%) fue de 99.87% o sea que el mapa es todo un “hit”. Por cierto, la varianza va de 0 a 100% siempre, no puede salirse de esos valores.

Pregunta 8. ¿Por qué unos mapas explican mucha diferencia entre marcas y otras poca? Bueno, algunos datos se ajustan a un patrón muy identificable mientras que otros no por lo que se deben usar más dimensiones para explicarlos. Sin embargo, los mapas de correspondencias se presentan, usualmente, en las dimensiones “X” (horizontal) y “Y” (vertical) y se reporta la varianza que explica cada eje o dimensión que sumadas nos da la varianza total explicada. Por eso el mapa se abre más horizontalmente cuando la varianza que explica el eje “X” es mayor que la del eje “Y” y a la inversa, se abre más de forma vertical que horizontal cuando el eje “Y” explica más que “X”. Sé que este tema de varianza es complicado pero es necesario para cualquier investigador por lo que te recomiendo que leas el artículo “Varianza y Covarianza” del libro de Fred N. Kerlinger titulado “Investigación del Comportamiento” o si te da hueva por lo menos échate nuestro artículo de Varianza y el Perico Jefe.

Eso…eso…eso es, toto, toto, toto, todo amigos.