Tag Archives: segmentación

MaxDiff (ESCALAMIENTO DE DIFERENCIAS MÁXIMAS) I de II

Yo tenía siete perros, yo tenía siete perros, de los siete que tenía uno le regalé a Ian, ya no más me quedan seis, seis, seis…Ian es ex alumno de mi esposa de la primaria. La decisión de Ian sobre cual perrito escoger no fue fácil. Primero porque quería llevarse todos, luego porque no le pareció tan descabellada la idea de llevarse sólo dos pero como el trato había sido que nada más le regalábamos uno se tuvo que aplicar; su otro dilema fue: ¿perra o perro? Tal vez, su decisión fue Máx Diffícil porque le mostramos los siete perritos de un sopetón ¿pero qué no es así como en la vida real te dan a escoger? ¿Hubiese sido más fácil si le mostramos los perros por parejas (de dos en dos); mediante un round-robin (todos contra todos), o usando un Diseño Balanceado por Bloques Incompletos (DBBI)? Claro, que con esta última modalidad no le íbamos a decir que se trataba de un DBBI porque entonces seguramente hubiera pensado que eso de escoger un perro definitivamente no es nada fácil.

perritos de maya

Hace buen rato que los modelos de selección han estado con nosotros. El supuesto más importante que justifica su uso es que los humanos no andamos por allí con un metro, báscula, reloj o cualquier otro instrumento de medición para seleccionar los productos o servicios que compramos; nuestras decisiones las hacemos a discreción, apoyándonos únicamente en variables psicológicas o procesos cognoscitivos. Por ejemplo, si compramos un champú, no nos ponemos a pensar en los costos de producción, distribución, mercadotecnia, etc. y sacamos nuestra calculadora para ver si está acorde con el precio que nos están cobrando por él (aunque se dan casos ¿verdad?) simplemente evaluamos si el producto es caro o barato dependiendo de la imagen que tenemos de él. El CBC (Conjoint-Based Choice) y MaxDiff (Escalamiento de Diferencias Máximas) pertenecen a dichos modelos y aunque ambos emplean herramientas estadísticas semejantes su uso depende del propósito de la investigación.

Supón que eres nuevo en el negocio de los helados y deseas saber cuáles sabores son los que más se venden para construir tu oferta con base a ese conocimiento; tienes 3 sabores distintos que deseas evaluar, haces una prueba de sabor dándole a probar a cada sujeto cada uno de los tres sabores en diferente orden para no sesgar tu estudio y luego les preguntas cuál les gusto más y cuál les gusto menos. Teóricamente, lo que estás haciendo es encontrar la diferencia máxima entre esos tres sabores según el gusto de los consumidores ¿Cuál es el fundamento de esta teoría? Se cree que el consumidor evalúa el sabor 1 contra el 2 y el 3; luego hace otra evaluación del 2 contra el 3 y de esta manera selecciona de entre el conjunto de opciones que se le presentan. En otras palabras, tus sujetos de estudio evalúan cada par de opciones y eligen las que presentan las diferencias máximas, señalando cuál es la mejor y cuál la peor. Simple ¿verdad? pero ¿qué pasa si tienes más de 3 sabores, digamos, 12 o como en el caso del autoservicio, todo un pasillo con decenas y decenas de productos? Seguro que jamás has visto un(a) consumidor(a) que se la pase horas y horas evaluando, en un round-robin, todos los productos para decidir cual se lleva.

combinaciones de helados turf

Nuestra mente siempre busca atajos cuando se enfrenta a tareas demasiado demandantes, es demasiado sesgada ¿Es la técnica MaxDiff, tan aplaudida y aclamada por muchos investigadores, el método ideal para estudiar este tipo de problemas? No lo sé y no creo que haya un guapo que diga que si lo sabe pero supongo que esta es la clase de problemas que desea manejar Sawtooth con su nuevo software de Menu-Based Choice. Lamentablemente, como comentamos en el post anterior, el apetito se nos va tan sólo de ver que cuesta 10 mil dólares. Estos comentarios no deben desmotivarte a aprender la técnica, pues es un hecho que nunca ha existido la escala perfecta y por supuesto que MaxDiff tampoco lo iba a ser pero es “cool” y te puede ayudar a tomar mejores decisiones; así que para continuar te vamos a mostrar como hacerle cuando deseas regalar perritos.

Si tu perra tuvo varios cachorros, quizá más de seis, y deseas obtener una escala de diferencias máximas que te los ordene del más preferido al menos preferido, es necesario que los presentes en subconjuntos pequeños llamados bloques ¿Por qué? No querrás que tus sujetos se hagan bolas como Ian con tantos perros ¿o sí? Ahora, lo bueno viene cuando tienes que decidir cómo agrupar las opciones; piensa en el caso de los perritos ¿Debería mostrarle a Ian al Mango junto con la Yeta y la Albina o estos últimos dos junto con Creepy; ¿Y por qué no mostrarle 4 primero y luego 3? ¿Qué tal de 5 en 5? La cosa ya se puso peliaguda ¿Verdad? ¡No te preocupes! Afortunadamente, los matemáticos tienen soluciones a este tipo de problemas, en nuestro caso inventaron algo que se llama…¡correcto! adivinaste. Diseño Balanceado por Bloques Incompleto. Te lo deletreo, se llama balanceado porque hace que todos los perritos sean evaluados el mismo número de veces (en este caso 15 veces cada uno); por bloques porque, como te lo dije antes, el sujeto analiza subconjuntos de perritos en lugar de todo el conjunto de ellos (en este caso 21 bloques); incompletos porque primero ves las manchas, luego la cola y…jajaja (no es cierto), lo que sucede es que en cada bloque sólo es posible presentar una determinada cantidad de perritos (5 en cada bloque).
diseño maxdiff¿Por qué diseñar con tanto esmero y cuidado estos estímulos, tareas o bloques? Pues para evitar sesgos y estimar de forma más precisa los valores. Si logras un buen diseño todos tus perros quedarán conectados como en la ilustración de abajo, en ella puedes ver que el perro que Ian escogió, en algún momento (bloque), tendría que haber sido comparado con cada uno de los otros perros. Para obtener esa imagen conectamos con una línea cada par de números, dentro de cada bloque de la tabla de arriba. La imagen es simétrica y bonita ¿no es así? Pues bien, esa estética obedece a que nuestro DBBI es perfecto.
MaxDiff diseñoYa sé que a estas alturas te estás preguntando “¿Pero cómo carajos le hago para obtener un diseño con estas características?” ¡Elemental, mi querido Watson! Cómprate un software de 4 mil dólares, jajaja (No ¡no te esponjes! es broma). Baja el software R y un complemento o paquete de él que se llama “crossdes” (no debes tener problemas para bajarlos e instalarlos), ábrelo y escribe en la ventana (consola de R) este comando:

find.BIB(7, 21, 5)

Luego presiona la tecla enter y listo aparecerá en tu pantalla un diseño balanceado de bloques incompletos. A ver ¡espérame! algo no anda bien…Mmm…¡Ah, ya sé! Tienes que cambiar los números del paréntesis, en lugar de 7 pon el número de perritos que tienes, no perdón, el número de tratamientos (así se dice, pues); en vez del 21 el número de bloques que deseas generar y cambia el 5 por el número de perritos, digo de tratamientos por bloque…Siento que algo se me olvida…¡Ah! Si, no todos los problemas combinatorios (así se dice también, no lo digo nada más para apantallar) pueden ser balanceados*; tienes que corroborar que tu diseño es bueno o perfecto. Hay dos formas de saberlo, una elegante como la del grafo o red donde aparecen todos los perritos y la otra es tecleando este comando en el mismo programa de R:

isGYD(find.BIB(7, 21, 5))

Presiona enter y en la pantalla va a parecer algo así como:

[1] The design is a balanced incomplete block design w.r.t. rows.

Lo cual quiere decir que tu diseño pasó la prueba. Si la leyenda dice:

[1] The design is neither balanced w.r.t. rows nor w.r.t. columns.

Entonces, es “Houston we have a problem”. Pero no te preocupes demasiado porque afortunadamente también la estadística nos ayuda a estimar con bastante buena precisión diseños que no son completamente balanceados aunque no está por demás que saques frecuencias de cada bloque checando estos cuatro aspectos:

1. Balance. En nuestro caso el perrito de Ian aparece las mismas veces que cualquier otro perrito dentro del diseño completo, 15 veces ni más ni menos.*
2. Independencia (ortogonalidad). El perrito de Ian aparece con cada otro perrito el mismo número de veces, 10 en total con cualquiera de ellos.*
3. Conectividad. En este caso el perrito de Ian está conectado a cualquier otro perrito directamente debido a la cantidad de bloques que hicimos pero no necesita estar conectado directamente, es suficiente con que puedas conectarlo a los a otros indirectamente; es decir, si el perro de Ian estuvo en un bloque con Mango pero no con Maya, es suficiente con que Mango si halla estado con Maya.
4. Rotación (balance por posición). Cuida que los perritos estén rotados dentro de cada bloque, esto es por si el estudio lo haces en papel; si el estudio es mediante dispositivos electrónicos seguramente el programa los rotará de forma automática.

Cómo decía mi Apá, “con calma y no la amanecemos”. La siguiente pregunta es ¿cuántos bloques y opciones (perritos) por bloque debes tener? Sawtooth dice que puede ser entre 4 y 5 opciones por bloque (parece que el estándar está entre 4 pero no hay una regla que te impida hacerlos de 3 o incluso de 6) ¿De acuerdo? Ahora, piensa que entre más bloques más se tardará el sujeto en evaluarlos, tendrá más cansancio y reducirá la calidad de sus respuestas; normalmente nosotros procuramos que no sean más de 20 bloques. Sawtooth tiene artículos muy prácticos que te ayudarán a decidir mejor sobre tus diseños.

¿Se necesita que el entrevistado también mencione la opción menos preferida o es suficiente con que diga cuál es el perrito que escogió? Puedes hacerlos de las dos formas. No hay nada que diga cuál método es superior.

Conclusión.

MaxDiff te sirve sólo para regalar perritos. No, miento tiene otros usos:

1. Es útil para determinar la importancia de los atributos o beneficios. En el caso de la imagen de casinos, que abre este artículo, lo que se buscó fue conocer cuáles eran los atributos más importantes de entre una lista de 39 que teníamos.
2. También sirve para segmentar con base a dichos atributos; para este propósito se utilizan las estructuras de clase latente o mejor conocidas como segmentación de clase latente. Latent Gold, es un excelente software para llevar a cabo este análisis y por supuesto, Sawtooth; ahora que si eres de los que les gustan los retos, R te va a gustar.
3. Otro uso que le puedes dar es evaluar productos o marcas.

* Nota 1. Hay 2 reglas básicas para lograr que tu diseño balanceado por bloques incompletos sea perfecto: cada tratamiento debe aparecer el mismo número de veces en el diseño y la segunda es que cada par de tratamientos aparezcan juntos en el mismo número de bloques. ¿Cómo que cómo? De acuerdo. el resultado en las dos fórmulas de abajo debe ser un entero.

1). r = bk / t
2). λ = r(k-1)/(t-1)

r = veces que aparece el tratamiento en el diseño completo (el perro de Ian aparece el mismo número de veces que los otros perros, 15 en total).
b = número de bloques (21)
k = número de tratamientos en cada bloque (5 perritos por bloque)
t = número total de tratamientos (7 perritos en total)
λ = par de tratamientos que aparecen juntos en el mismo número de bloques. Por ejemplo, el perro de Ian (7) apareció 10 veces con Creepy (perro 1) en 10 bloques.

Nota 2. En el complemento de este post te explicaremos como analizar la información y el software disponible que hay para ello.

Nota 3. Apuesto a que no cambiaste los números del paréntesis en el programa R cuando quisiste checar si tu diseño era bueno. Por supuesto, que debes hacerlo ¿Qué números pones allí? pos depende de los perritos que tengas.

Gracias por leernos.

 

ACTUALIZACIÓN

El paquete “crossdes” de R ya no está disponible por lo que puedes usar en su lugar “AlgDesign”. Los pasos que debes seguir para tu diseño son:
1. Instalar R en tu computadora.
2. Cargar el paquete “AlgDesign” en R. Usa el comando de abajo y presiona enter:
>install.packages(“AlgDesign”)
3. Cargar la librería. Usa el comando de abajo y presiona enter:
>library(“AlgDesign”)
4. Establecer un número aleatorio para tu procedimiento. Puedes usar cualquier número, utiliza el comando de abajo y presiona enter:
>set.seed(12345789)
5. Genera el diseño con el comando “optBlock”. Usa el comando de abajo pero cambia los parámetros de tu diseño. Por ejemplo, en este diseño hay 9 atributos en total, 3 atributos por bloque y 12 bloques en total, sustituye estos números por los de tu propio diseño y presiona enter:
>BIB<-optBlock(~., withinData=factor(1:9), blocksizes=rep(3,12), nRepeats=5000)
6. Despliega el diseño tecleando el nombre del objeto que creaste en este caso “BIB” y presiona enter.
>BIB
7. Ya está, copia el diseño a tu programa de estadísticas favorito para que puedas probarlo o a un procesador de texto para crear tus tarjetas.

SOFTWARE LIBRE

“No me alegra que esté muerto, pero me alegra que se haya ido”. Eso escribió Richard Stallman un día después del fallecimiento de Steve Jobs; la gran mayoría de la gente no conoce a Richard Stallman pero si a Jobs y por si te lo preguntas, Stallman es el padre fundador del software libre, es decir, tiene una filosofía contraria a Jobs y Gates, por hablar de los nombres más representativos del negocio del software. Por supuesto, que no podemos alegrarnos de que Jobs ya no esté con nosotros pues el legado que nos ha dejado es maravilloso y eso sin contar los iPhones, iPads, iPods, Mac’s, etc. pero si podemos alegrarnos de que haya personas como Stallman.

Los que tenemos más de 20 años en este negocio, todavía podemos recordar programas distintos a Excel, SPSS, Word y los otros paquetes que hoy dominan el mercado; asimismo, vimos la rapidez con la que estos programas desplazaron a aquéllos y cómo para bien o para mal fueron las herramientas que se empezaron a enseñar en las escuelas. Con el tiempo el software se volvió caro, muy caro y estúpidamente caro (hace apenas un mes me mostraron un software de investigación de mercados que vale 100 mil dólares). También recuerdo que en la empresa donde inicié, el software se guardaba bajo llave junto con los manuales debido a lo cual aprender era medio complicado pues si tu jefe no lo permitía simplemente no tenías acceso a estas herramientas informáticas. Obviamente, para muchos de nosotros que deseábamos salir adelante, la alternativa era el software pirata.

Actualmente, además del precio, existe otro problema con el software comercial y no me refiero a que se haya borrado totalmente mi agenda de mi iPad con la actualización automática del software operativo vía WiFi, sino a la falta de desarrollo que empieza a ser acuciante en muchas empresas, pongamos de ejemplo al gigante IBM/SPSS, hay muchos procedimientos que simplemente no existen en este software y paradójicamente son de los más solicitados en la actualidad: análisis de estructuras de clases latentes (segmentación), análisis de selecciones discretas (conjoint, maxdiff o diferencias máximas), análisis de rasgos latentes (calibración de reactivos o modelos de rasch y escalas) o simplemente, estadística bayesiana, la cual jamás nos enseñaron en la escuela no obstante que es igual de importante que la estadística clásica. ¿La alternativa? comprar más software y tal vez muy bueno como Latent Gold pero caro.

Otras variantes que en lo personal no me agradan mucho del software comercial que se utiliza para hacer los tipos de análisis antes mencionados son:

1. El software no te lo venden, te lo prestan o rentan por un año.
2. Y al igual que los coches, si quieres con aire acondicionado tanto, con quemacocos otro tanto, con asientos de piel otro tanto más y como si se tratara de artículos suntuarios hay le vas subiendo y subiendo el precio por cada cosa más que necesites.
3. Con el esquema anterior, el precio del software más baratito está arriba de los mil dólares. ¡Ah! pero recuerda eso es cada año.
4. Como están programados para trabajar con comandos discretos sólo puedes pedir tortas de las que hay en el menú, no puedes inventarte tu propia torta con los ingredientes que a ti se te antojen.

Y claro está que estas empresas tienen todo el derecho del mundo a fijar sus precios y vender su software como se les pegue su regalada gana. Pero ¿qué pasaría si como dicen los chinos hubieran opciones yauh peng yauh leng (bonitas y baratas)?

Mucha gente asocia software libre con el sistema operativo GNU/Linux y no es que estén equivocadas pero en la actualidad el software libre abarca prácticamente todas las áreas donde hay software comercial. Por ejemplo, hasta hace algunos años, prácticamente la única que repartía el queso en cierto tipo de estudios (Conjoint Based Choice y MaxDiff) era la empresa Sawtooth Software hoy hay varios que compiten por el mercado como Latent Gold Choice, Statwizards, SurveyAnalytics, pero a la par también hay opciones de software libre como LEM (este programa pertenece a Jeroen Vermunt uno de los creadores de Latent Gold y para obtener una copia hay que solicitarla) o R, en particular, este software, es simplemente lo mejor que nos haya pasado a los que vivimos de las estadísticas y así como GNU/Linux es infinitamente superior a windows, R es mucho, pero mucho mejor que SPSS o SAS; otro ejemplo, sobresaliente de un software libre que es mejor que las versiones comerciales es Gephi que sirve para analizar redes sociales.

Debido a que la mayor parte del software libre es el resultado de la cooperación y entusiasmo de muchos profesionistas su desarrollo está garantizado y normalmente tiende a escalarse mediante módulos llamados plugins, addins, paquetes, etc., que aquéllos van desarrollando y que complementan el alcance del software, de esta forma puedes tener un coche con quemacocos sin que te cueste un centavo más o más bien dicho sin que te haya costado. Por otro lado, como en el caso de R o Gephi, como dice Arjona: “lo que nos pidan podemos, si no podemos no existe y si no existe lo inventamos”. Así de picudo te puedes poner si aprendes a manejar bien estas herramientas.

Recientemente, apareció una estadística sobre los españoles que menciona que 8 de cada 10 personas usan software libre y que están satisfechos con él; no conozco las estadísticas de México pero sé que se encuentra entre los países que menos usa software libre. Es bien contradictorio que siendo un país con tantas carencias se utilice más el software comercial que el libre pero parece ser que la historia del software libre a nivel mundial apenas comienza a escribirse y seguramente el nombre de Richard Stallman no será desconocido por las siguientes generaciones o por lo menos no será menos conocido que el de Steve Jobs o Bill Gates.

Una reflexión para terminar: Si algún día la escuela desea educar para crear individuos libres deberá enseñarles software libre también.

Nota. Este blog es posible gracias al software libre de WordPress.

¿SEGMENTACIÓN DE MERCADO O DEL INFIERNO DE DANTE?

En la divina comedia Dante describe nueve infiernos y según tus mayores pecados, te corresponde uno en específico; Buda decía que debería haber muchos infiernos, tal vez siete, porque sólo uno como que no era lo correcto; no podríamos mandar allí a asesinos junto con tragones. Por otra parte, un contemporáneo de Buda, pensando en lo complejo que era decidir a cuál infierno enviar a una persona, proponía que por lo menos deberían existir setecientos infiernos. Sólo la religión católica tiene un único infierno, y una de dos, o está muy atrasada y no se ha dado cuenta que hay que segmentar para tener éxito o de plano quiere ser la Coca-Cola de las religiones.

infierno de dante

De eso trata la segmentación de mercados, cómo le das a cada quien lo que necesita, quiere o desea sin que esto implique desarrollar setecientas marcas o productos. Las técnicas de segmentación te ayudan a:

1. Detectar cuáles son las necesidades, gustos, actitudes, hábitos o cualesquier otro rasgo o conducta del consumidor que lo lleva a preferir y/o seleccionar determinado producto o marca y con base en ese conocimiento diseñas marcas y productos adecuados para él.

2. Como es muy difícil crear “700 productos y/o marcas” también te ayuda a agrupar a los consumidores en segmentos con necesidades, actitudes, gustos y valores similares, haciendo de esta manera factible crear un menor número de productos o marcas dirigidas a estos segmentos.

Hasta aquí vamos bien, pero entonces surgen dos preguntas, la de antes y después de segmentar. Antes de comenzar te vas a preguntar qué técnica de segmentación debes usar; después de segmentar te vas a preguntar cuántos y en cuáles grupos debes enfocarte. Lamento decirte que no hay técnica para esto; usa tu sentido común o mejor aún, tu experiencia o todavía mucho mejor, analiza tu negocio: qué tan competido está, cuál es la oferta y demanda, que pide tu cliente, tus capacidades, etcétera.

De cualquier manera, déjame explicarte una cosa con respecto a ambos puntos; la mercadotecnia señala que los grupos o segmentos que selecciones deben ser rentables (que haya negocio allí), identificables (que sepas quienes son, donde viven, qué hacen, etcétera.), alcanzables (estén expuestos a algún medio por el cual puedas comunicarte con ellos y esto incluye el canal o lugar donde compran); pero además yo añadiría que los segmentos que obtengas sean validos y confiables estadísticamente.

Estos 2 últimos conceptos están relacionados pero ambos tienen que ver con el número de segmentos y su tamaño. A mayor número de segmentos mayor homogeneidad a menor número de segmentos mayor hetereogeneidad. Es decir, si tienes 100 sujetos tendrás que lidiar con cien distintas formas de pensar y actuar pero si los juntas en grupos con necesidades, gustos, y actitudes similares tu trabajo se simplifica pero obviamente pierdes validez y confiabilidad pues el grupo es más heterogéneo. Así que, más grupos más validez y confiabilidad pero más chamba; menos grupos, menos chamba pero también menor validez y confiabilidad. El asunto es buscar un equilibrio.

Ahora ¿cuál es el método de segmentación que debes emplear? El esquema de arriba te lleva al tour histórico del desarrollo de técnicas de segmentación.

1. Geodemográfica. Al principio del “boom” de los mercados no había mucho de donde escoger y el fabricante segmentaba por puro sentido común: ropa para hombre, para mujer, para bebe, etcétera o por falta de recursos económicos y de infraestructura sólo vendía en cierta zona o región. Sin embargo, con el tiempo crecen las ciudades, empieza a surgir más competencia, los medios estimulan el consumo y entonces se ven en la necesidad de…

2. Actitudinal. Buscar los grupos que más consumen para avocarse a ellos y venderles más. A propósito estos son lo quiebres básicos de cualquier estudio de investigación de mercados: consumidores “heavy”, “medium”, “light”, marca de uso más frecuente o productos que usan, entre otros.

3. Psicológica. Aunque ya se sabía que preferían las mujeres, los hombres, quienes consumían más y quienes menos, había inconsistencias en los datos, no todas las mujeres compran los mismos productos o marcas, ni tampoco lo hacen entre los hombres o en una misma región se prefiere solo una determinada marca, ni mucho menos los grandes consumidores compran lo mismo por lo que se pensó en segmentar al mercado de acuerdo a rasgos psicológicos que explicaran la conducta de consumo y selección de marca pero nuevamente esta apuesta falló y hoy es una “especie en peligro de extinción”.

4. Actividades, Intereses y Opiniones (AIO). Se puede decir que la psicología es el antecedente de esta técnica de segmentación sumamente popular que busca clasificar al consumidor de acuerdo a lo que hace en sus ratos libres, “hobbies”, entretenimientos, lo que le interesa y las opiniones que tiene en general sobre diversos temas como política, consumo, etcétera. Los inventarios como LIFE STYLES, VALS, entre otros caen en esta categoría. Sin embargo, esta serie de hechos acerca del consumidor no explicaban porque consumían determinadas marcas lo cual es el meollo del asunto.

5. Atributos, Beneficios y Valores (ABV). La propuesta más reciente vincula directamente a la marca con los valores del consumidor y en esencia explica los atributos y beneficios que el consumidor busca en el producto y que se relacionan a su más alto nivel de valores.

En la práctica es posible encontrar todo tipo de segmentación y en cualquiera de los niveles que acabamos de explicar porque cada una de estos métodos enriquecen el análisis y proporcionan una descripción más completa de cada segmento. Lo indispensable en todo esto es que verifiques que los segmentos resultantes tengan un poder de discriminación entre las marcas que consumen; si los segmentos no se diferencian por las marcas que consumen entonces, lo siento pero tu segmentación no sirve.

¿Si quieres saber más o necesitas técnicas estadísticas de análisis para segmentar? contáctanos. Au revoir