Tag Archives: maxdiff

MaxDiff (ESCALAMIENTO DE DIFERENCIAS MAXIMAS) II de II

Me contó un amigo que un día estaba en la iglesia y que a unos cuántos metros de él había un hombre que pedía fervientemente a Dios 100 mil pesos; cuando vio llegar a otro hombre, el cual se hincó justo al lado del primero e inmediatamente comenzó a rezarle a Dios para pedirle mil pesos, no había hecho su plegaria ni dos veces cuando el que pedía 100 mil pesos sacó de su cartera los mil pesos, se los dio al otro devoto creyente y le dijo: ¡Toma y lárgate de aquí que me lo distraes! Dicen que Dios no hace diferencias entre sus hijos pero los humanos sí y eso es lo que intentamos medir con la técnica MaxDiff.

Intentamos medir las diferencias en la percepción de los consumidores sobre marcas y/o atributos; esto usualmente se hace mediante escalas y MaxDiff es una escala; más elaborada estadísticamente que la gran mayoría pero con ventajas psicométricas que la hacen la preferida de muchos investigadores y la inútil para otros tantos. Es algo parecido a la “Gran Ola de la Corriente Tortuga” o sea el Kame Hame Ha de Gokú que es bueno pero no infalible ¿Quieres convertirte en Super Sayayin? Sigue leyendo.

Esquemáticamente, un análisis maxdiff se hace así: primero, debes decidir qué medir, en cuyo caso, comúnmente, hay de dos sopas, a). evaluar marcas o conceptos y b). evaluar características o atributos de la marca o el concepto. Por ejemplo, en una pequeña encuesta que acabamos de hacer les preguntamos a los entrevistados “¿Para usted, cuál de estos bancos es el mejor y cuál es el peor?” (véase la figura de abajo), lo que pretendíamos medir en dicho caso son las marcas de bancos.

mejor banco maxdiff

Si hubiéramos preguntado “¿Cuál de estos atributos es el más importante en una tarjeta de crédito y cuál es el menos importante?” (véase la figura de abajo), entonces hubiésemos estado más interesados en medir la importancia de los atributos de las tarjetas de crédito en lugar de las marcas de tarjetas de crédito.

atributos maxdiff

El segundo paso es crear los estímulos o tarjetas donde vienen los marcas o atributos que deseas evaluar; eso es lo que se llama diseño experimental y aunque parece complicado no lo es ya que sólo se trata de que combines bien las marcas o atributos de forma tal que sea pareja la cosa, como decía mi amá: “o todos coludos o todos rabones”. Para hacerlo guíate de este post (clic aquí).

El tercer paso es analizar los datos de la encuesta, hay dos formas de hacerlo:

a). Contando las veces que cada atributo o marca fue mencionada como “el mejor”, restarle las veces que fue mencionado como “el peor” y dividir el resultado entre el número de veces que fue evaluado el atributo o marca; en otras palabras, sacar un promedio. Por ejemplo, si el atributo A fue seleccionado como “el mejor” 2 veces y 1 vez como “el peor” en 6 ocasiones que fue evaluado, entonces su puntaje es (2-1)/6 = .16. El principal problema con este enfoque es que no pela para nada tu diseño experimental; es decir, si la marca A se junto con la marca D, marca E y G no importa, lo que importa es que haya una marca ganadora y una perdedora así que las interacciones entre esas marcas no cuentan; Sawtooth dice que este tipo de análisis resulta útil es ciertos casos dándote una buena idea de por donde anda el resultado o sea te puede resolver la vida si es que no eres muy exigente. Si quieres más detalles sobre como hacer el análisis consulta este paper de Sawtooth o esta página .

b). Utilizando software estadístico para modelos de selección discreta. En la siguiente tabla están las principales opciones de software; he puesto los costos, capacidad y el grado de facilidad para aprender cada programa.

comparacion softaware maxdiff

Bien, Sawtooth es el jefe, casi todo mundo lo usa, tiene toneladas de información y es fácil de aprender; Latent Gold Choice es lo que llaman los gringos “state of the art” o sea el último grito de la moda debido a los modelos refinados que utiliza, su interface es muy similar a la de SPSS con la cual mucha gente está familiarizada y es más o menos sencillo de aprender aunque no te ayuda a crear los estímulos de tu estudio lo cual puede ser un problema pues también se requieren cuando deseas hacer un estudio de conjoint; SAS es el peso pesado de todos ellos pero al parecer es caro, el servicio es malo (si no me crees intenta que te den un demo) aunque te resuelve la vida al 100% en todo lo que alguna vez hayas deseado hacer en investigación de mercados; Q es muy parecido a Latent Gold, se acopla muy bien al formato de SPSS y es bastante amigable, desafortunadamente falta información y tampoco crea los estímulos; puedes solicitar un demo sin los problemas a los que te enfrentarías con SAS; R es difícil para mucha gente pero tiene todo lo que se puede pedir para hacer análisis y en muchos casos es más sencillo que SAS; por ejemplo, para analizar maxdiff en R utilizando un simple modelo logit standard la cosa es sencilla.

¿Mi recomendación? Empieza a aprender R pero si tienes las posibilidad de comprar un software que te resuelva la vida al 100% pues tienes mi bendición.

Por favor animate a comentar que con eso ayudas a que este blog crezca.

MaxDiff (ESCALAMIENTO DE DIFERENCIAS MÁXIMAS) I de II

Yo tenía siete perros, yo tenía siete perros, de los siete que tenía uno le regalé a Ian, ya no más me quedan seis, seis, seis…Ian es ex alumno de mi esposa de la primaria. La decisión de Ian sobre cual perrito escoger no fue fácil. Primero porque quería llevarse todos, luego porque no le pareció tan descabellada la idea de llevarse sólo dos pero como el trato había sido que nada más le regalábamos uno se tuvo que aplicar; su otro dilema fue: ¿perra o perro? Tal vez, su decisión fue Máx Diffícil porque le mostramos los siete perritos de un sopetón ¿pero qué no es así como en la vida real te dan a escoger? ¿Hubiese sido más fácil si le mostramos los perros por parejas (de dos en dos); mediante un round-robin (todos contra todos), o usando un Diseño Balanceado por Bloques Incompletos (DBBI)? Claro, que con esta última modalidad no le íbamos a decir que se trataba de un DBBI porque entonces seguramente hubiera pensado que eso de escoger un perro definitivamente no es nada fácil.

perritos de maya

Hace buen rato que los modelos de selección han estado con nosotros. El supuesto más importante que justifica su uso es que los humanos no andamos por allí con un metro, báscula, reloj o cualquier otro instrumento de medición para seleccionar los productos o servicios que compramos; nuestras decisiones las hacemos a discreción, apoyándonos únicamente en variables psicológicas o procesos cognoscitivos. Por ejemplo, si compramos un champú, no nos ponemos a pensar en los costos de producción, distribución, mercadotecnia, etc. y sacamos nuestra calculadora para ver si está acorde con el precio que nos están cobrando por él (aunque se dan casos ¿verdad?) simplemente evaluamos si el producto es caro o barato dependiendo de la imagen que tenemos de él. El CBC (Conjoint-Based Choice) y MaxDiff (Escalamiento de Diferencias Máximas) pertenecen a dichos modelos y aunque ambos emplean herramientas estadísticas semejantes su uso depende del propósito de la investigación.

Supón que eres nuevo en el negocio de los helados y deseas saber cuáles sabores son los que más se venden para construir tu oferta con base a ese conocimiento; tienes 3 sabores distintos que deseas evaluar, haces una prueba de sabor dándole a probar a cada sujeto cada uno de los tres sabores en diferente orden para no sesgar tu estudio y luego les preguntas cuál les gusto más y cuál les gusto menos. Teóricamente, lo que estás haciendo es encontrar la diferencia máxima entre esos tres sabores según el gusto de los consumidores ¿Cuál es el fundamento de esta teoría? Se cree que el consumidor evalúa el sabor 1 contra el 2 y el 3; luego hace otra evaluación del 2 contra el 3 y de esta manera selecciona de entre el conjunto de opciones que se le presentan. En otras palabras, tus sujetos de estudio evalúan cada par de opciones y eligen las que presentan las diferencias máximas, señalando cuál es la mejor y cuál la peor. Simple ¿verdad? pero ¿qué pasa si tienes más de 3 sabores, digamos, 12 o como en el caso del autoservicio, todo un pasillo con decenas y decenas de productos? Seguro que jamás has visto un(a) consumidor(a) que se la pase horas y horas evaluando, en un round-robin, todos los productos para decidir cual se lleva.

combinaciones de helados turf

Nuestra mente siempre busca atajos cuando se enfrenta a tareas demasiado demandantes, es demasiado sesgada ¿Es la técnica MaxDiff, tan aplaudida y aclamada por muchos investigadores, el método ideal para estudiar este tipo de problemas? No lo sé y no creo que haya un guapo que diga que si lo sabe pero supongo que esta es la clase de problemas que desea manejar Sawtooth con su nuevo software de Menu-Based Choice. Lamentablemente, como comentamos en el post anterior, el apetito se nos va tan sólo de ver que cuesta 10 mil dólares. Estos comentarios no deben desmotivarte a aprender la técnica, pues es un hecho que nunca ha existido la escala perfecta y por supuesto que MaxDiff tampoco lo iba a ser pero es “cool” y te puede ayudar a tomar mejores decisiones; así que para continuar te vamos a mostrar como hacerle cuando deseas regalar perritos.

Si tu perra tuvo varios cachorros, quizá más de seis, y deseas obtener una escala de diferencias máximas que te los ordene del más preferido al menos preferido, es necesario que los presentes en subconjuntos pequeños llamados bloques ¿Por qué? No querrás que tus sujetos se hagan bolas como Ian con tantos perros ¿o sí? Ahora, lo bueno viene cuando tienes que decidir cómo agrupar las opciones; piensa en el caso de los perritos ¿Debería mostrarle a Ian al Mango junto con la Yeta y la Albina o estos últimos dos junto con Creepy; ¿Y por qué no mostrarle 4 primero y luego 3? ¿Qué tal de 5 en 5? La cosa ya se puso peliaguda ¿Verdad? ¡No te preocupes! Afortunadamente, los matemáticos tienen soluciones a este tipo de problemas, en nuestro caso inventaron algo que se llama…¡correcto! adivinaste. Diseño Balanceado por Bloques Incompleto. Te lo deletreo, se llama balanceado porque hace que todos los perritos sean evaluados el mismo número de veces (en este caso 15 veces cada uno); por bloques porque, como te lo dije antes, el sujeto analiza subconjuntos de perritos en lugar de todo el conjunto de ellos (en este caso 21 bloques); incompletos porque primero ves las manchas, luego la cola y…jajaja (no es cierto), lo que sucede es que en cada bloque sólo es posible presentar una determinada cantidad de perritos (5 en cada bloque).
diseño maxdiff¿Por qué diseñar con tanto esmero y cuidado estos estímulos, tareas o bloques? Pues para evitar sesgos y estimar de forma más precisa los valores. Si logras un buen diseño todos tus perros quedarán conectados como en la ilustración de abajo, en ella puedes ver que el perro que Ian escogió, en algún momento (bloque), tendría que haber sido comparado con cada uno de los otros perros. Para obtener esa imagen conectamos con una línea cada par de números, dentro de cada bloque de la tabla de arriba. La imagen es simétrica y bonita ¿no es así? Pues bien, esa estética obedece a que nuestro DBBI es perfecto.
MaxDiff diseñoYa sé que a estas alturas te estás preguntando “¿Pero cómo carajos le hago para obtener un diseño con estas características?” ¡Elemental, mi querido Watson! Cómprate un software de 4 mil dólares, jajaja (No ¡no te esponjes! es broma). Baja el software R y un complemento o paquete de él que se llama “crossdes” (no debes tener problemas para bajarlos e instalarlos), ábrelo y escribe en la ventana (consola de R) este comando:

find.BIB(7, 21, 5)

Luego presiona la tecla enter y listo aparecerá en tu pantalla un diseño balanceado de bloques incompletos. A ver ¡espérame! algo no anda bien…Mmm…¡Ah, ya sé! Tienes que cambiar los números del paréntesis, en lugar de 7 pon el número de perritos que tienes, no perdón, el número de tratamientos (así se dice, pues); en vez del 21 el número de bloques que deseas generar y cambia el 5 por el número de perritos, digo de tratamientos por bloque…Siento que algo se me olvida…¡Ah! Si, no todos los problemas combinatorios (así se dice también, no lo digo nada más para apantallar) pueden ser balanceados*; tienes que corroborar que tu diseño es bueno o perfecto. Hay dos formas de saberlo, una elegante como la del grafo o red donde aparecen todos los perritos y la otra es tecleando este comando en el mismo programa de R:

isGYD(find.BIB(7, 21, 5))

Presiona enter y en la pantalla va a parecer algo así como:

[1] The design is a balanced incomplete block design w.r.t. rows.

Lo cual quiere decir que tu diseño pasó la prueba. Si la leyenda dice:

[1] The design is neither balanced w.r.t. rows nor w.r.t. columns.

Entonces, es “Houston we have a problem”. Pero no te preocupes demasiado porque afortunadamente también la estadística nos ayuda a estimar con bastante buena precisión diseños que no son completamente balanceados aunque no está por demás que saques frecuencias de cada bloque checando estos cuatro aspectos:

1. Balance. En nuestro caso el perrito de Ian aparece las mismas veces que cualquier otro perrito dentro del diseño completo, 15 veces ni más ni menos.*
2. Independencia (ortogonalidad). El perrito de Ian aparece con cada otro perrito el mismo número de veces, 10 en total con cualquiera de ellos.*
3. Conectividad. En este caso el perrito de Ian está conectado a cualquier otro perrito directamente debido a la cantidad de bloques que hicimos pero no necesita estar conectado directamente, es suficiente con que puedas conectarlo a los a otros indirectamente; es decir, si el perro de Ian estuvo en un bloque con Mango pero no con Maya, es suficiente con que Mango si halla estado con Maya.
4. Rotación (balance por posición). Cuida que los perritos estén rotados dentro de cada bloque, esto es por si el estudio lo haces en papel; si el estudio es mediante dispositivos electrónicos seguramente el programa los rotará de forma automática.

Cómo decía mi Apá, “con calma y no la amanecemos”. La siguiente pregunta es ¿cuántos bloques y opciones (perritos) por bloque debes tener? Sawtooth dice que puede ser entre 4 y 5 opciones por bloque (parece que el estándar está entre 4 pero no hay una regla que te impida hacerlos de 3 o incluso de 6) ¿De acuerdo? Ahora, piensa que entre más bloques más se tardará el sujeto en evaluarlos, tendrá más cansancio y reducirá la calidad de sus respuestas; normalmente nosotros procuramos que no sean más de 20 bloques. Sawtooth tiene artículos muy prácticos que te ayudarán a decidir mejor sobre tus diseños.

¿Se necesita que el entrevistado también mencione la opción menos preferida o es suficiente con que diga cuál es el perrito que escogió? Puedes hacerlos de las dos formas. No hay nada que diga cuál método es superior.

Conclusión.

MaxDiff te sirve sólo para regalar perritos. No, miento tiene otros usos:

1. Es útil para determinar la importancia de los atributos o beneficios. En el caso de la imagen de casinos, que abre este artículo, lo que se buscó fue conocer cuáles eran los atributos más importantes de entre una lista de 39 que teníamos.
2. También sirve para segmentar con base a dichos atributos; para este propósito se utilizan las estructuras de clase latente o mejor conocidas como segmentación de clase latente. Latent Gold, es un excelente software para llevar a cabo este análisis y por supuesto, Sawtooth; ahora que si eres de los que les gustan los retos, R te va a gustar.
3. Otro uso que le puedes dar es evaluar productos o marcas.

* Nota 1. Hay 2 reglas básicas para lograr que tu diseño balanceado por bloques incompletos sea perfecto: cada tratamiento debe aparecer el mismo número de veces en el diseño y la segunda es que cada par de tratamientos aparezcan juntos en el mismo número de bloques. ¿Cómo que cómo? De acuerdo. el resultado en las dos fórmulas de abajo debe ser un entero.

1). r = bk / t
2). λ = r(k-1)/(t-1)

r = veces que aparece el tratamiento en el diseño completo (el perro de Ian aparece el mismo número de veces que los otros perros, 15 en total).
b = número de bloques (21)
k = número de tratamientos en cada bloque (5 perritos por bloque)
t = número total de tratamientos (7 perritos en total)
λ = par de tratamientos que aparecen juntos en el mismo número de bloques. Por ejemplo, el perro de Ian (7) apareció 10 veces con Creepy (perro 1) en 10 bloques.

Nota 2. En el complemento de este post te explicaremos como analizar la información y el software disponible que hay para ello.

Nota 3. Apuesto a que no cambiaste los números del paréntesis en el programa R cuando quisiste checar si tu diseño era bueno. Por supuesto, que debes hacerlo ¿Qué números pones allí? pos depende de los perritos que tengas.

Gracias por leernos.

 

ACTUALIZACIÓN

El paquete “crossdes” de R ya no está disponible por lo que puedes usar en su lugar “AlgDesign”. Los pasos que debes seguir para tu diseño son:
1. Instalar R en tu computadora.
2. Cargar el paquete “AlgDesign” en R. Usa el comando de abajo y presiona enter:
>install.packages(“AlgDesign”)
3. Cargar la librería. Usa el comando de abajo y presiona enter:
>library(“AlgDesign”)
4. Establecer un número aleatorio para tu procedimiento. Puedes usar cualquier número, utiliza el comando de abajo y presiona enter:
>set.seed(12345789)
5. Genera el diseño con el comando “optBlock”. Usa el comando de abajo pero cambia los parámetros de tu diseño. Por ejemplo, en este diseño hay 9 atributos en total, 3 atributos por bloque y 12 bloques en total, sustituye estos números por los de tu propio diseño y presiona enter:
>BIB<-optBlock(~., withinData=factor(1:9), blocksizes=rep(3,12), nRepeats=5000)
6. Despliega el diseño tecleando el nombre del objeto que creaste en este caso “BIB” y presiona enter.
>BIB
7. Ya está, copia el diseño a tu programa de estadísticas favorito para que puedas probarlo o a un procesador de texto para crear tus tarjetas.

SOFTWARE LIBRE

“No me alegra que esté muerto, pero me alegra que se haya ido”. Eso escribió Richard Stallman un día después del fallecimiento de Steve Jobs; la gran mayoría de la gente no conoce a Richard Stallman pero si a Jobs y por si te lo preguntas, Stallman es el padre fundador del software libre, es decir, tiene una filosofía contraria a Jobs y Gates, por hablar de los nombres más representativos del negocio del software. Por supuesto, que no podemos alegrarnos de que Jobs ya no esté con nosotros pues el legado que nos ha dejado es maravilloso y eso sin contar los iPhones, iPads, iPods, Mac’s, etc. pero si podemos alegrarnos de que haya personas como Stallman.

Los que tenemos más de 20 años en este negocio, todavía podemos recordar programas distintos a Excel, SPSS, Word y los otros paquetes que hoy dominan el mercado; asimismo, vimos la rapidez con la que estos programas desplazaron a aquéllos y cómo para bien o para mal fueron las herramientas que se empezaron a enseñar en las escuelas. Con el tiempo el software se volvió caro, muy caro y estúpidamente caro (hace apenas un mes me mostraron un software de investigación de mercados que vale 100 mil dólares). También recuerdo que en la empresa donde inicié, el software se guardaba bajo llave junto con los manuales debido a lo cual aprender era medio complicado pues si tu jefe no lo permitía simplemente no tenías acceso a estas herramientas informáticas. Obviamente, para muchos de nosotros que deseábamos salir adelante, la alternativa era el software pirata.

Actualmente, además del precio, existe otro problema con el software comercial y no me refiero a que se haya borrado totalmente mi agenda de mi iPad con la actualización automática del software operativo vía WiFi, sino a la falta de desarrollo que empieza a ser acuciante en muchas empresas, pongamos de ejemplo al gigante IBM/SPSS, hay muchos procedimientos que simplemente no existen en este software y paradójicamente son de los más solicitados en la actualidad: análisis de estructuras de clases latentes (segmentación), análisis de selecciones discretas (conjoint, maxdiff o diferencias máximas), análisis de rasgos latentes (calibración de reactivos o modelos de rasch y escalas) o simplemente, estadística bayesiana, la cual jamás nos enseñaron en la escuela no obstante que es igual de importante que la estadística clásica. ¿La alternativa? comprar más software y tal vez muy bueno como Latent Gold pero caro.

Otras variantes que en lo personal no me agradan mucho del software comercial que se utiliza para hacer los tipos de análisis antes mencionados son:

1. El software no te lo venden, te lo prestan o rentan por un año.
2. Y al igual que los coches, si quieres con aire acondicionado tanto, con quemacocos otro tanto, con asientos de piel otro tanto más y como si se tratara de artículos suntuarios hay le vas subiendo y subiendo el precio por cada cosa más que necesites.
3. Con el esquema anterior, el precio del software más baratito está arriba de los mil dólares. ¡Ah! pero recuerda eso es cada año.
4. Como están programados para trabajar con comandos discretos sólo puedes pedir tortas de las que hay en el menú, no puedes inventarte tu propia torta con los ingredientes que a ti se te antojen.

Y claro está que estas empresas tienen todo el derecho del mundo a fijar sus precios y vender su software como se les pegue su regalada gana. Pero ¿qué pasaría si como dicen los chinos hubieran opciones yauh peng yauh leng (bonitas y baratas)?

Mucha gente asocia software libre con el sistema operativo GNU/Linux y no es que estén equivocadas pero en la actualidad el software libre abarca prácticamente todas las áreas donde hay software comercial. Por ejemplo, hasta hace algunos años, prácticamente la única que repartía el queso en cierto tipo de estudios (Conjoint Based Choice y MaxDiff) era la empresa Sawtooth Software hoy hay varios que compiten por el mercado como Latent Gold Choice, Statwizards, SurveyAnalytics, pero a la par también hay opciones de software libre como LEM (este programa pertenece a Jeroen Vermunt uno de los creadores de Latent Gold y para obtener una copia hay que solicitarla) o R, en particular, este software, es simplemente lo mejor que nos haya pasado a los que vivimos de las estadísticas y así como GNU/Linux es infinitamente superior a windows, R es mucho, pero mucho mejor que SPSS o SAS; otro ejemplo, sobresaliente de un software libre que es mejor que las versiones comerciales es Gephi que sirve para analizar redes sociales.

Debido a que la mayor parte del software libre es el resultado de la cooperación y entusiasmo de muchos profesionistas su desarrollo está garantizado y normalmente tiende a escalarse mediante módulos llamados plugins, addins, paquetes, etc., que aquéllos van desarrollando y que complementan el alcance del software, de esta forma puedes tener un coche con quemacocos sin que te cueste un centavo más o más bien dicho sin que te haya costado. Por otro lado, como en el caso de R o Gephi, como dice Arjona: “lo que nos pidan podemos, si no podemos no existe y si no existe lo inventamos”. Así de picudo te puedes poner si aprendes a manejar bien estas herramientas.

Recientemente, apareció una estadística sobre los españoles que menciona que 8 de cada 10 personas usan software libre y que están satisfechos con él; no conozco las estadísticas de México pero sé que se encuentra entre los países que menos usa software libre. Es bien contradictorio que siendo un país con tantas carencias se utilice más el software comercial que el libre pero parece ser que la historia del software libre a nivel mundial apenas comienza a escribirse y seguramente el nombre de Richard Stallman no será desconocido por las siguientes generaciones o por lo menos no será menos conocido que el de Steve Jobs o Bill Gates.

Una reflexión para terminar: Si algún día la escuela desea educar para crear individuos libres deberá enseñarles software libre también.

Nota. Este blog es posible gracias al software libre de WordPress.