Tag Archives: desviación estándar

VARIANZA Y EL PERICO JEFE

Primero un chiste. Una persona deseaba comprar un perico por lo que se dirige a la tienda de mascotas y pregunta el precio del perico más distinguido de la tienda, el precio que le da el vendedor supera su presupuesto por lo que se fija en otro perico, no tan bonito como el primero; sin embargo, cuando pregunta cuánto cuesta, el vendedor sube el precio al doble; el comprador ya molesto discute con el vendedor diciéndole que cómo es posible que valga el doble si es más chico y menos bonito que el primer perico, a lo que el vendedor le contesta que se debe a que este perico habla. Un poco más tranquilo pero no muy convencido, decide preguntar por otro perico que se ve descuidado; no obstante, el vendedor sube aun más el precio de esta mascota; el comprador, francamente molesto, exige una explicación de porqué es tan caro y el vendedor con mucha calma responde “vale eso porque es bilingüe, además del español también habla inglés”; el comprador con el enojo reflejado en su rostro, le grita al vendedor “dónde están los pericos que no hablan” y éste sin exaltarse y con mucha tranquilidad le señala un rincón donde se encuentra un perico descansando y de peor aspecto que los anteriores; el comprador lo ve y se da cuenta que no es la mascota que desea aunque siente cierta compasión por la pobre ave y decide comprarlo pero cuando pregunta el precio; el vendedor simplemente se limita a responder que vale 5 veces más que el perico bilingüe. “Ahora sí, despertaste al dragón” dice el comprador hecho una furia y sujetando al vendedor por el cuello tratando de estrangularlo le dice “¿por qué es tan caro, si está horrible y además no habla ningún idioma?”, el vendedor con una voz ronca y que apenas se alcanza a escuchar dice “ya sé que no habla ningún idioma, ni sabe hacer nada pero todos los demás pericos le dicen jefe”.

Para muchos mercadólogos y también para algunos investigadores de mercado varianza es un concepto difícil de entender; no obstante, que es el más importante en investigación. Si no existiera la varianza no habría nada que comparar, nada que aprender, todo sería igual, no existiría la noche ni el día, la luz ni la obscuridad, lo bello ni lo feo, lo amargo ni lo dulce, ni siquiera existiría la vida, ni la tierra ni nada. Quizá, nunca te hayas detenido a pensar en esto pero gracias a esas variaciones tú aprendes; el proceso es así: observas, comparas y aprendes y lo haces una y otra vez en un ciclo interminable; si fueras una computadora diríamos que iteras; estás iterando cada vez que observas alguna diferencia; alguna veces logras entender porqué se da esa diferencia, es decir, de donde viene la varianza pero otras veces simplemente no sabes porqué suceden las cosas así, como en el caso del perico jefe.

Tres entrañables amigos tienen en total $18.00 pesos:

El niño Calderón tiene: $12.00 pesos
El niño Beltrones tiene: $ 5.00 pesos
El niño Peje tiene: $ 1.00 peso

Si no existieran variaciones diferencias entre estos amigos ¿cuánto dinero, de esos $18.00 pesos, crees que traería cada uno de ellos? es muy fácil, ¿verdad? cada uno de ellos traería $ 6.00 pesos. Si eres observador te darás cuenta que ese número es ni más ni menos que el promedio. Ahora si, pon mucha atención, el promedio es el número a partir del cual comparamos y observamos las diferencias; la varianza es otro promedio de esas diferencias. Calderón tiene $ 6.00 pesos más que el promedio; Beltrones $ 1.00 peso menos que el promedio y el Peje $ 5.00 pesos menos que el promedio. Para sacar el promedio de esas diferencias tenemos que sumarlas pero si lo haces así, como va, sin miramientos, el resultado sería cero: + 6 – 1 – 5 = 0; debido a esa circunstancia es que se elevan al cuadrado las diferencias para eliminar los números negativas y poder promediarlos; a la suma de esos números elevados al cuadro se le llama suma de cuadrados y al promedio se le llama varianza; a propósito si le sacas raíz cuadrada a la varianza obtienes la desviación estándar. ¡Precaución! la forma de calcular la varianza difiere un poco de la manera en que se ilustra aquí.

tabla de varianza

Ahora imagínate una cascara de basquetbol entre cuatro amigos:

El equipo 1 compuesto por los jugadores A y B contra el equipo 2 formado por los jugadores C y D en este juego gana el equipo 1.
Se echan otro partidito pero intercambian pareja:
El equipo 1 ahora se compone por los jugadores A y C y el equipo 2 por los jugadores B y D, en este otro juego gana nuevamente el equipo 1.
Juegan un tercer partido y de nueva cuenta intercambian jugadores:
El equipo 1 se compone de los jugadores A y D contra el equipo 2 formado por los jugadores B y C el resultado es idéntico vuelve a ganar el equipo 1.
Ya te diste cuenta que el jugador A es la principal fuente de variación de los resultados, siempre gana el equipo en el que juega. Tu trabajo como investigador es descubrir de donde viene esa varianza ¿Será que el jugador A es más alto, más fuerte, es profesional, tiene mejor técnica, etc. etc.? Cuando investigamos sobre algún producto, por ejemplo, un desodorante, debemos usarlo, olerlo, observarlo en el punto de venta, etc., etc. porque sólo así sabremos de donde provienen los resultados que nos arroja la investigación. La experiencia de un investigador es importante porque conoce mucho, sabe de dónde pueden venir las fuentes de variación, las diferencias, con ese conocimiento el mercadólogo puede hacer un mejor juego.

BKC,  Haukur Palsson ,  J.T. Terrell

Observa la imagen de arriba y dime algunas cosas tácticas que está haciendo el jugador que lleva el balón, te ayudo con unas cuantas:

1. Bota el balón muy cerca del suelo porque así es más difícil que el rival se lo quite.

2. Bota el balón con la mano derecha porque así lo pone lo más lejos que se puede del rival.

3. Asimismo, trata de alejar la mano derecha lo más que puede para maximizar esa distancia.

4. Inclina el cuerpo para empujar psicológicamente a su rival lejos del balón.

5. Esa misma inclinación le ayuda a adelantar el hombro y tratar de escabullirse por debajo del contrario.

¿Puedes ver algunas más? deja un comentario sobre ellas o lo que quieras. No te pierdas el próximo post, te voy a dar un programa en Excel para que evalúes el poder de tu marca. Hasta la próxima.

ERROR DE MUESTREO Y LA FÓRMULA 1 ENTRE RAIZ DE n

Allá, por el lejano 1,999 del siglo pasado, cuando trabajaba en Pearson, Viterbo Berberena, un buen amigo y excelente matemático-estadístico, me preguntaba por qué utilizábamos la fórmula 1/√n para obtener el error de muestreo. Contesté tímidamente que no lo sabía, que así me la habían enseñado pero era fácil de recordar y funcionaba bien. Por supuesto, que esta respuesta para una persona que está acostumbrada a trabajar con fórmulas es totalmente inaceptable; la fórmula debe ser tan clara como el agua más cristalina que hayas visto y si acaso está codificada, todos deberían entender de que se trata; como la consabida forma matricial de Ax=b la cual todos los matemáticos saben que se refiere a un sistema de ecuaciones simultáneas. Sí, esas que nos enseñaron a resolver en la secundaria. Sin embargo, para la fórmula 1/√n no sucede así ya que sólo la entienden los investigadores de mercado y eso no todos. Si te parece, vamos a ver primero como funciona esta fórmula y en un momento más te digo como la decodificamos en ese entonces Viterbo y yo.

Imagina que les preguntas a 10 gatos (i.e, Don Gato, Felix El Gato, Tom, Garfield) cuál alimento prefieren y 8 de ellos te dicen que prefieren Whiskas; en números relativos representan el 80% (8/10 = .8). Entonces vas corriendo con tu jefe y le dices: “Sabemos que 8 de cada 10 gatos prefieren Whiskas” y tú jefe te dice: “¡wait a minute! ¿estás seguro de lo que me estás diciendo? Porque si es así puedo lanzar una excelente campaña que se podría llamar ocho de cada diez gatos prefieren Whiskas”. Así como respondí yo tibiamente a mi amigo, a ti también te asalta la duda e inmediatamente te das cuenta que no puedes asegurarlo porque no les preguntaste qué alimento preferían a Benito Bodoque, Cucho, Demóstenes, Silvestre, en resumen, a todos los gatos. Qué tal que a los que te faltó entrevistar les gusta, digamos, Gatina, claro que ese 80% podría bajar o quizá subir, si es que también les gusta la marca Whiskas. Por otro lado, te das cuenta que entrevistar a todos los gatos es imposible porque se necesitaría mucho dinero para hacer un estudio de esa magnitud. ¿Qué haces para responder la pregunta de tu jefe y que te vea seguro? ¡Fácil! aplicas la fórmula 1/√n.

Si “n” se refiere al tamaño de tu muestra o número de gatos que entrevistaste, el resultado sería 0.3162 (1/√10 = 0.3162), múltiplica ese número por 100 para que lo puedas ver en porcentajes o números relativos como dicen los matemáticos; es decir, tu error de muestreo es del 32%. En pocas palabras, le puedes decir a tu jefe, con un 95% de seguridad o confianza, que en el peor de los casos sólo el 48% (80% – 32% = 48%) de los gatos prefieren Whiskas porque ese error, como su nombre lo indica, te señala qué tanto te puedes equivocar en tu estimación o resultado; claro que también puedes equivocarte subestimando el resultado, es decir, que sean más del 80% de gatos; sin embargo, en este caso, si al resultado del 80% le sumas el error te daría 80% + 32% = 112% ¿O sea? todavía nadie se ha atrevido a decir que el 112% de los gatos prefieren Whiskas; por lo tanto sólo puedes decir que a todos los gatos les gusta Whiskas, es decir, al 100%. Suena raro ¿verdad? ¿Cómo se puede decir que es más del 100%? ¿Será por eso que la ley de los grandes números o teoría del límite central dice que sólo después de 30 casos se puede hacer inferencias estables?

Volviendo a nuestra encuesta gatuna, seguramente, tu jefe te va a mandar lejos pero muy lejos pues, al igual que mi respuesta no le satisfizo a mi amigo el matemático, tampoco la tuya le va a parecer al jefe. ¿Qué tienes que hacer? Nuevamente, otra respuesta fácil, incrementar el tamaño de muestra y, esta vez, entrevistar a 100 gatos, no a todos porque eso es muy caro pero si a 100; con eso el error de muestreo disminuye a 10%(1/√100 = .10), de forma tal que ahora si le puedes decir al jefe que en el peor de los casos quizá no sea el 80% aunque tampoco será menos del 70% y con un poco de suerte te equivocas favorablemente y en lugar de 80% son 90% los gatos que prefieren Whiskas. Todo eso se lo vas a asegurar con un 95% de confianza en lo que dices.

La parte práctica ya está, ya sabes cómo usar la fórmula y entiendes que muestras más grandes hacen jefes más felices porque hay una menor error en los resultados que se le dan. Ahora vamos a la parte más obscura del tema para echar algo de luz en ella. Vamos imaginándonos que hacemos un censo en México y le preguntamos a todos, sí a todos, por eso es un censo, los mexicanos mayores de 18 años si creen que el planeta se está calentando o no y el 70% dice que sí hay calentamiento global mientras que el 30% restante opina que no.

Oso

¿Cuál es la probabilidad de equivocarte y que no sea el 70% los que piensan que hay calentamiento global? Teóricamente, cero, no hay forma de que te equivoques pues entrevistaste a todos. Por favor, no busques en tu cabeza cosas como qué tal si me inventaron las entrevistas, se capturó mal, algunos no estaban en el país, etc. Recuerda que esto es teórico, todo lo hiciste a la perfección y todos los mexicanos y mexicanas estaban en México y sus respuestas eran cuerdas ¿Ok? Bueno, entonces no hay forma de que te equivoques. Aunque, como bien sabes, entrevistar a toda la raza cuesta un montón de dinero por lo que si deseas corroborar que efectivamente, el 70% dice que hay calentamiento global y el 30% que no, tendrás que hacer una encuesta con una muestra aleatoria de mexicanos y mexicanas mayores de 18 años. La encuesta es un método rápido y económico que sirve para estimar los parámetros de una población. Un parámetro es el valor real de la población que en este caso sería el 70% de los que dicen sí o el 30% de los que dicen no; en contraste, al resultado que obtienes de una encuesta con una muestra se le llama estadística la cual puede ser igual o no al parámetro de la población pero siempre resulta cercana a él; claro, cuando hablas de más de 30 casos. El asunto es medir qué tan cerca está esa estadística (resultado de la encuesta) del parámetro (valor real) y para eso te sirve la susodicha fórmula de la que estamos hablando.

Sigamos imaginando que hacemos una primera encuesta con 100 casos en toda la república mexicana y obtenemos que el 80% de los encuestados nos dice que sí se está calentando y el 20% que no y como sabemos que el resultado de una encuesta puede o no ser igual al parámetro de la población, para asegurarnos hacemos otra encuesta de 100 casos más, obteniendo ahora los valores de 65% que dice sí y 35% que dice no. Suponiendo que no conoces el parámetro (valor real) de la población mexicana sobre lo que opinan sobre este tema, ahora te encuentras con un dilema ¿cuál de las dos encuestas es la que está más cerca del parámetro? ¿A cuál le hago caso? ¡Ni modo! para resolver este entuerto decidimos hacer una tercera encuesta con el mismo número de casos y obtenemos que el 72% dice sí y el 28% no; y, ya encarrerado el ratón, pos hacemos un cuarta encuesta en la cual el 69% dice sí y el 31% no. Si registramos en una gráfica los resultados de las cuatro encuestas con los que dicen que el planeta sí se está calentando, nos vamos a dar cuenta que ninguna de éstas le atinó al parámetro.

Error estándar en encuestas

Pero fíjate bien en lo que sigue, si continúas haciendo encuestas vas a notar que la mayoría de los resultados son iguales al parámetro o muy parecidos y que muy pocos, son muy diferentes a él. Todas las encuestas que hagas resultarán en una figura más o menos como la de abajo siguiente, a esa figura se le llama distribución normal porque, como su nombre lo índica, la mayoría de las cosas que suceden en la naturaleza tienen esa distribución, también se le conoce como campana de Gauss en honor Carl Friedrich Gauss, uno de los tres más grandes matemáticos que hayan existido jamás, los otros dos son Newton y Arquímedes, pero más importante aún es que allá a principios del siglo XIX se le conocía como curva de error y ¿Sabes por qué? Porque como te acabas de dar cuenta siempre hay un error asociado a las mediciones que haces por encuesta (o por cualquier otro medio) y ese error se distribuye de forma simétrica, a veces es menor que el parámetro otras mayor pero al final siempre va a existir un número muy parecido de errores hacia un lado como hacia el otro, eso es lo que le da la simetría a la curva normal o de campana, como también se le dice por su forma; sin embargo, la gran mayoría de mediciones siempre van a estar muy cerca del parámetro de la población por lo cual la frecuencia de esos valores será mayor dándole con ello la altitud a nuestra figura. Antes de continuar observa la imagen para que te des cuenta de lo estamos hablando.

distribución normal
Dijimos que la mayoría de los resultados en tus encuestas, 186 para ser exactos, serían igual al parámetro o estarían muy cerca de él; pero ¿Qué tan cerca de él? ¿Cómo saber si nuestra primera encuesta (80% dice que sí), por ejemplo, es igual o no al parámetro? Bueno, por esos años también los matemáticos se dieron cuenta que los errores pequeños eran más frecuentes que los grandes; es decir, equivocarse por poco era más común que equivocarse por mucho, por eso algunas gentes dicen que la estadística es noble. Asimismo, también observaron que hay una relación inversamente proporcional entre el tamaño del error y la frecuencia con la que se producen. Por esa relación que es inversamente proporcional es que la fórmula que nos ocupa tiene en el denominador la raíz de n pues en otras palabras; mientras más grande sea tu muestra el tamaño del error va a disminuir proporcionalmente. Eso es lo que significa esa raíz cuadrada. Pero ¿Qué hay del 1 del numerador? Si te parece prosigamos para ver que más nos encontramos.
Aunque se puede construir una curva normal haciendo todo esa monstruosidad de encuestas, para que verifiques que las cosas realmente son así, no es práctico ya sea por falta de tiempo y o dinero por lo que usualmente confiamos en las tablas estadísticas que nos proporcionan los libros, las cuales nos señalan cual es la probabilidad de observar determinado error “estandarizado”. Se dice que está estandarizado pues nos los da como áreas dentro de la curva normal. Por ejemplo, en ellas se observa que el 99.99% de los resultados de todas tus encuestas estarán dentro de 3 errores estándar o tres áreas de esa curva, tanto a la izquierda como a la derecha del parámetro de la población; que un 95% de ellas estarán dentro de 2 errores estándar y que el 68% dentro de 1 error estándar a la izquierda y 1 a la derecha del parámetro, como se nota en la figura de abajo.
áreas bajo la curva
Si se te dificulta entender a que se refiere eso de error estándar, piensa que un error estándar es algo así como el promedio de errores; es decir, que si tu promedio de error fue de 5%, en general, tendrías que el resultado más equivocado estará en 15% (3 errores estándar) menos de lo que obtuviste en tu encuesta o 15% más porque allí se encuentran el 99.99% de tus resultados. Para ilustrar esto, volvamos al resultado de la primera encuesta en la que el 80% dijo que el planeta se estaba calentando; si en este momento yo te preguntara qué confianza tienes de que ese 80% es igual al parámetro de la población. Bueno tienes tres respuestas claras:
1. Que tienes un 68% de confianza de que el resultado está dentro de un error estándar o sea un promedio de errores por abajo o por arriba, lo cual puede ser +/- 5%, de acuerdo a nuestro tamaño de muestra de 100 casos y que en términos prácticos significa que entre el 75% al 85% consideran que sí hay calentamiento global, esto por supuesto debe incluir el valor real o sea el parámetro si tu encuesta es acertada. Observa que ese 68% significa que de todos los estudios o muestras que tu hagas, el 68% de ellos van a caer en un área no mayor a un error estándar; asimismo esa confianza (así se dice en investigación) del 68% puede no ser suficiente para dar el valor real como en este caso que es del 70% pero tú dices que está entre el 75% y 80%.
2. Que sabes con un 95% de confianza que tu resultado está entre dos errores estándar o sea dos promedios de errores por abajo o por arriba, lo cual puede ser +/- 10%, de acuerdo a nuestro tamaño de muestra de 100 casos y que en términos prácticos significa que entre el 70% al 90% consideran que sí hay calentamiento global. En este caso sí acertaste, por eso los investigadores prefieren dar los resultados usando dos errores estándar o el 95% de confianza. Claro está que en la fórmula de 1/√n el error está calculado con base a dos áreas o errores estándar.
3. Que sabes con el 99% de confianza que ese 80% está dentro de tres errores estándar o sea tres promedios de errores por abajo o por arriba, lo cual puede ser +/- 15%, de acuerdo a nuestro tamaño de muestra de 100 casos y que en términos prácticos significa que entre el 65% al 95% consideran que sí hay calentamiento global. Nota que en este caso la probabilidad de que te equivoques es prácticamente nula pero las posibilidades que das sobre el verdadero resultado son muy amplias lo que en algunos casos es impráctico ¿o cómo le dirías a tu público que más de la mitad (65%) o casi todos (95%) consideran que sí hay calentamiento global? No funciona ¿verdad?
Ahora sí, ahí te va la decodificación de la fórmula, el numerador, o sea ese enigmático “1″, se compone por la letra “Z” que significa número de errores estándar o áreas bajo la curva; “P” que representa a la proporción que dice que sí se está calentando; “Q” que es la proporción de gentes que dice que no se está calentando, este “P” y “Q” son un indicador de lo que varían las opiniones; en otras palabras, es la variación y “n”, en el denominador, es el tamaño de la muestra o número de entrevistas, la fórmula original es esta:
fórmula del error estándarEjemplo, si quieres no estar más alejado en tu pronóstico de 2 errores estándar deberás sustituir Z por 2, eso quiere decir que deseas una confianza del 95%; asimismo, como no sabes cuál es la variación de la población tendrás que asumir que lo peor que puede suceder es que el 50% diga que sí hay calentamiento global y el otro 50% que no lo hay. Si lo piensas por un momento ese número te daría los promedios más altos de desviación por lo que estás siendo bastante cuidadoso en tus pronósticos; sin embargo, si conoces el valor de la desviación puedes usarlo en lugar de suponer la máxima desviación; en la práctica nunca se conoce pero bien podrías usar el de tu encuesta 80%-20% pero observa que dejas de ser conservador, estás siendo más arriesgado pues infieres que los datos se desvían muy poco. En resumen, sustituye “P” por 0.5  y “Q” por 0.5, en ambos casos este “0.5” representa el 50%. Si haces estos cambios a la fórmula obtienes:
 fórmula de error
La fórmula anterior también se puede escribir como:
error estándar 2
Si efectúas la operación del numerador el resultado será 0.5 que al multiplicarlo por 2 te da uno, quedando la fórmula finalmente como:
fórmula de uno entre raíz de n
Nota 1. En realidad el 95% de confianza se encuentra entre 1.96 desviaciones o sea casi 2 pero no te afecta mucho si multiplicas la desviación por 2.
Nota 2. Este artículo ya lo habíamos publicado a principios del 2010 pero aprovechando que nuestro sitio se cayó hace un año aproximadamente y es uno de varios que teníamos por rescatar y publicar nuevamente, lo hemos modificado para hacerlo más entendible hoy 18 de febrero del 2015.

CONJOINT ANALYSIS A PIE

Una pregunta difícil para las mujeres ¿Qué vale más un hombre con dinero, uno guapo o un poeta? En la oficina hicimos un conjoint analysis para saber que opinaban el maravilloso sexo femenino. Pero antes de explicarte como le hicimos y para que tampoco te hagas bolas, necesitamos presentarte algunos conceptos básicos del conjoint.

¿Qué es el conjoint?

Este tan llevado y tan traído concepto se utiliza para comprender cómo desarrollan las personas sus preferencias por los productos o servicios. Se piensa que los humanos le asignamos el valor total a un producto o servicio en función de sus características y/o atributos, dependiendo de éstos el valor incrementa o disminuye.

Por ejemplo, en la siguiente ilustración tú valorarías más un auto dependiendo de sus características y atributos.

atributos conjoint

¿Qué son factores o atributos, niveles, utilidad y estímulos?

El conjoint tiene cuatro conceptos básicos:

1. Factores o atributos. Son las características del producto o servicio, estos por supuesto varían en cada producto. En nuestro ejemplo anterior el color del auto es un atributo.

2. Niveles. Son el número de opciones en cada atributo.Volviendo al ejemplo anterior, el color del auto tiene dos niveles u opciones: rojo en el Beatle y gris en el BMW.

3. Utilidad. Es la base conceptual para medir el valor. No tiene una equivalencia directa a alguna otra medida, ni siquiera dentro del mismo conjoint, dado que la utilidad depende de los atributos o niveles que se miden y por supuesto de la escala o nivel de medición empleado. Esto es un poco difícil de entender pero piensa en atributos como felicidad y amor. Puedes saber si eres feliz o si estás enamorado y más o menos en qué grado lo eres o estás pero no puedes comparar felicidad con amor, simplemente son conceptos distintos. Por eso en un estudio puedes tener diferentes grados de utilidad para cada atributo. En la tabla de abajo tienes 2 atributos con distintos grados de utilidad para cada uno de sus niveles. Los niveles con utilidades negativas son rasgos menos apreciados que los de utilidades positivas.

atributos y niveles

4. Estímulos. Para evaluar la utilidad (valor) que tiene cada nivel es necesario presentar a los sujetos estímulos que representen diferentes productos para que los califiquen, ordenen o seleccionen de acuerdo a su grado de preferencia o intención de compra.

Ahora sí,  ya estamos listos para explicarte que hicimos. Queríamos saber que tipo de hombre prefieren las mujeres y cuál es el atributo más importante por el que lo prefieren; pensamos en 3 atributos con 2 niveles cada uno de ellos: riqueza (con dinero y pobre), belleza (atractivo y feo) y poeta (inspirado y sin inspiración).

tabla 3

Es menester presentar los estímulos a las mujeres para que evalúen su tipo de hombre; los estímulos se generan combinando las distintas características de cada atributo. Por ejemplo, podemos decir que un estímulo sería un hombre feo, pobre pero muy inspirado; otro sería un hombre guapo, pobre y sin inspiración. Como ya te diste cuenta, hay varias posibles combinaciones para “crear” el hombre que resulte un buen partido para nuestras amigas de la oficina a las cuales llamaremos Lucy, Martha y Eva (esto es para evitar broncas ¡Tú sabes!). El número de combinaciones (estímulos) totales depende del número de atributos y niveles de cada uno de ellos y se obtiene con la fórmula 1:

No. de combinaciones = No. de niveles del 1er factor X No. de niveles del 2do factor X No. de niveles del tercer factor o sea:

tabla4

Entonces tenemos 8 estímulos o combinaciones para presentarle a Lucy, Martha y Eva con la intención de que nos digan cual es el tipo de hombre que prefieren. Los resultados que obtuvimos fueron los siguientes:

tabla 6

Para el estímulo 1 Martha y Eva dijeron que preferían en primer lugar a un hombre inspirado, atractivo y rico; mientras que Lucy dijo que lo prefería en segundo lugar. Observa que el primer estímulo se trata de un hombre inspirado, guapo y rico a este tipo de estímulos se les llama increíbles o poco reales por lo que es recomendable quitarlos (hasta yo lo hubiera preferido ¡Es broma!) lo mismo sucede con el estímulo 7, aunque de esos hay muchos, pero eso es otra historia y por el momento no te fijes en ello.

Para ejemplificar como se obtienen las importancias y las utilidades saquemos el ejemplo con las calificaciones de Lucy:

Las calificaciones promedio para un hombre atractivo y uno feo son:

Atractivo = (2 + 4 + 7 + 3) / 4 = 4                   Feo = (1 + 5 + 6 + 8) / 4 = 5

tabla 7

Obtén de la misma forma los otros promedios para inspirado y sin inspiración y para rico y pobretón. El promedio global se obtiene promediando todos los promedios:

Promedio Global = (4 + 5 + 3.25 + 5.75 + 2.75 + 6.25) / 6 = 4.5

La desviación se refiere a que tanto se desvía un promedio del promedio general

Desviación Atractivo = 4 – 4.5 = -.5

Hasta ahora no hay nada que no podamos hacer ¿verdad? Los cálculos que siguen son un poco más elaborados pero sencillos y esos nos llevan directamente al resultado que estamos buscando.

tabla 8

Primero, invierte el signo de la desviación inversa para indicar mayor preferencia. Recuerda que el 1 significaba mayor preferencia por lo que los valores menores en realidad son más deseables.

Segundo, eleva la desviación al cuadrado. Esto se hace para poder sumar las desviaciones sin que se anulen mutuamente y obtener un indicador global que nos muestre en que medida se desvían los promedios; este indicador es el pavoroso suma de cuadrados (te acuerdas de tus clases de estadística ¡Uy Mufasa!).

Tercero, calcula el valor estandarizado. Esto se hace dividiendo el número de niveles entre la suma de cuadrados: (6/9.25) = 0.648.

Cuarto, ahora obtén la desviación estandarizada. Esta se calcula multiplicando la desviación al cuadrado por el valor estandarizado. Por ejemplo, para Inspirado es: 1.5625 X 0.648 = 1.013.

Quinto, para obtener la estimación del componente parcial de utilidad sólo saca la raíz cuadrada de la desviación estandarizada. Por ejemplo, para inspirado sería √ 1.013 = 1.006

Sexto, el rango de componente parcial de utilidad es la suma de los componentes parciales de utilidad de cada factor. En el caso del factor Poeta es 1.006 + 1.006 = 2.013.

Séptimo, suma los rangos de los componentes parciales de utilidad y por último, divide el rango de componente parcial de utilidad de cada atributo entre la suma de los rangos de los componentes parciales de utilidad. El resultado es la importancia de cada atributo. En el caso de poeta su importancia es 2.013 / 4.912 = 41%, esto significa que el atributo de poeta es el más importante después del dinero, ya que este tiene un 57% de importancia.

Como te habrás dado cuenta puedes calcular la importancia  de cada factor y las utilidades para cada nivel por cada una de las mujeres que nos respondieron. Las utilidades son sumamente útiles porque se usan para configurar un tipo de hombre específico (algo así como la sustancia X para las chicas super poderosas); a esas configuraciones los mercadólogos le llaman escenarios ya que es posible estimar la preferencia con distintos supuestos ¿Te imaginas si tuvieras dinero, fueras guapo y te expresaras como Agustín Lara? Ese si que sería el mejor escenario.

El conjoint analysis se lleva a cabo en computadora y existen más modelos de cálculo (el que utilizamos aquí se llama de perfil completo) pero este ejercicio te da una idea muy clara de como opera y te ayudará mucho a entenderlo.

Hasta pronto.

1. Nota. El número de factores y niveles a evaluar afecta directamente los resultados. A mayor número de niveles y factores se deben evaluar más estímulos una fórmula para calcular el número mínimo de estímulos que se pueden evaluar es:

tabla 5