Tag Archives: regresión lineal

EL PODER Y EL EQUILIBRIO

He dicho en varias ocasiones que me siento afortunado de haber tenido muy buenos maestros durante mi paso por la universidad. En esta ocasión me toca recordar a los maestros Tirso Limón y Abraham Nadelsticher (rip). Fue durante una ponencia sobre investigación que el primero le lanzó, a raja tabla, a Abraham una pregunta muy interesante, le dijo: ¿Sabes cómo se puede disminuir el poder? Éste, quién se dedicaba a la investigación de mercados y que claro está tenía como principal objetivo incrementarlo, no disminuirlo, ni tardo ni perezoso, respondió que no; no sabía como disminuirlo pero entendía muy bien cómo se podía incrementar, a partir de allí inició su ponencia que se trataba sobre path analysis o análisis de senderos, el cual se construye con base en una batería de atributos sobre los cuales se efectúan una serie de regresiones lineales múltiples que van explicando, uno por uno, dichos atributos; esta herramienta la utilizaban los candidatos políticos para construir su discurso político, nota que hace tiempo que este tipo de análisis cayó en desuso.

Lo sorprendente de esta anécdota es que la pregunta de Tirso tenía una respuesta obvia pero estamos tan casados con la idea de que las soluciones deben venir de las personas que tienen poder o que están cerca de él que no nos damos cuenta que la respuesta es más simple de lo que parece. Me explico, a través de la historia de la humanidad, sólo ha habido tres tipos de personas que se rozan de manera importante con los poderosos, llámense reyes, emperadores, presidentes, ministros, etc., éstos son los religiosos o místicos, los artistas o que crean arte y los sabios, eruditos o científicos, de tal forma que para retomar el equilibrio en cualquier sociedad deberían de existir este tipo de mujeres y hombres en abundancia. El problema es que difícilmente la naturaleza va a iluminar a toda la población de golpe y porrazo, no se pueden tener Budas por doquier, tampoco se dan, como si fueran flores del campo, los escultores, pintores, músicos, poetas, etc., entonces la solución que tenemos más a la mano es la educación. Sí, educar a la población es la forma más realista de tratar de disminuir el poder que concentran los pocos individuos que gobiernan este mundo.

Es contranatura pedir que el propio gobierno sea quien se encargue de esta labor pues para éste sería tanto como hacerse harakiri. En un mundo donde, cada vez más, los gobiernos limitan el acceso a la educación a millones de personas, desvirtúan el propósito de la educación y buscan su deterioro, la propia naturaleza humana busca restablecer un equilibrio; Internet es para muchos profesionales y personas de buena voluntad una de las formas más directas de restablecer ese equilibrio por eso es que son tan populares y necesarios los blogs, videos, tutoriales, libros digitales, etc. No importa que haya personas que aún no entienden o critican estas nuevas tecnologías.

Hasta la próxima.

TAL COMO ME GUSTA

Un hombre impresionantemente grande se acerca a una prostituta y le dice que desea contratar sus servicios, que le va a pagar lo que ella pida pero que tiene que ser tal como a él le gusta; la mujer piensa inmediatamente que un hombre tan grande algún perjuicio puede representar para su integridad física y prefiere negarse a proporcionarle sus servicios; sin embargo, le dice que espere allí en lo que le consigue alguna otra mujer, el hombre asiente y la mujer parte, rauda y veloz, a reunirse con otras mujeres y contarles sobre el generoso ofrecimiento del pobre hombre necesitado, las cuales al ver a semejante hombre optan por declinar a tan generosa oferta pero viendo la necesidad del hombre deciden ir con la Rosita Árenas, quién tenía fama de aguantadora y echada pa’delante y ésta sin pensárselo dos veces se mete al cuarto de hotel acompañada de aquel hombre; todas las mujeres deseosas de saber el desenlace y la suerte de la valerosa Rosita, se arremolinan y pegan la oreja en la puerta del cuarto donde se encuentra la Rosita y su cliente. Así, transcurren unos cuantos minutos sin que se escuche sonido alguno hasta que de pronto se oye que se rompen vidrios, sillas y cuanto artefacto hay dentro; al instante, se abre la puerta violentamente y sale corriendo el hombre desnudo, llevando entre sus manos su ropa y zapatos y tras él la Rosita vuelta una furia. Las mujeres, sin aguantarse más las ganas, le preguntan: ¿cómo lo quería? a lo que la Rosita, todavía bufando como un toro, responde: “Quería fíado el hijo de la chingada”.

El asunto es: ¿Cómo logramos que el cliente obtenga justo lo que quiere? Claro, siempre y cuando no se le ocurra pedir fíado. Las escalas de “Tal como me gusta”  (TCG) o en inglés “Just about right” (JAR) se utilizan para este propósito, principalmente en la pruebas sensoriales o de producto; las cuales por supuesto son muy demandadas en la industria de alimentos, cosméticos, bebidas, cuidado personal, etc. pues con ellas se puede evaluar que tan cerca está el producto de lo que el cliente desea; en otras palabras, qué tanto el producto se acerca al punto ideal en cuanto a sal, dulzor, color, intensidad de sabor, aroma, tostado, carbonatado, etc. sin que le sobre o le falte de esas características. Por ejemplo, hagamos de cuenta que estás evaluando un jugo para lo cual le pides a tu entrevistado que lo pruebe y te diga ¿Qué tan dulce sabe? en una escala de 5 puntos donde:

  1. Es “Mucho menos dulce de lo que me gusta”
  2. Es “Menos dulce de lo que me gusta”
  3. Es “Tal como me gusta”
  4. Es “Más dulce de lo que me gusta”
  5. Es “Mucho más dulce de lo que me gusta”

Si el entrevistado te contesta que en cuanto a dulzor es tal como a él le gusta entonces tu producto está en el punto ideal; más sin embargo, si te pasas de dulzor o te quedas por debajo de él, seguramente desearás hacer un cambio al producto para que tenga mayor aceptación.

Esta escala es muy popular debido a su simpleza y claridad tanto para el investigador como para el entrevistado además de que su tratamiento estadístico es de lo más simple; sin embargo, como pasa con todas las escalas, su utilización no está exenta de críticas. Los investigadores documentan diversas inconsistencias y problemas de validez con las mismas; en algunos casos funciona más la escala de agrado o hedónica para predecir el éxito del producto; en otros se ha encontrado que no siempre lo ideal es igual a lo que a uno le gusta más; asimismo hay situaciones en que las características evaluadas conllevan un sesgo: en cuánto a cantidad de queso para una pizza ¿hay un punto ideal o más es mejor?* Sea lo que fuere, esta escala se utiliza mucho pero se hace en conjunción con la escala de agrado general (hedónica), quizá para subsanar algunas de las debilidades que tiene. La escala de agrado general puede ir de 1 a 5, 1 a 7, 1 a 9, 0 a 10, o cualquier otra cosa que se te ocurra; sin embargo, toma en cuenta que tanto la escala de TCG como la hedónica te van a servir para obtener normas de desempeño del producto por lo que una vez que seleccionas un determinado intervalo para una escala no puedes estarla cambiando porque no podrás comparar tus resultados entre estudios. La pregunta de agrado general es muy directa, siguiendo con nuestro ejemplo de jugo se haría así: En general, ¿qué tanto le agrado el jugo que acaba de probar? Dígamelo en una escala del 1 al 9 donde 1 significa que le desagrado muchísimo y 9 que le agrado muchísimo.

¿Sabes que es lo mejor de la escala NPS (Net Promoter Score)? que para aplicarla y analizarla sólo necesitas saber sumar y restar. En una escala del 0 al 10 en la cual 0 es que no recomendarías pa’nada la marca y 10 que la recomendarías totalmente, se suman los sujetos que contestan 0 al 6, los que contestan 7 a 8 y los que responden 9 a 10, entonces restas el porcentaje de los que respondieron 9 a 10 de los que respondieron 0 a 6 y “voila” el resultado es el porcentaje o puntaje neto de promotores (NPS). ¿Estás pensando lo mismo que yo? Si sí es así, acertaste. La escala TCG es igual que la NPS, para analizarla sólo necesitas sumas y restas. ¡Verás! sumas o agrupas a los sujetos que contestaron 1 y 2 (1. “Mucho menos dulce de lo que me gusta” y 2. “Menos dulce de lo que me gusta”); a los que contestaron 4 y 5 (4. “Más dulce de lo que me gusta” y 5. “Mucho más dulce de lo que me gusta”) y dejas solos a los sujetos que contestaron 3 (3. “Tal como me gusta”) con eso vas a obtener tres grupos: los que dicen que al jugo le falta dulce, los que dicen que es tal como a ellos les gusta y aquellos que dicen que tiene mucho dulce (véase fig. de abajo).

escala tal como a mi me gusta

Ten presente que lo ideal es que ni le sobre ni le falte o sea que la mayoría estén en el grupo de los que contestaron 3. Cómo en gustos se rompen géneros, es casi imposible que todos estén de acuerdo en ello por lo tanto una regla más o menos general es que por lo menos el 75% caigan en la categoría de “tal como a mi me gusta” u otra es que el porcentaje de los que mencionan que el producto se pasó de dulce o que quedó por debajo de éste no sea igual o superior al 20% si no es así, entonces definitivamente, hay que hacer cambios en la formulación del producto. En nuestro gráfico puedes ver que estamos 11% por debajo del estándar (64% – 75% = 11%) ¿Entonces qué hay que corregir? ¿Le quitamos o le ponemos más dulce al jugo? El sentido común diría que hay que subirle pues el 20% dijo que faltaba pero como dicen que el sentido común es la cosa mejor repartida del mundo, preferimos no fiarnos de él y en su lugar emplear la técnica “Penalty Analysis” o Análisis de Penalización, también conocida como “Mean Drop” o caída de media, más adelante te vas a dar cuenta porqué esos nombres.

La idea del Penalty Analysis es relacionar el nivel de agrado general del producto con cada uno de los grupos que hiciste anteriormente; es decir, cuál de ellos tiene más agrado por el producto. Para no perder el hilo hagamos el ejercicio con nuestro ejemplo del jugo y la cantidad de dulce (véase fig. de abajo).

Penalty analysis

Si eres observador, te darás cuenta que los que mencionan que el dulce del jugo es tal como les gusta también tienden a calificar más alto su agrado por el producto. En la tabla de arriba, calificaron al producto en promedio con  8.05 mientras que el grupo que dice que le falta dulce lo califica con 4.05 y el que piensa que sobra lo hace con 5.06. Por esa razón se dice que se castiga o penaliza al producto cuando no cumple con las “expectativas” o también que hay una caida en la media. Para calcular la caida sólo se substrae el promedio del grupo que dijo tal como me gusta del promedio de cada uno de los otros dos grupos (8.05 – 4.55 = 3.51 y 8.05 – 5.06 = 2.99). La caida de ambas medias te dice que se está castigando más la falta de dulce que el exceso. Sin embargo, considera que en estadística la relevancia de un promedio está relacionado con el tamaño de la muestra o número de sujetos por lo cual es menester ponderar este factor; lo que se hace en la columna que dice Penalty es multiplicar el porcentaje de cada grupo por el promedio de la caída de la media “Mean Drop”. Así, para la característica de “Mucho y menos dulce” hay una penalización de 0.70 (20% x 3.51 = 0.70) mientras que para “Mucho y más dulce” es de 0.48 (16% x 2.99 = 0.48); en términos prácticos esto significa que si corriges la falta de dulzor tu promedio de agrado general subiría en .70.

¿No te lo dije? es fácil ¿verdad? Nuestro ejemplo se basó en una sola característica del producto pero en la práctica pueden llegar hasta casi diez características las que evalúes y probar más de un producto por lo cual es necesario sacar un indicador ponderado o lo que es lo mismo uno global para poder ordenar las características según su grado de penalización; lo que los investigadores hacen es crear 2 grupos, juntan el 1, 2, 4 y 5 de la escala de TCG y dejan solo, de nueva cuenta, el 3 y emplean la misma técnica de penalización para su análisis; en otras palabras, no importa si te pasaste o te sobró dulce se desea saber en global que tanto cae la media.

Allí te van algunas reglas prácticas más o menos aceptadas en la ejecución de estos análisis y su interpretación:

  1. Se calcula el Penalty Analysis sólo para los grupos (debajo o encima del punto ideal) que tienen un tamaño del 20% o más ¿Por qué este número? bueno como dijimos la muestra o tamaño del grupo es importante, grupos pequeños pueden llevarte a conclusiones erróneas.
  2. Se deben obtener dif. sig. utilizando una análisis de varianza o de medias conocido como t-test. ¿Por qué? La razón es que mejorar una característica no necesariamente significa que el producto vaya a gustar más, hay que ver si efectivamente existe una relación.
  3. La regresión lineal, es otro método de análisis pues indica si hay relación y más importante aún nos da un coeficiente de cambio de la proporción de la concentración de una característica, en nuestro caso dulzor, y el agrado en general. Esto se hace bajo la premisa de que hay una relación logarítmica entre la característica y la escala TCG. En otras palabras, el coeficiente de regresión que obtienes puede ser usado para ajustar la concentración del ingrediente en cuestión a fin de que se acerque a lo que el cliente quiere.

Por favor, danos tu opinión o comentarios en la misma sección de este blog a fin de que podamos enriquecerlo o mándalos a info@marketvariance.com

Hasta la próxima.

* Para una descripción más exacta de estos problemas puedes consultar el artículo de Richard Popper: “Just-About-Right Scales in Consumer Research” en la revista Chemo Sense o el capítulo, del mismo autor, titulado de la misma forma en el libro: “Novel Techniques in Sensory Characterization and Consumer Profiling”.

REGRESIÓN LINEAL ¡QUÉ LA FUERZA TE ACOMPAÑE!

Déjame adivinar. Cuando estudiabas estadística, tu primer gran quebradero de cabeza lo tuviste con el tema de regresión lineal ¿cierto? Es posible que hasta el día de hoy todavía tengas algunos “hard feelings”  con esta técnica pero espero que después de leer este post puedas conciliarte con ella. La regresión lineal es un tema básico y muy importante para los investigadores de mercado y no obstante, que es tal vez de los análisis más sencillos, muchas personas le siguen sacando la vuelta. Qué mala fama le han creado a la pobre. Es necesaria en los estudios de satisfacción, elasticidad de precios, imagen de marca, de candidatos políticos, planeación, pronósticos de operación, ventas, inversión, etcétera. En este post vamos a explicarte la regresión y a mostrarte una forma de graficarla para deleite tuyo y de tus clientes.

Seguramente has escuchado la historia que explica de donde viene el término de regresión, es muy ilustrativa pero pocos nos damos por enterado de su significado. Verás, se cuenta que en un estudio donde se relacionaba la estatura de los hijos con la de sus padres se observó que los padres muy altos tenían en promedio hijos más bajos que ellos y al revés que los padres de muy baja estatura tenían en promedio hijos más altos. La estatura promedio de los hijos de ambos tipos de padres -ojo al Cristo que es de plata- se aproximaba al promedio general de estatura de la población. Es como si hubiera una fuerza que hiciera regresar las cosas, en este caso la estatura del ser humano. Esa fuerza es la media o promedio. En la regresión lineal lo que se busca es encontrar esa media, una vez que la conoces es fácil hacer pronósticos pues sabes que ese promedio es la fuerza de atracción que va a aglutinar a los puntajes diferentes a él. Puede suceder que una persona sea muy alta o muy baja pero la naturaleza de las cosas hará que en las siguientes generaciones las cosas se equilibren, emparejen o tiendan al promedio general. En la regresión lineal, a todas las personas que son distintas al promedio, se les denomina errores de muestreo o varianza de error; es como si dijeras que algo ocurrió con esas personas que no son iguales al promedio, y allí es donde echamos a andar el hamster ¿Qué está ocurriendo? o más bien dicho ¿qué o quién está afectando a esas personas que la fuerza del promedio no es suficiente para atraerlas? Ese qué o quién es lo que llamamos variable independiente. En otras palabras, con la regresión lineal buscamos determinar que factor o variable está provocando la variación en la variable dependiente (se llama dependiente porque dependiendo de los valores de la independiente es el valor que va a asumir) ¿Complicado? Sigue leyendo.

Comúnmente los clientes nos piden realizar análisis de regresión múltiple (que es exactamente lo mismo que la regresión lineal simple sólo que en este caso son dos o más variables las que suponemos que están afectando a la variable dependiente) para conocer cuales son las variables que determinan la satisfacción. Ese es el ejemplo que viste en la ilustración del principio; sin embargo, para que te quede perfectamente claro lo que vas a hacer, vamos a ilustrarte la técnica y el método con un ejemplo de regresión lineal simple en Excel ¿Por qué en Excel? Bueno, puedes hacerlo en tu programa de estadística favorito pero te aconsejo que lo hagas en este paquete si no quieres perderte la gráfica divertida con NodeXL (add-in gratuito de graficación de Excel).

Suponte que eres dueño de Yupies’ Pizza y que los clientes siempre te preguntan cuánto tiempo va a tardar en llegar su pizza; para darles una respuestas necesitas hacer pronósticos sobre el tiempo que se tardan tus repartidores en llevar un pedido de pizza a su destino; tienes datos de las últimas 10 entregas donde conoces la distancia hasta la que fueron a dejar los pedidos y el tiempo que dilataron en llegar tus repartidores. La tabla de abajo contiene esos datos.

De repente y para variar un cliente te pide que le digas cuánto tiempo vas a tardar en llevarle la pizza y sabes que ese cliente se encuentra a 14 kilómetros de distancia ¿Qué tiempo le dirías? Ve con cuidado la sexta entrega de tu tabla de datos ¡Exacto! 15 minutos. Lo dedujiste, sin necesidad de hacer ninguna regresión lineal, porque anteriormente ya habías entregado una pizza a la misma distancia y ese fue el tiempo que le tomó a tu repartidor llevarla. Pero qué pasa si regresa tu repartidor y te dice que se tardó 17 minutos ¿qué le vas a decir al próximo cliente cuando te pregunte cuánto tiempo vas a tardar en entregarle si sabes que está exactamente a 14 kilómetros de distancia? ¿Le dirás 15 o 17 minutos? ¿Te acuerdas de la fuerza, el promedio? Deja que la fuerza te acompañe, que el promedio responda por ti. Serían 16 minutos ¿verdad? Esa pregunta estuvo “simple” pero qué tal que te pregunta cuánto tiempo vas a tardar en llevarle la pizza y sabes que está a 10 kilómetros de distancia. Buscas en la tabla de arriba y ¡pelas! te das cuenta que no has hecho ninguna entrega a esa distancia por lo tanto no sabes cuanto tiempo te va a llevar entregarla. Entonces te acuerdas de la fuerza y trazas una línea que atraviesa todos los puntos de tus entregas anteriores (ve la gráfica de abajo); esa linea representa el promedio (media en estadística) de los puntos combinados “X” (distancia) y Y (tiempo) y das con la solución pues estimas que el tiempo de entrega está entre el cruce de la distancia a la que vas (10 km) en el eje X y el tiempo de entrega (11.5 minutos) en el que se cruza con el eje Y. Por las razones anteriores a este método estadístico se le llama regresión lineal y simple porque ocupa una sola variable independiente y no por fácil que ese es otro cantar.

regresion lineal gráfica

La mayoría de las veces los problemas a los que te enfrentas no son tan claros ni tan sencillos; en este caso, cualquiera puede entender que la distancia afecta el tiempo en que se entrega la pizza; además los datos son pocos y es fácil manipularlos e incluso hacer una gráfica donde puedes ver que a mayor distancia también se incrementa el tiempo. La regresión lineal en particular y la estadística en general te ayudan a analizar problemas más complejos donde se tienen que manejar grandes números o relaciones no tan claras. Por ejemplo, en los estudios de satisfacción del cliente es difícil conocer cuáles variables son las que afectan la satisfacción en general y sobre todo saber cuánto; ese “cuánto” se llama coeficiente de regresión y es la cantidad que varía la variable dependiente en función de la independiente. En otras palabras, qué tanto aumenta o disminuye la satisfacción general cuando los niveles de las variables independientes que pueden ser precio, calidad, atención, amabilidad, puntualidad, servicio o cualesquier otro aspecto de tu producto o servicio disminuyen o aumentan. A los aspectos que determinan la satisfacción en general los mercadólogos les llaman “drivers” y son claves para proporcionar una experiencia más satisfactoria al cliente; lo que en términos prácticos significa retenerlo y que siga consumiendo tus servicios o productos. Ese coeficiente de regresión también se llama beta de regresión porque se representa con la letra griega beta.

En el gráfico del principio, cada uno de los círculos representa un “driver” que afecta la satisfacción en general del cliente con la línea área; el número que hay dentro de cada círculo es el coeficiente de regresión o beta de ese “driver”. Si sumas estos coeficientes vas a obtener 100% eso se debe a que hemos ajustado todas las betas para que en total sumen 100%. ¡Atención! no es que los coeficientes resultantes del análisis de regresión múltiple sumen 100%, es más ni siquiera están expresados en porcentajes; lo que sucede es que para las personas que van a ver tu gráfica es más fácil interpretar esos números ajustados que si le dices que tienes un coeficiente de regresión o una beta de “.30”, “.35” o lo que sea que es el coeficiente. Algunas agencias de investigación presentan el mismo análisis de regresión pero en lugar de ajustar a 100% sólo indican el orden en el que afectan las variables independientes a la satisfacción general (variable dependiente); Por ejemplo, dicen el atributo “A” afecta en primer lugar a la satisfacción, el Atributo “B” en segundo lugar y así sucesivamente. Desde nuestro punto de vista eso está mal hecho pues no es lo mismo decir “A sus órdenes General” que “Órdenes generales”: Por si no entendiste mi lenguaje cantinfleado ahí te va de nuevo: si X1 afecta en 90% y X2 en 10% es más sencillo decidir prioridades que si sólo dices X1 en primer lugar y X2 en segundo.

Te vas encontrar con un montón de opciones y estadísticas que puedes pedirle a tu programa estadístico (total, pedir no empobrece) desde las estadísticas descriptivas que ya conoces como medias, desviación estándar, máximo, moda, mediana, entre otras y hasta las pruebas de normalidad*; sin embargo, en general, hay cuatro aspectos a los cuales debes prestar atención para tu análisis de regresión y gráfica, estos son:

1. El coeficiente de la variable dependiente, también llamado constante o intercepción.
2. El coeficiente de regresión que te señala cuánto afecta la variable independiente (VI) a la dependiente (VD).
3. La significancia de ese coeficiente (en Excel está etiquetado como probabilidad en otros programas dice significance o sig.) la cual te indica si la relación entre la VI y VD es verdadera o producto del azar.
4. La forma en que se presenta ese coeficiente, si está estandarizado o en bruto.

Claro que hay varias cosas más que aprender acerca de la regresión lineal pero algo de tarea te tenemos que dejar. Así que ya para terminar te explicamos los 4 puntos anteriores con el mismo ejemplo de los datos de Yupies’ Pizza. El cuadro siguiente contiene la salida del análisis de regresión tal y como lo arroja Excel.

1. Se llama intercepción porque es el lugar donde la línea promedio; si esa que representa la fuerza, cruza con el eje “Y” (la variable dependiente); si te fijas viene siendo algo así como el promedio cuando no hay ninguna influencia, o sea cantidad cero de la VI; por eso debes sumar siempre está constante a la influencia que ejerce la variable o variables independientes; más adelante viene la prueba empírica en la fórmula de la regresión lineal simple.

2. El coeficiente de regresión es la cantidad que está aumentando “Y” por cada unidad de “X”; en palabras simples, si vas a entregar tu pizza a 10 kilómetros de distancia y el coeficiente te dice que por cada kilómetro el tiempo de entrega va aumentar 1.0411, entonces debes multiplicar por 10 kilómetros para conocer el tiempo total que te va a llevar hacer la entrega.

3. ¡Espérate! antes de dar por buenas tus predicciones o presumir de que si hay una relación entre las variables que estás manejando para incrementar la satisfacción de tus clientes debes cerciorarte que la relación es significativa o como dice Excel que la probabilidad sea menor a .05; si el número que obtienes es mayor a .05 la relación entre esa VI y la VD fue puro azar, no hay tal relación. En nuestro caso, obtuvimos 4.26599E-05 (ese -05 significa que el decimal debes recorrerlo cinco dígitos a la izquierda, entonces es .0000426599 y claro que es mucho menor que .05 lo que nos llena de alegría pues hemos descubierto que la relación si es significativa.

Excel te arroja los coeficientes en bruto; es decir, no los estandariza** ¿estanda…qué? Cuando un coeficiente está estandarizado la beta siempre va de -1 a 1, eso sirve para que puedas comparar cualquiere regresión que hagas independientemente del tipo de unidades de medición que estás usando; es decir, no importa si tu variable independiente está en kilómetros, millas, si se trata de peso, estatura, de una escala de 5 o 7 puntos; simpre tendrás coeficientes de regresión entre -1 y 1. Si obtienes una beta de “-1” significa que la relación es perfecta y negativa: cuánto más aumenta la variable independiente más disminuye la independiente y si tu beta es de “1” también hay una relación perfecta entre la VD y la VI pero ésta es positiva; si la VI aumenta la VD también lo hace siempre en la misma proporción. Ambas betas tienen su utilidad, la estandarizada es útil siempre que quieres comparar las betas entre si. Por ejemplo, en nuestra gráfica de satisfacción es importante saber cuál VI es más predictora; en cambio en el ejemplo de pizzas necesitas saber específicamente el tiempo que te va llevar entregar el pedido, en ese caso, sí requieres el coeficiente sin estandarizar para sustituir en la fórmula de regresión y hacer el pronóstico, analiza el desarrollo de la fórmula de abajo.

Según nuestros cálculos sustituyendo en la fórmula las betas que obtuvimos, llevar la pizza a 10 kilómetros de distancia nos tomaría 11.51 minutos (multiplica el .51 por la unidad de tiempo o sea 60 segundos para obtener el resultado real, 11:30:60), casi como lo habíamos pronosticado con nuestra gráfica ¿Estará el repartidor entregando el pedido exactamente a las 11.51? Muy probablemente no, pero en el peor de los casos lo hará en 12.85 minutos (12:51:00 minutos) y en el mejor en 10.76 minutos (10:45:00 minutos); a eso se le llama intervalo de confianza (ve el resultado de arriba de Excel) y es nada más ni nada menos que el error que debes sumarle y restarle a tus estimaciones. Debimos habérselo puesto a nuestra ecuación pero para que no te asustaras lo omitimos; sin embargo, no hay falla, ese error siempre lo vas a encontrar en los libros de estadística (es un juego de palabras).

¿Y la gráfica Apá? Estos vídeos te explican como correr una regresión lineal múltiple y graficarla con NodeXL.

Unable to display content. Adobe Flash is required.

Unable to display content. Adobe Flash is required.

Unable to display content. Adobe Flash is required.

Unable to display content. Adobe Flash is required.

Unable to display content. Adobe Flash is required.

* ¡Precaución! la regresión lineal simple o múltiple asume algunos supuestos que debes revisar que se cumplan como la distribución normal de los errores, su independencia, entre otros; te sugiero que le des una repasada a esos conceptos para que te sientas más seguro de lo que estás haciendo.
** Para estandarizar una beta solo multiplica el coeficiente de regresión de la VI por su desviación estándar y divídelo entre la desviación estándar de la VD.

Hasta la próxima.