Diagrama de Dispersión
Diagrama de Dispersión
Diagrama de Dispersión
El diagrama de dispersión o gráfico de dispersión, es una de las herramientas más utilizadas. No por
nada se considera una de las 7 herramientas básicas de calidad. Es quizás uno de los gráficos que se
aprenden de primero en formación estadística, así que ya tienes una idea de su importancia.
Vamos a comprender qué es un diagrama de dispersión, cómo se hace y por supuesto, un ejemplo
de aplicación para garantizar el aprendizaje.
Diagrama de dispersión se define como una representación gráfica del grado de relación
entre dos variables cuantitativas. Es decir, el grado de distanciamiento de un conjunto de valores
respecto a su valor medio.
A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de
estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente de correlación, etc.
Ahora bien, el diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de
correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En
otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí
o qué tan independientes son una de la otra.
El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos
que aparecen en pares (por ejemplo, X y Y, uno de cada conjunto). El diagrama muestra estos pares
como una nube de puntos. X es la variable independiente y, Y es la variable dependiente.
En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo
a la relación que exista entre ellas, definimos su tipo de correlación.
Correlación es el grado de relación existente entre dos variables. Cuando entre dos variables existe
una correlación total, se cumple que, a cada valor de una, le corresponde un único valor de la otra.
(función matemática).
Correlación positiva
Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una
relación proporcional. Por ejemplo, para un vendedor de carros, si él vende más carros (variable 1),
va a ganar más dinero (variable 2).
Correlación negativa
Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir que, si una
variable aumenta, la otra disminuye. Hay una relación inversa proporcional. Por ejemplo, para la
construcción de un edificio, entre más trabajadores estén construyendo un edificio (variable 1),
menos tiempo se necesitará para tenerlo listo (variable 2)
Correlación nula
Estos son pues, los tipos de correlación más visibles. Aunque si lo miramos desde una perspectiva
que evalúa qué tan fuerte o débil es la correlación, encontramos otra clasificación.
El coeficiente de correlación nos describe cómo es la relación existente entre dos variables, en otras
palabras, al conocer este número sabemos si la correlación es positiva o negativa y qué tan fuerte o
débil es. Se usa la letra r para expresarla, veamos cómo:
r=1
La correlación es positiva perfecta. Si una variable crece, la otra también lo hace en una proporción
constante. Es una relación directa, por eso si trazamos una línea de ajuste esta va pasar por todos y
cada uno de los puntos.
0<r<1
Es cuando r está entre 0 y 1 sin llegar a ser 0 y 1. Es una correlación positiva. El grado de cercanía de
1 define qué tan directa y proporcional es la relación entre ambas variables, por ende, entre más
cerca esté de 0, más débil será su correlación negativa.
r=0
La correlación es nula, es decir que no existe una relación lineal entre ambas variables. Qué tal si
pruebas buscando otro tipo de relación.
-1<r<0
Es cuando r esta entre -1 y 0 sin llegar a ser –1 y 0. Es una correlación negativa. El grado de cercanía
a -1 define que tan inversa y proporcional es la relación entre ambas variables, por ende, entre más
cerca esté de 0, más débil será su correlación negativa.
r=-1
Ventajas
Representa la relación entre dos variables de forma gráfica, lo que hace más fácil visualizar e
interpretar los datos.
Calculando la correlación de dos variables, permite cuantificar el grado de relación entre ambas,
así como su signo.
Utilidades
Obtener información para determinar si dos variables están relacionadas.
Comprobar cómo afecta a una variable los cambios producidos en otra.
Probar las posibles relaciones causa / efecto.
Paso3: Encontrar los valores mínimo y máximo, tanto para x como para y y utilizar estos valores para
elaborar la escala de los ejes horizontal (x) y vertical (y). Ambos deben tener aproximadamente la
misma longitud.
Paso 4: Ubica los valores en el eje respectivo. Por lo general, la variable independiente es aquella
que no está influenciada por la otra y se ubica en el eje x. La variable dependiente que es la que se
ve afectada por la otra variable se ubica en el eje y. Así pues, procedemos a
ubicar los valores en el plano cartesiano de acuerdo a su variable (x, y)
Paso6: Analizamos: Con base en el coeficiente y en el gráfico, definimos cuál es la relación de las dos
variables y tomamos las decisiones pertinentes.
Si el resultado del coeficiente de correlación es de:
1 a 0.90, la correlación es positiva fuerte.
0.89 a 0.70, la correlación es positiva buena.
0.69 a 0.45, la correlación es positiva mediana.
0.44 hacia abajo la correlación es positiva mala o baja.
Las variables a estudiar para este ejemplo de grafico de dispersión en calidad son:
Formula COEF.DE.CORREL. Para nuestro ejemplo resuelto, obtenemos 0,94, ¿se ve esto reflejado en
el gráfico? Por supuesto que sí, fíjate que los puntos están muy cerca unos de los otros, lo que indica
que los valores se correlacionan fuertemente, es decir que la relación entre un aumento en los litros
de tinta, impacta directamente en el número de errores en la impresión de posters. De hecho, se
hace evidente si miramos la tabla, no hay grandes saltos entre datos si miramos el número de
errores.
Paso 6: Analizamos. Evidentemente hay una relación positiva fuerte entre la cantidad de tinta con
la que se carga el tubo de la máquina y el número de errores generados en la impresión de los
posters. Un paso siguiente para un problema de este tipo, sería buscar la forma de aprovechar la
capacidad restante de la máquina, por ejemplo, usar más tubos y más pequeños.