Diagrama de Dispersión

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Diagrama de Dispersión.

El diagrama de dispersión o gráfico de dispersión, es una de las herramientas más utilizadas. No por
nada se considera una de las 7 herramientas básicas de calidad. Es quizás uno de los gráficos que se
aprenden de primero en formación estadística, así que ya tienes una idea de su importancia.

Vamos a comprender qué es un diagrama de dispersión, cómo se hace y por supuesto, un ejemplo
de aplicación para garantizar el aprendizaje.

Diagrama de dispersión se define como una representación gráfica del grado de relación
entre dos variables cuantitativas. Es decir, el grado de distanciamiento de un conjunto de valores
respecto a su valor medio.

A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de
estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente de correlación, etc.

Ahora bien, el diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de
correlación consiste en la representación gráfica de dos variables para un conjunto de datos. En
otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí
o qué tan independientes son una de la otra.

El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos
que aparecen en pares (por ejemplo, X y Y, uno de cada conjunto). El diagrama muestra estos pares
como una nube de puntos. X es la variable independiente y, Y es la variable dependiente.

En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo
a la relación que exista entre ellas, definimos su tipo de correlación.

Correlación es el grado de relación existente entre dos variables. Cuando entre dos variables existe
una correlación total, se cumple que, a cada valor de una, le corresponde un único valor de la otra.
(función matemática).

Tipos de correlación en un gráfico de dispersión


Con base en el comportamiento que toman las variables de estudio, podemos encontrar 3 tipos de
correlación: Positiva, negativa y nula.

Correlación positiva

Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una
relación proporcional. Por ejemplo, para un vendedor de carros, si él vende más carros (variable 1),
va a ganar más dinero (variable 2).
Correlación negativa
Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir que, si una
variable aumenta, la otra disminuye. Hay una relación inversa proporcional. Por ejemplo, para la
construcción de un edificio, entre más trabajadores estén construyendo un edificio (variable 1),
menos tiempo se necesitará para tenerlo listo (variable 2)

Correlación nula

Si no encuentras un comportamiento entre las variables, existe una correlación nula.

Estos son pues, los tipos de correlación más visibles. Aunque si lo miramos desde una perspectiva
que evalúa qué tan fuerte o débil es la correlación, encontramos otra clasificación.

¿Otra clasificación de correlación?

El coeficiente de correlación en un diagrama de dispersión

El coeficiente de correlación nos describe cómo es la relación existente entre dos variables, en otras
palabras, al conocer este número sabemos si la correlación es positiva o negativa y qué tan fuerte o
débil es. Se usa la letra r para expresarla, veamos cómo:

r=1

La correlación es positiva perfecta. Si una variable crece, la otra también lo hace en una proporción
constante. Es una relación directa, por eso si trazamos una línea de ajuste esta va pasar por todos y
cada uno de los puntos.

0<r<1

Es cuando r está entre 0 y 1 sin llegar a ser 0 y 1. Es una correlación positiva. El grado de cercanía de
1 define qué tan directa y proporcional es la relación entre ambas variables, por ende, entre más
cerca esté de 0, más débil será su correlación negativa.

r=0

La correlación es nula, es decir que no existe una relación lineal entre ambas variables. Qué tal si
pruebas buscando otro tipo de relación.

-1<r<0

Es cuando r esta entre -1 y 0 sin llegar a ser –1 y 0. Es una correlación negativa. El grado de cercanía
a -1 define que tan inversa y proporcional es la relación entre ambas variables, por ende, entre más
cerca esté de 0, más débil será su correlación negativa.
r=-1

La correlación es negativa perfecta. Si una variable crece, la otra va a disminuir en proporción


constante. Es una relación directa e inversa, por lo tanto, una línea de ajuste va a tocar todos los
puntos graficados.

Para qué se usa un diagrama de dispersión


Entre sus usos está descubrir y mostrar las relaciones entre dos conjuntos asociados de datos y
confirmar relaciones anticipadas entre dos conjuntos asociados de datos.

El diagrama de dispersión puede estudiar la relación entre:

Dos factores o causas relacionadas con la calidad.

Dos problemas de calidad.

Un problema de calidad y su posible causa.

Ventajas
 Representa la relación entre dos variables de forma gráfica, lo que hace más fácil visualizar e
interpretar los datos.
 Calculando la correlación de dos variables, permite cuantificar el grado de relación entre ambas,
así como su signo.

Utilidades
 Obtener información para determinar si dos variables están relacionadas.
 Comprobar cómo afecta a una variable los cambios producidos en otra.
 Probar las posibles relaciones causa / efecto.

Cómo hacer un diagrama de dispersión paso a paso


Paso 1: Determina cuál es la situación. Si no entendemos qué es lo que está ocurriendo, no
podremos establecer las variables a estudiar. Se debe elaborar una teoría admisible y relevante
sobre la supuesta relación entre dos variables.
Paso 2: Obtener los pares de datos correspondientes a las dos variables (X y Y) a estudiar. Si ya
determinaste las variables a estudiar, es porque crees que puede existir una relación entre ellas que
te permita caracterizar la situación.

Paso3: Encontrar los valores mínimo y máximo, tanto para x como para y y utilizar estos valores para
elaborar la escala de los ejes horizontal (x) y vertical (y). Ambos deben tener aproximadamente la
misma longitud.

Paso 4: Ubica los valores en el eje respectivo. Por lo general, la variable independiente es aquella
que no está influenciada por la otra y se ubica en el eje x. La variable dependiente que es la que se
ve afectada por la otra variable se ubica en el eje y. Así pues, procedemos a
ubicar los valores en el plano cartesiano de acuerdo a su variable (x, y)

Paso5: Determina el coeficiente de correlación: El coeficiente de correlación debe verse reflejado en


la forma que toma el gráfico de dispersión. Es el cociente de la covarianza y la multiplicación de la
desviación típica de las dos variables. Con Excel logramos calcularlo de manera muy simple.
calculamos con la Formula COEF.DE.CORREL

o de manera manual que es muy trabajoso, r = n∑ xy – ∑x ∑ y


√n∑(X2)- (x)2 . √n∑(y2)- (∑y)2

Paso6: Analizamos: Con base en el coeficiente y en el gráfico, definimos cuál es la relación de las dos
variables y tomamos las decisiones pertinentes.
Si el resultado del coeficiente de correlación es de:
1 a 0.90, la correlación es positiva fuerte.
0.89 a 0.70, la correlación es positiva buena.
0.69 a 0.45, la correlación es positiva mediana.
0.44 hacia abajo la correlación es positiva mala o baja.

Ejemplo de un diagrama de dispersión


Vamos a ver desde una problemática empresarial, un ejemplo resuelto de diagrama de dispersión
para el área de calidad.
Imagina que una litográfica está abriendo una nueva área de producción para la impresión de
posters, y en este momento se encuentra haciendo todos los ensayos y pruebas para determinar la
cantidad de tinta de cada color que deberían tener las máquinas.
Como prueba inicial, han decidido establecer la relación de errores de impresión según el grado de
llenado de los recipientes de tinta de la máquina.

Bien, definida la situación, iniciamos desde el paso 2:

Las variables a estudiar para este ejemplo de grafico de dispersión en calidad son:

Cantidad de tinta en litros (x)

Número de errores de impresión (y)

Para el paso 3, comenzamos a recolectar las variables. En nuestro caso, el departamento de


control de calidad hace 50 corridas o pruebas durante 5 días continuos. Los valores mínimos son
(0.3, 7) y los máximos (0.7, 31)

Los resultados, a continuación:

Cantidad de errores vs grado de tinta

Cantidad de errores según el grado de tinta


Para el paso 4 ubicamos los ejes según las variables que tenemos. Al estar el número de errores
influenciado por la cantidad de tinta, lo ubicamos como el eje y. Por consiguiente, el eje x es la
cantidad de tinta. Ahora sí, hacemos el gráfico de dispersión.

Paso 5: Determinamos el coeficiente de correlación. En Excel lo calculamos con la

Formula COEF.DE.CORREL. Para nuestro ejemplo resuelto, obtenemos 0,94, ¿se ve esto reflejado en
el gráfico? Por supuesto que sí, fíjate que los puntos están muy cerca unos de los otros, lo que indica
que los valores se correlacionan fuertemente, es decir que la relación entre un aumento en los litros
de tinta, impacta directamente en el número de errores en la impresión de posters. De hecho, se
hace evidente si miramos la tabla, no hay grandes saltos entre datos si miramos el número de
errores.

Paso 6: Analizamos. Evidentemente hay una relación positiva fuerte entre la cantidad de tinta con
la que se carga el tubo de la máquina y el número de errores generados en la impresión de los
posters. Un paso siguiente para un problema de este tipo, sería buscar la forma de aprovechar la
capacidad restante de la máquina, por ejemplo, usar más tubos y más pequeños.

También podría gustarte