Medidas de Dispersión en Excel.

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 13

Estadística 2.

Unidad 2: Medidas de
dispersión.
*Rango.
*Varianza.
*Desviación media.
*Desviación estándar.
*Cuartiles y percentiles.
Medidas de dispersión.

Hemos visto que, la media aritmética, la mediana y la moda sirven para ubicar donde se concentra un
conjunto de valores o datos. Pero para formarse una idea más completa de la realidad de los valores, no es
suficiente solo contar con las medidas de tendencia central, una descripción más completa puede
obtenerse si también se mide cuán dispersos están los datos alrededor de la tendencia central.

Rango

Cuartiles y
Varianza
percentiles
Medidas
de
dispersión

Desviación Desviación
estandar media

En otras palabras, para tener una idea completa que permita tomar decisiones acerca de un fenómeno en
estudio es preciso conocer tanto las medidas de tendencia central como las llamadas medidas de
dispersión.
Rango.

El rango es la diferencia que hay entre el dato de


mayor valor y el dato de menor valor.

14, 15, 12, 18, 17, 14, 19, 16, 15, 20

𝑅 = 20 − 12 = 8
Desviación media.

La desviación media es una medida importante de


dispersión que nos permite entender cuánto varían
los datos de un conjunto promedio. La desviación
media de un conjunto de datos 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 se
calcula mediante la siguiente fórmula:

σ(|𝑥𝑖 − 𝑥ҧ |)
𝐷𝑀 =
𝑛
Varianza.

La varianza es una medida de dispersión. Eso significa que pretende capturar en qué medida los datos están
en torno a la media. Si tenemos datos muy por encima y muy por debajo de la media, esta será menos
representativa y lo veremos reflejado en una elevada varianza.
Imaginemos, por ejemplo, que queremos calcular el
salario medio de dos empresas de solo dos
trabajadores. En la empresa A, los salarios son de
24.500 y 23.500 euros. En la B, son de 16.000 y 32.000
euros. Vemos que, en ambos casos, la media es la
misma: 24.000 euros. Sin embargo, esa media es más
representativa en la empresa A, ya que los 2 valores se
encuentran mucho más próximos a la media que en la
empresa B.
σ[ 𝑥𝑖 − 𝑥ҧ ]2
𝑆2 =
𝑛−1
Desviación estándar.

La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos
con respecto a la media. Mientras mayor sea la desviación estándar, mayor será la dispersión de los datos.

Considere el ejemplo siguiente. Los administradores dan


seguimiento al tiempo de egreso de los pacientes tratados en las
áreas de urgencia de dos hospitales. Aunque los tiempos de
egreso promedio son aproximadamente iguales (35 minutos), las
desviaciones estándar son significativamente diferentes. La
desviación estándar del hospital 1 es de aproximadamente 6. En
promedio, el tiempo para dar de alta a un paciente se desvía de
la media (línea discontinua) aproximadamente 6 minutos. La
desviación estándar del hospital 2 es de aproximadamente 20.
σ 𝑥2 σ(𝑥𝑖 − 𝑥)ҧ 2 En promedio, el tiempo para dar de alta a un paciente se desvía
𝜎= − 𝑥ҧ 2 𝑆= de la media (línea discontinua) aproximadamente 20 minutos.
𝑛 𝑛
Medidas de dispersión.

Tanto para la varianza como para la desviación estándar


la interpretación es la misma: si valen cero, entonces no
hay dispersión y todos los datos son exactamente
iguales entre sí; si son valores pequeños entonces habrá Sin embargo, al momento de comprender qué significa
poca dispersión y si son grandes habrá mucha ser un valor grande o pequeño, es mucho más fácil
dispersión. interpretar los valores de la desviación estándar que los
de la varianza, ya que se encuentran en las mismas
unidades que los datos. Esto no es tan sencillo en el
Al comparar la varianza con la desviación estándar, la caso de la varianza.
varianza es mucho más sensible a estos valores
extremos ya que todas las desviaciones están elevadas
al cuadrado, mientras que en la desviación estándar no.
Medidas de dispersión.
Cuartiles y percentiles.

Cuando nos referimos a un cuartil, cada conjunto de


datos posee 3 cuartiles, que dividen a todo el conjunto
de datos en 4 partes iguales. Estos valores se
denominan como 𝑄1 , 𝑄2 𝑦 𝑄3 , llamados primer, segundo y
tercer cuartil respectivamente. El cuartil 2 es la
mediana de todo el conjunto de datos, el cuartil 1 es la
mediana de todos los datos menores a la mediana
principal, mientras que el cuartil 3 es la mediana de
todos los datos mayores a la mediana principal.
Cuartiles y percentiles.

Los percentiles dividen el conjunto de datos en 100


partes iguales. Ordenando el conjunto de datos de
menor a mayor, el percentil debe ser un valor entero, si
da decimal debe redondearse. El percentil se obtiene
con el valor de posición L que da la siguiente fórmula:

𝑛𝑘
𝐿=
100
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
𝑘 = 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑞𝑢𝑒 𝑠𝑒 𝑞𝑢𝑖𝑒𝑟𝑒 𝑒𝑛𝑐𝑜𝑛𝑡𝑟𝑎𝑟
𝐿 = 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑎 𝑒𝑛𝑐𝑜𝑛𝑡𝑟𝑎𝑟
Cuartiles y percentiles.

https://youtu.be/OHAoZlcy4oE?si=2EJkZlWAhi2JjZG9
Cuartiles y percentiles.

https://youtu.be/JbdPHO99JTc?si=EUoYIEDlANRrp_CD
Medidas de dispersión.

Actividad 2:
El ausentismo diario de una oficina parece ir en aumento. El año pasado un promedio de 45.6 empleados
estuvo ausente varios días con una desviación estándar de 14.5. El director de la oficina contrató a un
consultor para evaluar el ausentismo este año, por lo que recolectó una muestra de datos. Con base a la
información comprueba en Excel, grafica y calcula a mano:
a) La media aritmética actual.
b) La desviación estándar.
c) Los cuartiles.
d) Los percentiles 10 y 90.
e) Una conclusión comparando los resultados del año pasado con los actuales.
Número de 24 33 42 51 60 69
empleados
ausentes.
Días de 5 9 10 8 6 2 n=40
ausencia.

También podría gustarte