Capítulo 4. Estadígrafos de Dispersión
Capítulo 4. Estadígrafos de Dispersión
Capítulo 4. Estadígrafos de Dispersión
CAPÍTULO 4
ESTADÍGRAFOS DE DISPERSIÓN
En el capítulo anterior se señaló que los valores incluidos en un grupo de datos usualmente varían en
magnitud. Algunos valores son pequeños y algunos son grandes. La variación de los valores es llamada
dispersión, y puede ser medida por muchos métodos diferentes.
Una medida de dispersión es importante en dos modos: primero puede ser usada para mostrar el grado
de variación entre los valores en los datos dados. Por ejemplo, una muy baja dispersión de los salarios
por hora de un grupo de trabajadores en una fábrica, dará la indicación que a los trabajadores en la
fábrica le son pagados, aproximadamente salarios iguales. Pero, por otro lado, una alta dispersión dará
a un lector la impresión de que los trabajadores son pagados en una amplia variación de los salarios
por hora.
Segundo, la medida de dispersión puede ser usada para suplementar un promedio para describir un
grupo de datos o para comparar un grupo de datos con otro. Cuando la dispersión es alta, el promedio
se vuelve de poca o ninguna significación. Cuando la dispersión es baja, el valor promedio se vuelve
altamente significativo; esto es, el promedio es un valor altamente representativo.
VARIANZA
La varianza es la principal medida de dispersión, es la más precisa y la de mayor uso, en especial su uso
es amplio en Estadística Inferencial.
2
∑𝑁 ̅ 2 ∑(𝑋 − 𝑋̅)2 𝑛 ∑ 𝑋 2 − (∑ 𝑋)2
𝑗=1(𝑋𝑗 − 𝑋 )
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑠 = = =
𝑛−1 𝑛−1 𝑛(𝑛 − 1)
2
2 𝑗=1 𝑓(𝑋𝑗 − 𝜇) ∑ 𝑓(𝑋 − 𝜇)2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝜎 = =
Página
𝑁 𝑁
∑𝑁 ̅ 2
𝑗=1 𝑓(𝑋𝑗 − 𝑋) ∑ 𝑓(𝑋 − 𝑋̅)2 𝑛 ∑ 𝑓𝑋 2 − (∑ 𝑓𝑋)2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑠2 = = =
𝑛−1 𝑛−1 𝑛−1
Ejemplo
Calcular la Varianza poblacional y muestral de los siguientes datos:
a) Los datos son: 12, 14, 17, 18, 19
SOLUCIÓN:
Varianza Poblacional
𝑋1 + 𝑋2 + 𝑋3 + ⋯ . +𝑋𝑛 ∑𝑛𝑖=1 𝑋𝑖 ∑ 𝑋𝑖 12 + 14 + 17 + 18 + 19 80
𝜇= = = = = = 16
𝑁 𝑁 𝑁 5 5
∑(𝑋 − 𝜇)2 (12 − 16)2 + (14 − 16)2 + (17 − 16)2 + (18 − 16)2 + (19 − 16)2 34
𝜎2 = = = = 6.8
𝑁 5 5
Varianza Muestral
∑(𝑋 − 𝑋̅)2 (12 − 16)2 + (14 − 16)2 + (17 − 16)2 + (18 − 16)2 + (19 − 16)2 34
𝑠2 = = = = 8.5
𝑛−1 5−1 4
X f
Datos Frec. Abs.
2 10
3 16
4 13
5 11
Total 50
Varianza Poblacional
∑ 𝑓(𝑋 − 𝜇)2 10(2 − 3.5)2 + 16(3 − 3.5)2 + 13(4 − 3.5)2 + 11(5 − 3.5)2 54.5
𝜎2 = = = = 1.09
Página
𝑁 50 50
Varianza Muestral
2 2 2 2
∑ 𝑓(𝑋 − 𝑋̅)2 10(2 − 3.5) + 16(3 − 3.5) + 13(4 − 3.5) + 11(5 − 3.5) 54.5
𝑠2 = = = = 1.11 …
𝑛−1 50 − 1 49
DESVIACIÓN ESTANDAR
La Desviación Estándar es la raíz cuadrada positiva de la Varianza.
∑𝑁
𝑗=1(𝑋𝑗 − 𝜇)
2 ∑(𝑋 − 𝜇̅ )2
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝜎 = √𝜎 2 = √ =√
𝑁 𝑁
∑𝑁 ̅ 2
𝑗=1(𝑋𝑗 − 𝑋 ) ∑(𝑋 − 𝑋̅)2
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑠 = √𝑠 2 = √ =√
𝑛−1 𝑛−1
Ejemplos
Calcular la Desviación Estándar poblacional y muestral de los siguientes datos:
a) Los datos son: 12, 14, 17, 18, 19
SOLUCIÓN:
Desviación Estándar Poblacional
𝑋1 + 𝑋2 + 𝑋3 + ⋯ . +𝑋𝑛 ∑𝑛𝑖=1 𝑋𝑖 ∑ 𝑋𝑖 12 + 14 + 17 + 18 + 19 80
𝜇= = = = = = 16
𝑁 𝑁 𝑁 5 5
∑(𝑋 − 𝜇)2 (12 − 16)2 + (14 − 16)2 + (17 − 16)2 + (18 − 16)2 + (19 − 16)2 34
𝜎=√ =√ = √ = √6.8 = 2.62
𝑁 5 5
∑(𝑋 − 𝑋̅)2 (12 − 16)2 + (14 − 16)2 + (17 − 16)2 + (18 − 16)2 + (19 − 16)2 34
𝑠=√ =√ = √ = √8.5 = 2.92
𝑛−1 5−1 4
42
Página
X f
Datos Frec. Abs.
2 10
3 16
4 13
5 11
Total 50
2 2 2 2
∑ 𝑓(𝑋 − 𝑋̅)2 10(2 − 3.5) + 16(3 − 3.5) + 13(4 − 3.5) + 11(5 − 3.5) 54.5
𝑠=√ =√ =√ = √1.11 … = 1.05
𝑛−1 50 − 1 49
COEFICIENTE DE VARIACIÓN
Conocido también por Coeficiente de Variabilidad o Coeficiente de Dispersión, es una medida de
dispersión relativa que permite efectuar comparaciones entre diversos conjuntos de datos que no
necesariamente poseen la misma Frecuencia total (número total de datos).
𝜎
𝐶𝑉 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝐶𝑉 = ∗ 100%
𝜇
𝑠
𝐶𝑉 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙) 𝐶𝑉 = ∗ 100%
𝑋̅
El Coeficiente de Variación se expresa en porcentaje, que comparado con:
Si el CV < 50% significa baja dispersión, es decir que la Media Aritmética (promedio) es una buena
43
Si el CV > 50% significa alta dispersión, es decir que la Media Aritmética (promedio) no es una buena
representación del conjunto.
Ejemplos
Calcular el Coeficiente de Variación muestral de los siguientes datos:
a) Los datos son: 12, 14, 17, 18, 19
SOLUCIÓN:
Coeficiente de Variación Muestral
𝑠 2.92
𝐶𝑉 = ∗ 100% = ∗ 100% = 18.25%
̅
𝑋 16
Por tanto, la media es una buena representación de los datos.
X f
Datos Frec. Abs.
2 10
3 16
4 13
5 11
Total 50
2 2 2 2
∑ 𝑓(𝑋 − 𝑋̅)2 10(2 − 3.5) + 16(3 − 3.5) + 13(4 − 3.5) + 11(5 − 3.5) 54.5
𝑠=√ =√ =√ = √1.11 … = 1.05
𝑛−1 50 − 1 49
𝑠 1.05
𝐶𝑉 = ∗ 100% = ∗ 100% = 30.0%
̅
𝑋 3.5
PROPIEDADES DE LA VARIANZA
Primera propiedad: La varianza de una constante es cero.
𝑆 2 [𝑘] = 𝑉[𝑘] = 0
Segunda propiedad: La varianza de la variable más una constante es igual a la varianza de la variable.
Ejemplo: Una empresa quiere calcular, la varianza de las toneladas de alimento que ha vendido en los
últimos 6 meses.
18 20.5 19.6 22 20 21
2
2
∑ 𝑋2 ∑𝑋 2453.41 121.1 2
𝑠 = −( ) = −( ) = 1.535
𝑛 𝑛 6 6
Tercera propiedad: La varianza de una variable por una constante es la varianza de la variable por la
constante al cuadrado.
𝑆 2 [𝑘𝑥] = 𝑉[𝑘𝑥] = 𝑘 2 𝑉[𝑥]
Del anterior ejemplo, Se desea regalar a cada mes un 25% de sus ventas respectivas en sus toneladas,
esto por promociones para cada mes de sus ventas.
18 20.5 19.6 22 20 21
Por tanto, se debe agregar 1.25 a cada mes.
𝑠 2 = 𝑘 2 ∗ 𝑉[𝑥] = 1.252 ∗ [1.535] = 2.398
Cuarta propiedad: Cuando una distribución de frecuencias requiere ser connotada, por la importancia
de sus grupos, se dice que la varianza total debe ser explicada por la variación entre grupos
(intervarianza) y la variación dentro los grupos (intravarianza), tal que:
45
𝑆 2 = 𝑆𝑏 2 + 𝑆𝑐 2 (𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 + 𝐼𝑛𝑡𝑟𝑎𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎)
Página
Donde:
Varianza de las medias: Medida de las varianzas:
∑𝑘𝑖=1(𝑋
̅̅̅̅ ̅ 2
ℎ 𝑖 − 𝑋 ) ∗ 𝑛ℎ 𝑖 2
∑𝑘𝑖=1 𝑆ℎ𝑖 2 ∗ 𝑛ℎ𝑖
2 𝑆𝑐 =
𝑆𝑏 = 𝑛
𝑛
̅̅̅̅
𝑋ℎ𝑖 = 𝐿𝑎 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑔𝑟𝑢𝑝𝑜 𝑆ℎ𝑖 2 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑔𝑟𝑢𝑝𝑜
La utilidad que tiene la cuarta propiedad es muy importante. En general se puede decir, que si:
• 𝑺𝒃 𝟐 > 𝑺𝒄 𝟐 , hay mayor variabilidad entre grupos que dentro de cada grupo. Por lo tanto, los
grupos son distintos entre si, y constituyen estratos diferentes de la población.
• 𝑺𝒃 𝟐 < 𝑺𝒄 𝟐 , hay mayor variabilidad dentro de cada grupo que entre grupos. Por lo tanto, los
grupos son similares y pueden ser unidos en un solo grupo, que constituyen la población.
Esta propiedad constituye el fundamento del Análisis de Varianza (ANOVA), que es muy utilizada en el
análisis estadístico de experimentos.
46
Página
Ejemplo
A cada persona que se presenta como candidato para un trabajo de ensamblaje en una empresa
Industrial, se le aplica una prueba de aptitudes mecánicas. El encargado de RRHH los dividió en dos
grupos según el tiempo que demoraban en tardar en su prueba.
GRUPO 1 GRUPO 2
Tiempo en Número de Tiempo en Número de
minutos personas minutos personas
1-4 4 10-13 9
4-7 8 13-16 5
7-10 14 16-19 2
TOTAL 26 TOTAL 16
Hallar la media aritmética y la varianza de todos los grupos de postulantes de la empresa e indicar si
valía la pena separar en dos grupos o no.
SOLUCIÓN
VARIANZA PARA DISTRIBUCIONES CUANTITATIVAS AGRUPADAS
2
2
∑ 𝑓𝑖 𝑥 2 ∑ 𝑓𝑖 𝑥𝑖
𝑆 = −( )
𝑛 𝑛
Ẋ= 384 = 9.143
42
S2 = 4132.5
42
-
( 384
42 )2 = 14.801
S = 3.847
47
Página
El promedio de tiempo que los candidatos demoraron en las pruebas es de 9.143 minutos, con una
dispersión (desviación estándar) de 3.847 minutos.
SEGUNDO GRUPO
Linf Lsup fi Mci = Xi Xi2 Xi2*fi Xi*fi Ẋ= 211 = 13.188
10 13 9 11.5 132.25 1190.25 103.5 16
13 16 5 14.5 210.25 1051.25 72.5 S2 = 2854 - 211 = 4.465
16 19 2 17.5 306.25 612.5 35 16
( 16
)2
TOTAL 16 2854 211 S = 2.113
S2 = 14.801
Hay mayor variabilidad entre grupos que dentro de cada grupo. Los grupos son distintitos entres si,
constituyen estratos diferentes de la población. No convienen unir los grupos, conviene que se
48
encuentren separados.
Página
ÍNDICE DE ASIMETRÍA
El medir el nivel de asimetría se denomina también sesgo de una curva de frecuencias, este sesgo o
asimetría respecto a una curva normal.
El orden de ubicación de los promedios describe la simetría o asimetría de la distribución de los datos:
EJEMPLO
Si un conjunto de datos presenta: Promedio de 50, mediana de 48 y Desviación estándar 10.35
El coeficiente de asimetría indica que los datos poseen un Sesgo positivo o que la curva presenta una
Asimetría positiva.
El índice de asimetría de Pearson, aplicando momentos se define para n casos por:
𝑛2 ∗ 𝑚3
𝐴𝑠 =
(𝑛 − 1)(𝑛 − 2)𝑠 3
∑𝑛 ̅ 3
𝑖=1(𝑋𝑖 −𝑋)
Donde, 𝑚3 es el tercer momento, 𝑚3 =
49
𝑛
Página
Ejemplo
De los conjuntos de datos de diversa presentación. Calcular el coeficiente de asimetría de:
21 23 24 26 27 28 29 31 33 35 40 42 43 45 47 50
Solución:
∑ 𝑋 544
𝑋̅ = = = 34
𝑛 16
𝑛2 ∗ 𝑚3 162 ∗ 208.12
𝐴𝑠 = = = 0.3137
(𝑛 − 1)(𝑛 − 2)𝑠 3 (16 − 1)(16 − 2)9.323
Por tanto, la curva de frecuencias correspondiente a los datos posee un Sesgo a derecha o Positiva.
Bibliografía
1. Anderson, D. S. (2008). Estadística para Administración y Economía. México D.F.: Cengage Learning
Editores S.A.
5. Tuckman, B. (1978). Conducting Educational Research. New York: Harcourt, Brace y Jovanovich.
50
Página