Capítulo 4. Estadígrafos de Dispersión

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

ESTADÍSTICA APLICADA

CAPÍTULO 4
ESTADÍGRAFOS DE DISPERSIÓN

En el capítulo anterior se señaló que los valores incluidos en un grupo de datos usualmente varían en
magnitud. Algunos valores son pequeños y algunos son grandes. La variación de los valores es llamada
dispersión, y puede ser medida por muchos métodos diferentes.
Una medida de dispersión es importante en dos modos: primero puede ser usada para mostrar el grado
de variación entre los valores en los datos dados. Por ejemplo, una muy baja dispersión de los salarios
por hora de un grupo de trabajadores en una fábrica, dará la indicación que a los trabajadores en la
fábrica le son pagados, aproximadamente salarios iguales. Pero, por otro lado, una alta dispersión dará
a un lector la impresión de que los trabajadores son pagados en una amplia variación de los salarios
por hora.
Segundo, la medida de dispersión puede ser usada para suplementar un promedio para describir un
grupo de datos o para comparar un grupo de datos con otro. Cuando la dispersión es alta, el promedio
se vuelve de poca o ninguna significación. Cuando la dispersión es baja, el valor promedio se vuelve
altamente significativo; esto es, el promedio es un valor altamente representativo.

4.1 VARIANZA, DESVIACIÓN ESTÁNDAR Y COEFICIENTES DE VIABILIDAD

VARIANZA
La varianza es la principal medida de dispersión, es la más precisa y la de mayor uso, en especial su uso
es amplio en Estadística Inferencial.

Para datos dispersos:


∑𝑁
𝑗=1(𝑋𝑗 − 𝜇)
2
∑(𝑋 − 𝜇)2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝜎2 = =
𝑁 𝑁

2
∑𝑁 ̅ 2 ∑(𝑋 − 𝑋̅)2 𝑛 ∑ 𝑋 2 − (∑ 𝑋)2
𝑗=1(𝑋𝑗 − 𝑋 )
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑠 = = =
𝑛−1 𝑛−1 𝑛(𝑛 − 1)

Para datos agrupados:


∑𝑁
40

2
2 𝑗=1 𝑓(𝑋𝑗 − 𝜇) ∑ 𝑓(𝑋 − 𝜇)2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝜎 = =
Página

𝑁 𝑁

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.


ESTADÍSTICA APLICADA

∑𝑁 ̅ 2
𝑗=1 𝑓(𝑋𝑗 − 𝑋) ∑ 𝑓(𝑋 − 𝑋̅)2 𝑛 ∑ 𝑓𝑋 2 − (∑ 𝑓𝑋)2
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑠2 = = =
𝑛−1 𝑛−1 𝑛−1

Ejemplo
Calcular la Varianza poblacional y muestral de los siguientes datos:
a) Los datos son: 12, 14, 17, 18, 19
SOLUCIÓN:
Varianza Poblacional

𝑋1 + 𝑋2 + 𝑋3 + ⋯ . +𝑋𝑛 ∑𝑛𝑖=1 𝑋𝑖 ∑ 𝑋𝑖 12 + 14 + 17 + 18 + 19 80
𝜇= = = = = = 16
𝑁 𝑁 𝑁 5 5

∑(𝑋 − 𝜇)2 (12 − 16)2 + (14 − 16)2 + (17 − 16)2 + (18 − 16)2 + (19 − 16)2 34
𝜎2 = = = = 6.8
𝑁 5 5
Varianza Muestral

∑(𝑋 − 𝑋̅)2 (12 − 16)2 + (14 − 16)2 + (17 − 16)2 + (18 − 16)2 + (19 − 16)2 34
𝑠2 = = = = 8.5
𝑛−1 5−1 4

b) Los datos son:

X f
Datos Frec. Abs.
2 10
3 16
4 13
5 11
Total 50

Varianza Poblacional

∑𝑛𝑖=1 𝑓𝑋𝑖 ∑ 𝑓𝑋𝑖 10 ∗ 2 + 16 ∗ 3 + 13 ∗ 4 + 11 ∗ 5 175


𝜇= = = = = 3,5
𝑁 𝑁 50 50
41

∑ 𝑓(𝑋 − 𝜇)2 10(2 − 3.5)2 + 16(3 − 3.5)2 + 13(4 − 3.5)2 + 11(5 − 3.5)2 54.5
𝜎2 = = = = 1.09
Página

𝑁 50 50

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.


ESTADÍSTICA APLICADA

Varianza Muestral

2 2 2 2
∑ 𝑓(𝑋 − 𝑋̅)2 10(2 − 3.5) + 16(3 − 3.5) + 13(4 − 3.5) + 11(5 − 3.5) 54.5
𝑠2 = = = = 1.11 …
𝑛−1 50 − 1 49

DESVIACIÓN ESTANDAR
La Desviación Estándar es la raíz cuadrada positiva de la Varianza.

Para datos dispersos:

∑𝑁
𝑗=1(𝑋𝑗 − 𝜇)
2 ∑(𝑋 − 𝜇̅ )2
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝜎 = √𝜎 2 = √ =√
𝑁 𝑁

∑𝑁 ̅ 2
𝑗=1(𝑋𝑗 − 𝑋 ) ∑(𝑋 − 𝑋̅)2
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝐸𝑠𝑡á𝑛𝑑𝑎𝑟 𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑠 = √𝑠 2 = √ =√
𝑛−1 𝑛−1
Ejemplos
Calcular la Desviación Estándar poblacional y muestral de los siguientes datos:
a) Los datos son: 12, 14, 17, 18, 19
SOLUCIÓN:
Desviación Estándar Poblacional

𝑋1 + 𝑋2 + 𝑋3 + ⋯ . +𝑋𝑛 ∑𝑛𝑖=1 𝑋𝑖 ∑ 𝑋𝑖 12 + 14 + 17 + 18 + 19 80
𝜇= = = = = = 16
𝑁 𝑁 𝑁 5 5

∑(𝑋 − 𝜇)2 (12 − 16)2 + (14 − 16)2 + (17 − 16)2 + (18 − 16)2 + (19 − 16)2 34
𝜎=√ =√ = √ = √6.8 = 2.62
𝑁 5 5

Desviación Estándar Muestral

∑(𝑋 − 𝑋̅)2 (12 − 16)2 + (14 − 16)2 + (17 − 16)2 + (18 − 16)2 + (19 − 16)2 34
𝑠=√ =√ = √ = √8.5 = 2.92
𝑛−1 5−1 4
42
Página

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.


ESTADÍSTICA APLICADA

b) Los datos son:

X f
Datos Frec. Abs.
2 10
3 16
4 13
5 11
Total 50

Desviación Estándar Poblacional

∑𝑛𝑖=1 𝑓𝑋𝑖 ∑ 𝑓𝑋𝑖 10 ∗ 2 + 16 ∗ 3 + 13 ∗ 4 + 11 ∗ 5 175


𝜇 == = = = = 3,5
𝑁 𝑁 50 50

∑ 𝑓(𝑋 − 𝜇)2 10 ∗ (2 − 3.5)2 + 16(3 − 3.5)2 + 13(4 − 3.5)2 + (5 − 3.5)2 54.5


𝜎=√ =√ =√ = √1.09 = 1.04
𝑁 50 50

Desviación Estándar Muestral

2 2 2 2
∑ 𝑓(𝑋 − 𝑋̅)2 10(2 − 3.5) + 16(3 − 3.5) + 13(4 − 3.5) + 11(5 − 3.5) 54.5
𝑠=√ =√ =√ = √1.11 … = 1.05
𝑛−1 50 − 1 49

COEFICIENTE DE VARIACIÓN
Conocido también por Coeficiente de Variabilidad o Coeficiente de Dispersión, es una medida de
dispersión relativa que permite efectuar comparaciones entre diversos conjuntos de datos que no
necesariamente poseen la misma Frecuencia total (número total de datos).

𝜎
𝐶𝑉 𝑃𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝐶𝑉 = ∗ 100%
𝜇

𝑠
𝐶𝑉 (𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑙) 𝐶𝑉 = ∗ 100%
𝑋̅
El Coeficiente de Variación se expresa en porcentaje, que comparado con:
Si el CV < 50% significa baja dispersión, es decir que la Media Aritmética (promedio) es una buena
43

representación del conjunto.


Página

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.


ESTADÍSTICA APLICADA

Si el CV > 50% significa alta dispersión, es decir que la Media Aritmética (promedio) no es una buena
representación del conjunto.

Ejemplos
Calcular el Coeficiente de Variación muestral de los siguientes datos:
a) Los datos son: 12, 14, 17, 18, 19
SOLUCIÓN:
Coeficiente de Variación Muestral
𝑠 2.92
𝐶𝑉 = ∗ 100% = ∗ 100% = 18.25%
̅
𝑋 16
Por tanto, la media es una buena representación de los datos.

b) Los datos son:

X f
Datos Frec. Abs.
2 10
3 16
4 13
5 11
Total 50

Coeficiente de Variación Muestral

∑𝑛𝑖=1 𝑓𝑋𝑖 ∑ 𝑓𝑋𝑖 10 ∗ 2 + 16 ∗ 3 + 13 ∗ 4 + 11 ∗ 5 175


𝑋̅ = = = = = 3,5
𝑛 𝑛 50 50

2 2 2 2
∑ 𝑓(𝑋 − 𝑋̅)2 10(2 − 3.5) + 16(3 − 3.5) + 13(4 − 3.5) + 11(5 − 3.5) 54.5
𝑠=√ =√ =√ = √1.11 … = 1.05
𝑛−1 50 − 1 49

𝑠 1.05
𝐶𝑉 = ∗ 100% = ∗ 100% = 30.0%
̅
𝑋 3.5

Por tanto, la media es una regular representación de los datos.


44
Página

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.


ESTADÍSTICA APLICADA

4.2 COMPONENTES DE VARIANZA: INTERVARIANZA E INTRAVARIANZA

PROPIEDADES DE LA VARIANZA
Primera propiedad: La varianza de una constante es cero.
𝑆 2 [𝑘] = 𝑉[𝑘] = 0

Segunda propiedad: La varianza de la variable más una constante es igual a la varianza de la variable.
Ejemplo: Una empresa quiere calcular, la varianza de las toneladas de alimento que ha vendido en los
últimos 6 meses.
18 20.5 19.6 22 20 21

2
2
∑ 𝑋2 ∑𝑋 2453.41 121.1 2
𝑠 = −( ) = −( ) = 1.535
𝑛 𝑛 6 6

Se desea regalar 2 toneladas de alimento que ha vendido en los últimos 6 meses.


Por tanto, es la misma varianza.

Tercera propiedad: La varianza de una variable por una constante es la varianza de la variable por la
constante al cuadrado.
𝑆 2 [𝑘𝑥] = 𝑉[𝑘𝑥] = 𝑘 2 𝑉[𝑥]

Del anterior ejemplo, Se desea regalar a cada mes un 25% de sus ventas respectivas en sus toneladas,
esto por promociones para cada mes de sus ventas.
18 20.5 19.6 22 20 21
Por tanto, se debe agregar 1.25 a cada mes.
𝑠 2 = 𝑘 2 ∗ 𝑉[𝑥] = 1.252 ∗ [1.535] = 2.398

Cuarta propiedad: Cuando una distribución de frecuencias requiere ser connotada, por la importancia
de sus grupos, se dice que la varianza total debe ser explicada por la variación entre grupos
(intervarianza) y la variación dentro los grupos (intravarianza), tal que:
45

𝑆 2 = 𝑆𝑏 2 + 𝑆𝑐 2 (𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 + 𝐼𝑛𝑡𝑟𝑎𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎)
Página

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.


ESTADÍSTICA APLICADA

Donde:
Varianza de las medias: Medida de las varianzas:

∑𝑘𝑖=1(𝑋
̅̅̅̅ ̅ 2
ℎ 𝑖 − 𝑋 ) ∗ 𝑛ℎ 𝑖 2
∑𝑘𝑖=1 𝑆ℎ𝑖 2 ∗ 𝑛ℎ𝑖
2 𝑆𝑐 =
𝑆𝑏 = 𝑛
𝑛
̅̅̅̅
𝑋ℎ𝑖 = 𝐿𝑎 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑔𝑟𝑢𝑝𝑜 𝑆ℎ𝑖 2 = 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑔𝑟𝑢𝑝𝑜

𝑛ℎ𝑖 = 𝐸𝑙 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑔𝑟𝑢𝑝𝑜


𝑘 = 𝐸𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑔𝑟𝑢𝑝𝑜𝑠 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

La utilidad que tiene la cuarta propiedad es muy importante. En general se puede decir, que si:
• 𝑺𝒃 𝟐 > 𝑺𝒄 𝟐 , hay mayor variabilidad entre grupos que dentro de cada grupo. Por lo tanto, los
grupos son distintos entre si, y constituyen estratos diferentes de la población.
• 𝑺𝒃 𝟐 < 𝑺𝒄 𝟐 , hay mayor variabilidad dentro de cada grupo que entre grupos. Por lo tanto, los
grupos son similares y pueden ser unidos en un solo grupo, que constituyen la población.
Esta propiedad constituye el fundamento del Análisis de Varianza (ANOVA), que es muy utilizada en el
análisis estadístico de experimentos.

¿Cuál es la diferencia entre el muestreo estratificado y el muestreo por conglomerados?


• En el muestreo estratificado, la población está compuesta por estratos que son conjuntos cuyos
elementos son muy similares entre sí, pero hay mucha diferencia entre un estrato y otro. Inter
> Intra.
• En el muestreo por conglomerados, la población está compuesta por conglomerados que son
parecidos entre sí, pero los elementos dentro de cada conglomerado son muy distintos uno del
otro. Intra > Inter.

46
Página

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.


ESTADÍSTICA APLICADA

Ejemplo
A cada persona que se presenta como candidato para un trabajo de ensamblaje en una empresa
Industrial, se le aplica una prueba de aptitudes mecánicas. El encargado de RRHH los dividió en dos
grupos según el tiempo que demoraban en tardar en su prueba.
GRUPO 1 GRUPO 2
Tiempo en Número de Tiempo en Número de
minutos personas minutos personas
1-4 4 10-13 9
4-7 8 13-16 5
7-10 14 16-19 2
TOTAL 26 TOTAL 16

Hallar la media aritmética y la varianza de todos los grupos de postulantes de la empresa e indicar si
valía la pena separar en dos grupos o no.
SOLUCIÓN
VARIANZA PARA DISTRIBUCIONES CUANTITATIVAS AGRUPADAS

2
2
∑ 𝑓𝑖 𝑥 2 ∑ 𝑓𝑖 𝑥𝑖
𝑆 = −( )
𝑛 𝑛

Linf Lsup fi Mci = Xi Xi2 Xi2*fi Xi*fi


1 4 4 2.5 6.25 25 10
4 7 8 5.5 30.25 242 44
7 10 14 8.5 72.25 1011.5 119
10 13 9 11.5 132.25 1190.25 103.5
13 16 5 14.5 210.25 1051.25 72.5
16 19 2 17.5 306.25 612.5 35
TOTAL 42 4132.5 384

Ẋ= 384 = 9.143
42

S2 = 4132.5
42
-
( 384
42 )2 = 14.801

S = 3.847
47
Página

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.


ESTADÍSTICA APLICADA

El promedio de tiempo que los candidatos demoraron en las pruebas es de 9.143 minutos, con una
dispersión (desviación estándar) de 3.847 minutos.

VARIANZA GENERAL S2 = 14.801


Ẋ= 173 = 6.654
PRIMER GRUPO 26
Linf Lsup fi Mci = Xi Xi2 Xi2*fi Xi*fi
S2 =
1
4
4 4
7 8
2.5
5.5
6.25
30.25
25
242
10
44
1278.5
26
-
( 173
26 )2 = 4.899

7 10 14 8.5 72.25 1011.5 119


TOTAL 26 1278.5 173 S = 2.213

SEGUNDO GRUPO
Linf Lsup fi Mci = Xi Xi2 Xi2*fi Xi*fi Ẋ= 211 = 13.188
10 13 9 11.5 132.25 1190.25 103.5 16
13 16 5 14.5 210.25 1051.25 72.5 S2 = 2854 - 211 = 4.465
16 19 2 17.5 306.25 612.5 35 16
( 16
)2
TOTAL 16 2854 211 S = 2.113

DATOS VARIANZA DE LAS MEDIDAS = INTERVARIANZA


Xi fi Xi2 Xi2*fi Xi*fi Sb2 = 3933.68 - 384.00 = 10.067
VARIANZA GENERAL 6.654 26 44.27 1151.12 173.00 42
( 42
)2
2
S = 14.801 13.188 16 173.91 2782.56 211.00
TOTAL 42 3933.68 384.00
PRIMER GRUPO
Ẋ= 6.654 MEDIDA DE LAS VARIANZAS = INTRAVARIANZA
2
S = 4.899 S2 fi S2*fi
n= 26 4.899 26 127.38 Sc2 = 198.82 = 4.734
4.465 16 71.44 42
PRIMER GRUPO TOTAL 42 198.82
Ẋ= 13.188
S2 = 4.465 S2 = Sb2 + Sc2
n= 16 S2 = 10.067 + 4.734

S2 = 14.801

Hay mayor variabilidad entre grupos que dentro de cada grupo. Los grupos son distintitos entres si,
constituyen estratos diferentes de la población. No convienen unir los grupos, conviene que se
48

encuentren separados.
Página

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.


ESTADÍSTICA APLICADA

4.3 DISTRIBUCIÓN DE SIMETRÍA Y ASIMETRÍA

ÍNDICE DE ASIMETRÍA
El medir el nivel de asimetría se denomina también sesgo de una curva de frecuencias, este sesgo o
asimetría respecto a una curva normal.
El orden de ubicación de los promedios describe la simetría o asimetría de la distribución de los datos:

𝑀𝑜 < 𝑀𝑒 < 𝑋̅ 𝑋̅ = 𝑀𝑒 = 𝑀𝑜 𝑋̅ < 𝑀𝑒 < 𝑀𝑜


Asimétrica positiva Simétrica Asimétrica negativa
Donde el Coeficiente de Asimetría de Pearson es el siguiente:
𝑋̅ − 𝑀𝑜 3 ∗ (𝑋̅ − 𝑀𝑒)
𝐴𝑠 = =
𝑠 𝑠
Si 𝐴𝑠 < 0, entonces a izquierda o negativo, es Asimetría Negativa
Si 𝐴𝑠 = 0, es Simétrica
Si 𝐴𝑠 > 0, entonces a derecha o positivo, es Asimetría Positivo

EJEMPLO
Si un conjunto de datos presenta: Promedio de 50, mediana de 48 y Desviación estándar 10.35

3 ∗ (𝑋̅ − 𝑀𝑒) 3 ∗ (50 − 48)


𝐴𝑠 = = = 0.58
𝑠 10.35

El coeficiente de asimetría indica que los datos poseen un Sesgo positivo o que la curva presenta una
Asimetría positiva.
El índice de asimetría de Pearson, aplicando momentos se define para n casos por:
𝑛2 ∗ 𝑚3
𝐴𝑠 =
(𝑛 − 1)(𝑛 − 2)𝑠 3

∑𝑛 ̅ 3
𝑖=1(𝑋𝑖 −𝑋)
Donde, 𝑚3 es el tercer momento, 𝑚3 =
49

𝑛
Página

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.


ESTADÍSTICA APLICADA

Ejemplo
De los conjuntos de datos de diversa presentación. Calcular el coeficiente de asimetría de:
21 23 24 26 27 28 29 31 33 35 40 42 43 45 47 50

Solución:
∑ 𝑋 544
𝑋̅ = = = 34
𝑛 16

∑ 𝑓(𝑋 − 𝑋̅)2 1302


𝑠=√ =√ = 9.32
𝑛−1 15

∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)3 3330


𝑚3 = = = 208.12
𝑛 16

𝑛2 ∗ 𝑚3 162 ∗ 208.12
𝐴𝑠 = = = 0.3137
(𝑛 − 1)(𝑛 − 2)𝑠 3 (16 − 1)(16 − 2)9.323

Por tanto, la curva de frecuencias correspondiente a los datos posee un Sesgo a derecha o Positiva.

Bibliografía

1. Anderson, D. S. (2008). Estadística para Administración y Economía. México D.F.: Cengage Learning
Editores S.A.

2. Chungara, V. (2016). ESTADÍSTICA. La Paz: Leonardo.

3. Moya, R. (2008). Estadística Descriptiva. Lima: Editorial San Marcos.

4. Triola, M. (2018). ESTADÍSTICA. México D.F.: Pearson.

5. Tuckman, B. (1978). Conducting Educational Research. New York: Harcourt, Brace y Jovanovich.
50
Página

INSTITUTO TÉCNICO DE EDUCACIÓN COMERCIAL AMERICANO - I.T.E.C.A.

También podría gustarte