Medidas de Dispersión
Medidas de Dispersión
Medidas de Dispersión
Por
Ederman Luna Hermosilla
73227193
551122A_612
Tutor
María Camila González
Junio-2019
Medidas de dispersión
Parámetros estadísticos que indican como se alejan los datos respecto de la media
aritmética. Sirven como indicador de la variabilidad de los datos. Las medidas de
dispersión más utilizadas son el rango, la desviación estándar y la varianza.
Rango
Indica la dispersión entre los valores extremos de una variable. se calcula como la
diferencia entre el mayor y el menor valor de la variable. Se denota como R.
Para datos ordenados se calcula como:
R = x(n) - x (1)
Donde: x(n): Es el mayor valor de la variable. x(n): Es el menor valor de la variable.
Desviación media
Es la media aritmética de los valores absolutos de las diferencias de cada dato respecto a la
media.
Donde:
disvalores de la variable.
n: número total de datos
Desviación estándar
La desviación estándar mide el grado de deserción de los datos con respecto a la media, se
denota como s para una muestra o como σ para la población. Se define como la raíz
cuadrada de la varianza según la expresión:
Obsérvese que el denominador es n - 1, a diferencia de la desviación media donde se divide
entre n; también existe la fórmula de desviación típica donde el denominador es n pero se
prefiere n-1.
Mientras menor sea la desviación estándar, los datos son más homogéneos, es decir existe
menor dispersión, el incremento de los valores de la desviación estándar indica ina mayor
variabilidad de los datos.
Varianza
Es otro parámetro utilizado para medir la dispersión de los valores de una variable respecto
a la media. Corresponde a la media aritmética de los cuadrados de las desviaciones respecto
a la media. Su expresión matemática es:
Diagramas de caja
Los diagramas de caja son una forma útil de graficar datos divididos en cuatro cuartiles,
cada uno con igual cantidad de valores. El diagrama de caja no grafica frecuencia ni
muestra las estadísticas individuales, pero en ellos podemos ver claramente dónde se
encuentra la mitad de los datos. Es un buen diagrama para analizar la asimetría en los datos.
A continuación, te dejamos algunas palabras que debes tener en cuenta cuando graficas
diagramas de caja:
Q1 – Cuartil 1, la mediana de la mitad menor de los datos.
Q2 – Cuartil 2, la mediana de todos los datos.
Q3 – Cuartil 3, la mediana de la mitad mayor de los datos.
IQR – Rango Inter cuartil, la diferencia entre Q3 y Q1.
Valores extremos – Los valores más pequeños y los más grandes de los datos.
Comencemos haciendo un diagrama de caja de la puntuación en el examen de geometría:
90, 94, 53, 68, 79, 84, 87, 72, 70, 69, 65, 89, 85, 83, 72
Paso 1: ordena los datos de menor a mayor.
53 65 68 69 70 72 79 83 84 85 87 89 90 94
Paso 2: encuentra la mediana de los datos.
Llamado también cuartil 2 (Q2).
Paso 3: encuentra la mediana de los datos menores que Q2.
Este sería el cuartil menor (Q1).
Paso 4: encuentra la mediana de la data mayor que Q2.
Este sería el cuartil mayor (Q3).
Paso 5: encuentra los valores extremos.
Estos serían los valores más grandes y más pequeños.
Valores extremos = 53 y 94.
Paso 6: crea una recta real que contenga todos los datos.
Deja que se extienda un poco más allá de los valores extremos.
Paso 7: dibuja una caja de Q1 a Q3 divididas por una recta en Q2. Luego extiende los
"bigotes" por cada lado de la caja hacia los valores extremos.
empresas fueron:
a) La varianza
n
Varianza=∑ ¿¿ ¿
i =1
n
Varianza=∑ ¿¿ ¿
i =1
DesviacionTipica=√ Varianza
DesviacionTipica=√ 60,622
DesviacionTipica=7,78
c) c) Desviación media.
n
∑ (¿ x−x i)
Desviacion Media= i=1 ¿
n
(10−21,283)+(10,9−21,283)+(11,5−21,283)+(14,9−21,28)+¿(18,1−21,28)+(20,5−21,283)+(25,5−21,2
+(28,2−21,283)+(28,9−21,283)+(34,4−21,283)
12
Desviacion Media=6,96666
Tarea 2: En la siguiente aparecen los años de servicio acumulados por 360 trabajadores de
1-2 34
2-3 56
3-4 76
4-5 80
5-6 25
6-7 10
7-8 27
8-9 12
9-10 8
10-11 19
11-12 3
a. Histograma
b. Media
c. Mediana
d. Moda
e. Varianza
de experiencia
Tabla de frecuencias
Marca de clase: x i
Frecuencia absoluta: f i
Frecuencia acumulada: F i
Años de x i fi Fi
experiencia
0-1 0.5 10 10
1-2 1.5 34 44
a) Dibuje el histograma
Número de empleados
80
76
Empleados
56
34
25 27
19
10 10 12
8
0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 9-10 10-11 3
11-12
Años de experiencia
b) Media
Sumamos la totalidad de los productos de frecuencia absoluta por la marca de clase de cada
intervalo
Años de x i fi Fi x i* f i
experiencia
0-1 0.5 10 10 5
1-2 1.5 34 44 51
1639
X=
360
1639
X=
360
X =4,55
c) Mediana
180−176 4
Me=4 + = =0,05
80 20
d) Moda
f i−f i −1
Mo=Li +
(f ¿ ¿i−f i−1 )+ ¿¿ ¿
80−76 4 4
Mo=4 + ∗1=¿ 4 + ∗1= =0,06
(80−76)+(80−25) 4+ 55 59
Mo= 0,06
e) Varianza
Años de xi fi Fi x i* f i x i2* f i
experiencia
0-1 0.5 10 10 5 2,5
9758 9758
v= −4,552 = −20,7=26,1
360 360
f) Desviación típica
Necesitamos:
Media: X =4,55
Varianza: 26,1
9758
√ 360
−−4,552 =√ 27.10−20,7025= √ 6,7025 =2,529
años de experiencia.
1-2 1.5 34 44
51 76,5 9,4 12,2
2-3 2.5 56 100
140 350 15,6 27,8
3-4 3.5 76 176 266 931 21,1 48,9
4-5 4.5 80 256 360 1620 22,2 71,1
5-6 5.5 25 281
137,5 756,25 6,9 78,1
6-7 6.5 10 291 65 422,5 2,8 80,8
7-8 7.5 27 318 202,5 1518,75 7,5 88,3
8-9 8.5 12 330
102 867 3,3 91,7
9-10 9.5 8 338
76 722 2,2 93,9
10-11 10.5 19 357
199,5 2094,75 5,3 99,2
11-12 11.5 3 360 34,5 396,75 0,8 100,0
360 1639 9758 100%
De acuerdo a la gráfica, se estima que un 89.7% se encuentra en el rango de más de 8 años
Tarea 3: La siguiente tabla refiere a los usos más comunes citados en una encuesta
Área Respuesta
Contabilidad 26%
Hallar:
a) Media
b) Mediana
c) Moda
d) Varianza
e) Desviación típica
Media 14%
mediana 13%
varianza 0,005677551
Tarea 4: Una compañía asigna diferentes precios a un equipo de sonido particular en ocho
regiones diferentes del país. La tabla adjunta muestra el número de unidades vendidas y los
precios correspondientes (en miles de pesos).
Para poder realizar el ejercicio complementamos la tabla con los siguientes datos: producto
Realizamos el
x y ( XY ) x2
402 45 18090 161604 complemento de la
381 66 25146 145161
tabla acorde a los
350 70 24500 122500
430 90 38700 184900 requerimientos:
441 75 33075 194481
380 45 17100 144400
405 65 26325 164025
420 70 29400 176400
421 65 27365 177241
SUMATORIA 3630 591 239701 1470712
n= 9
a) Estimar la ecuación de regresión lineal de las ventas sobre el precio que mejor se
ajuste.
y=ax+ b
Para encontrar el valor de (a) y (b) procedemos a:
x ∑ x i y i−∑ xi ∑ y i
a= 2
n ∑ x 2i −( ∑ xi )
(19307970)−( 2145330 )
a=
( 13236408 )−(1470712)
17162640
a=
11765696
a=1.4587
b=
∑ y−a ∑ x
n
591−(1.4587)(3630)
b=
9
591−(5295.1)
b=
8
−4704
b=
9
b=−522.66
y=1.4587 x−522.66
y +522.66=1.4587 x
y+ 522.66
=x
1.4587
y +522.66
x=
1.4587
1) y=55
2) y=58
3) y=68
4) y=70
Precio 1: $55000
y +522.66
x=
1.4587
55+522.66
x=
1.4587
577.66
x=
1.4587
x=¿396.01
Precio 2: $58
y +522.66
x=
1.4587
58+522.66
x=
1.4587
580.66
x=
1.4587
x=¿398.06
Precio 3: $68
y +522.66
x=
1.4587
68+522.66
x=
1.4587
590.66
x= x=¿404.92
1.4587
Precio 4: $70
y +522.66
x=
1.4587
70+522.66
x=
1.4587
592.66
x=
1.4587
x=¿406.29
ventas 55 58 68 70
precio 396,01 398,06 404,92 406,29
x y
n= 9
r=
∑ (x−x́)( y− ý )
√ ∑ ( x−x́ )2 √∑ ( y −ý )2
1331
r=
√ 6612 √ 1572
1331
r=
( 81.31 ) ( 39.64 )
1331
r=
3223.3
r =0.4129
El valor de r
contempla el
valor de
0.4129 (entre
0 y 1), estaremos ante una relación estadística positiva, según (Pearson) el valor de r se
Tarea 5: Los datos de la siguiente tabla representa las alturas (X) cm. y los pesos (Y) kg.
de varios hombres.
Para poder realizar el ejercicio complementamos la tabla con los siguientes datos: producto
X Y (XY)
a) Estimar la ecuación que mejor se ajuste de modo que el peso dependa de la altura.
y=ax+ b
Para encontrar el valor de (a) y (b) procedemos a:
x ∑ x i y i−∑ xi −∑ y i
a= 2
n ∑ x 2i −( ∑ x i )
3323
a= =0,1064
31228
b=
∑ y−a ∑ x
n
457.5−(0.1064)(1358)
b=
8
457.5−(0.1064)(1358)
b=
8
457.5−(144.49)
b=
8
313.01
b=
8
b=39.1 2
y=0.1064 x+39.12
5) x=150
6) x=153
7) x=175
Peso 1: 150 cm
y=0.1064 x+39.12
y=0.1064(150)+39.12
y=15.95+ 39.12
y=55.08kg
Peso 2: 153 cm
y=0.1064 x+39.12
y=0.1064(153 kg)+39.12
y=16.27 +39.12
y=55.39kg
Peso 3: 175 cm
y=0.1064 x+39.12
y=0.1064(175)+39.12
y=18.62+39.12
y=57.74kg
X Y
N de
datos 8
r=
∑ (x−x́)( y− ý )
√ ∑ ( x−x́ )2 √∑ ( y −ý )2
415.375
r=
√ 3903.5 √ 999.96
415.375
r=
( 62.47 )( 31.62 )
415.375
r=
1975.43
r =0.2102
El valor de r contempla el valor de 0.2102 (entre 0 y 1), estaremos ante una relación
estadística positiva, que es menos fuerte ya que está más cercana de 0. Esto indica que
algunos puntos están cerca de la línea, pero otros puntos están lejos de ella, lo que indica
que solo existe una relación lineal moderada entre las variables.
Referencias