Estadistica Leccion 4

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 37

Estadística

FEBRERO 2010
UPSQ_K
Lección 4
Otras medidas descriptivas

Se continúa con el desarrollo de


medidas para describir un
conjunto de datos
Objetivos
 Al terminar este capítulo podrá:

1. Calcular e interpretar la amplitud, la desviación media, la varianza y la


desviación estándar de datos no agrupados.

2. Calcular e interpretar la amplitud de variación, la varianza y la desviación


estándar de datos agrupados.

3. Explicar las características, usos, ventajas y desventajas de cada medida.


4. Entender el teorema de Chebyshev y la regla normal o empírica, con
relación a un conjunto de observaciones.

5. Calcular e interpretar los cuartiles y la amplitud cuartílica o intercuartílica.

6. Elaborar e interpretar los diagramas de caja.

7. Calcular y entender el coeficiente de asimetría y el coeficiente de


variación.
3
Introducción

 Una medida de dispersión describe como se


distribuyen los datos alrededor de una
medida central.
 Las medidas de dispersión son importantes
para un mejor entendimiento de cuán bien
caracterizan las medidas centrales la
distribución de los datos y sirven para
comparar dos distribuciones de datos
diferentes
4
Medidas de Dispersión

Medidas de Dispersión
Amplitud de la variación

Desviación Media

Varianza

5
Amplitud de variación
Ejemplo 4.1
Amplitud  Valor
Amplitud Valor más
más grande
grande--Valor
Valor más
más pequeño
pequeño
 Los computadores ACER2000 se ensamblan en Quito y Loja.
La siguiente tabla muestra las producciones diarias en cada
una de las ciudades. Calcular la amplitud y comparar.

Quito 48,50,49,49,50,52,51,50,51
Loja 40,53,53,47,50,50,47,60,50

Quito µ = 50, 52 – 48 = 4

Loja µ = 50, 60 – 40 = 20
6
Características

 Solamente dos valores son usados en su


cálculo.
 Está muy influenciada por los valores
extremos.
 Es fácil de calcular y entender.

7
Desviación media

 Promedio aritmético de los valores absolutos de las


desviaciones con respecto a la media aritmética.

 X X
DM 
n
 Todos los valores son usados en el cálculo.
 No está influenciada por valores extremos.
 Los valores absolutos son difíciles de manipular
8
Ejemplo 4.2
Los pesos de una muestra de cajas que contienen libros para una
librería son: 103, 97, 101, 106, 103
Encontrar la amplitud y la desviación media.

XX 510510
Amplitud = 106 – 97 = 9 X 
X   102
102
Desviación media nn 55
 XX  XX 103102
103 102 ...
... 103
103102
102
MD 
MD 
nn 55
115511 4455
  22..44
55
9
Hacer
autoexamen 4.1
Ejemplo 4.3 (Ej. 5 pág. 104)

a) La amplitud es 41 – 26 = 15
b) La media es
XX 34 3435
35 41
41 28
28 26
26 29
29 32
32 36
36 38
38 40
40 339
XX    339  33
33..99
nn 10
10 10
10
c) La desviación media es
 XX  XX 34 3433 33..99 ...
... 404033 33..99
MD 
MD 
nn 10
10
00..1111..1177..1155..9977..99 44..9911..99 22..11 44..1166..11
  44..12
12
10
10
10
Varianza y Desviación
estándar de una población
y de una muestra
Varianza

La varianza de una población es la media aritmética de las


desviaciones de la media poblacional al cuadrado.

( XX   ))
( 22

 22
NN Fórmula
Directa
La varianza de una muestra se calcula como

 XX 
Fórmula de


22
la
desviación

((XX  XX))
22  XX  nn
22

ss 
22

nn11 nn11 12
Ejemplo 4.4
 Las edades de la familia López son:
2, 18, 34, 42
¿Cuál es la varianza y la desviación estándar de la población?

XX 9696
    24
24
nn 44
   22
 22  ( X   )
( X )
N
N
2  24 22
 ...  
 2  24  ...  42  24
42  24 22
   22  236
236  15
15..36
36
44
944
 944  236
236
44 13
Desviación Estándar
La desviación estándar de una población es la raíz
cuadrada positiva de la varianza de la pob.

((XX  )) 22
 
N
N
La desviación estándar de una muestra es la raíz
cuadrada positiva de la varianza de la muestra.

 XX 
22

((XX  XX ))
22  XX  nn
22

ss  
nn 11 nn 11 14
Ejemplo 4.5
Los honorarios por hora ganados por una muestra de 5 estudiantes son:
$7, $5, $11, $8, $6.
¿Cuál es la varianza y la desviación estándar de la muestra?

X 37
X    7.40
n 5
22
ss 
 2
 XX  XX 2 7777..4422 ...
 ...6677..4422
nn11 5511 s  s  5.30
22

21.2
 21.2  55..30
30 Hacer Ejercicio 17 según el
5511 Ejemplo de la página 107
15
Medidas de dispersión de
datos agrupados en una
distribución de frecuencias
Amplitud de variación

Amplitud 
Amplitud  límite
límite superior
superior de
de la
la clase
clase más
más alta
alta
--límite
límite inferior
inferior de
de la
la clase
clase más
más baja
baja
Sueldo por Frecuencia
hora
$5 hasta $10 6
$10 hasta $15 12
Ejemplo Amplitud = 30 - 5 = 25
$15 hasta $20 19
$20 hasta $25 7
$25 hasta $30 3
17
Desviación estándar

((ff **MC
MC))
22
ff **MC
MC 
22

ss  n
n
nn 11
MC es el punto medio de la clase
f es la frecuencia de la clase
n número de observaciones
18
Ejemplo 4.6

Sueldo por hora Frecuencia f Punto Medio X fX fX^2


$5 hasta $10 6 7,5 45 337,5

$10 hasta $15 12 12,5 150 1875

$15 hasta $20 19 17,5 332,5 5818,75

$20 hasta $25 7 22,5 157,5 3543,75

$25 hasta $30 3 27,5 82,5 2268,75

47 767,5 13843,75

n Σfx Σfx^2
Desviación Std 5,34

Hacer Ejercicio 19
21
Interpretación y usos de la
desviación estándar
Teorema de Chebyshev

 Para un conjunto cualquiera de observaciones (muestra o


población) la proporción mínima de valores que se encuentran
dentro de k desviaciones estándar desde la media es por lo
menos

1
1 2
2
k
donde k es una constante mayor que 1

21
Teorema de Chebyshev.
Ejemplo 4.7
 Para un conjunto cualquiera de observaciones (muestra o
población) la proporción mínima de valores que se encuentran
entre la media más dos desviaciones y la media más dos
desviaciones sería

1 1 3
1  22  1  
2 4 4
es decir, el 75% de los datos
22
Teorema de Chebyshev.
Ejemplo 4.8

Datos Proporción de los datos


2 7,5
53 Desviación Estándar
40 23,19961686
53
98 Media 50
47 Media -2*DS 3,60076629
50 Media+2*DS 96,3992337
50
47
60
23
Regla empírica

 En una distribución de frecuencias simétrica,


con forma de campana, aproximadamente
 el 68% de las observaciones estarán entre
más una y menos una desviación estándar
 el 95% de las observaciones estarán entre
más dos y menos dos desviaciones estándar
 el 99,7% de las observaciones se hallarán
entre más tres y menos tres desviaciones
estándar
24
Hacer Ejercicios
23, 24,25

       25


 
Dispersión relativa

 El coeficiente de variación es la razón (cociente)


de la desviación estándar y la media aritmética,
expresada como un porcentaje.

s
CV  (100%)
X

26
Asimetría
Ejemplo 4.9
 Se va a comparar la variación en
 Para los ejecutivos
los ingresos anuales de varios
ejecutivos con la variación en los
ingresos de trabajadores no 50000
calificados. CV  *100%
 En una muestra de ejecutivos 500000
X  $500000  0.1*100%  10%
s  $50000  Para los obreros

 En una muestra de obreros 3200


CV  *100%
32000
X  $32000
 0.1*100%  10%
s  $3200 28

Hacer Ejercicio 30
Asimetría

 Fórmula de Pearson

3(Media - Mediana)
CA 
s
 Fórmula en Softwares

n  X X  33

CA     
n  1n  2   s  
29
Tipos de asimetrías

 Simétrica

 Sesgada hacia la derecha

o positivamente asimétrica

 Sesgada hacia la izquierda

o negativamente asimétrica
30

Ver Ejemplo p. 118


Otras medidas de Dispersión
Cuartiles, deciles y centiles

 Ubicación de los valores que dividen un conjunto de


observaciones en partes iguales.
 Los cuartiles dividen un conjunto de observaciones en 4
partes iguales
 Los deciles dividen a un conjunto de observaciones en 10
partes iguales y los centiles en 100 partes iguales
 Si Lc es la ubicación del centil deseado C entonces

C
Lcc  n  1
100
 Para calcular Lc primeramente se necesita ordenar los
datos.
32
Ver Ejemplo pág. 122
Ejemplo 4.10 (Ej. 37 pág 124) inciso a)

 a) La cantidad de datos es n=30 y ya están ordenados de


menor a mayor. El primer cuartil está en la posición L 25 así que
calculamos

25
L25
25
 30  1  31* 0.25  7.75
100
 Esto quiere decir que el primer cuartil o 25 centil está ubicado
en la posición 7.75. Busquemos el 7mo dato que es el valor 31.
Luego para buscar el valor exacto calculamos la diferencia
entre el 8vo y el 7mo dato que es 34-31=3 y lo multiplicamos
por 0.75 que es la parte decimal del número obtenido. Quiere
decir que el dato que está en la posición 7.75 es
31+0.75*3=31+2.25=33.25. 7mo dato
13 13 13 20 26 27 31 34 34 34 35 35 36 37 38
41 41 41 45 47 47 47 50 51 53 54 56 62 67 82
33
Ejemplo 4.10 (Ej. 37 pág 124) cont…a)

 a) cont. La cantidad de datos es n=30 y ya están ordenados de


menor a mayor. El tercer cuartil está en la posición L 75 así que
calculamos

75
L75
75
 30  1  31 * 0 .75  23. 25
100
 Esto quiere decir que el tercer cuartil o 75 centil está ubicado
en la posición 23.25. Busquemos el 23er dato que es el valor
50. Luego para buscar el valor exacto calculamos la diferencia
entre el 24to y el 23er dato que es 51-50=1 y lo multiplicamos
por 0.25 que es la parte decimal del número obtenido. Quiere
decir que el dato que está en la posición 23.25 es
50+0.25*1=50+0.25=50.25.
13 13 13 20 26 27 31 34 34 34 35 35 36 37 38
34
41 41 41 45 47 47 47 50 51 53 54 56 62 67 82

23er dato
Ejemplo 4.10 (Ej. 37 pág 124) cont.
Inciso b)
 b) El segundo decil está en la posición L20 así que calculamos

20
L20
20
 30  1  31* 0.2  6.2
100
 Esto quiere decir que el segundo decil o 20 centil está ubicado en la
posición 6.2. Busquemos el 6to dato que es el valor 27. Luego para
buscar el valor exacto calculamos la diferencia entre el 7mo y el 6to
dato que es 31-27=4 y lo multiplicamos por 0.2 que es la parte
decimal del número obtenido. Quiere decir que el dato que está en la
posición 6.2 es 27+0.2*4=27+2=29. 6to dato

13 13 13 20 26 27 31 34 34 34 35 35 36 37 38
41 41 41 45 47 47 47 50 51 53 54 56 62 67 82
35
Ejemplo 4.10 (Ej. 37 pág 124) cont…b)

 b) cont. El octavo decil está en la posición L80 así que calculamos

80
L80
80
 30  1  31* 0.8  24.8
100
 Esto quiere decir que el octavo decil u 80 centil está ubicado en la
posición 24.8. Busquemos el 24to dato que es el valor 51. Luego para
buscar el valor exacto calculamos la diferencia entre el 24to y el 25to
dato que es 53-51=2 y lo multiplicamos por 0.8 que es la parte
decimal del número obtenido. Quiere decir que el dato que está en la
posición 24.8 es 51+0.8*2=51+1.6=52.6.
24to dato

13 13 13 20 26 27 31 34 34 34 35 35 36 37 38
41 41 41 45 47 47 47 50 51 53 54 56 62 67 82
36
Ejemplo 4.10 (Ej. 37 pág 124) cont…
inciso c)
 c) El 67 centil está en la posición L67 así que calculamos

67
L6767  30  1  31* 0.67  20.77
100
 Esto quiere decir que el 67 centil está ubicado en la posición 20.77.
Busquemos el 20mo dato que es el valor 20. Luego para buscar el
valor exacto calculamos la diferencia entre el 20mo y el 21er dato que
es 47-47=0 y lo multiplicamos por 0.77 que es la parte decimal del
número obtenido. Quiere decir que el dato que está en la posición
20.77 es 47+0*0.77=47. 20mo dato

13 13 13 20 26 27 31 34 34 34 35 35 36 37 38
41 41 41 45 47 47 47 50 51 53 54 56 62 67 82
37

También podría gustarte