UNPRG Diapositivas Cuarta Semana ESTADISTICA GENERAL Ciclo 2022 II Medidas de Tendencia Central

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 43

ANÁLISIS DE DATOS

Medidas de tendencia central


Cuando un investigador maneja un volumen relativamente grande de información
se enfrenta a la necesidad de representar, describir y resumir dicha información por
medio de indicadores llamados medidas de posición o de tendencia central.
a.- La media aritmética simple
b.- La media aritmética ponderada
c.- La media geométrica
d.- La media armónica
e.- La mediana
f.- La moda
µ=

Media aritmética simple


Llamada media o promedio, Es la medida más importante y se define y
calcula sumado todos los valores y dividiéndola entre el número de valores.
Media poblacional:
n

X i

µ =N
i 1

Media muestral n

X
=
i
i 1

n
Propiedades de la media aritmética
1.- Todo conjunto de datos de nivel de intervalo o de nivel de razón posee una media.
2.- Todos los valores se encuentran incluidos en el cálculo de la media.
3.- La media es única. Solo existe una media en un conjunto de datos.
4.- Si todos los valores observados X1, X2,………. son iguales a b (donde b es una constante) entonces la media de una constante es la misma constante.
M(x) = M (b) = b
6.- Si cada valor de un conjunto X1, X2,………….,Xn se multiplica por
una constante diferente de cero, la media aritmética del conjunto
transformado Yi = aXi, donde i= 1, 2,……,n es la media aritmética
del conjunto original multiplicado por la constante.

7.- La suma algebraica de las desviaciones de cada valor observado


X1, X2, X3,….Xn con respecto a su media es cero.

8.- Si X1, X2,………,Xn, y ,Y1,Y2,……Yn son dos conjuntos de


observaciones de n valores cada uno, de dos variables X y Y,
expresados en las mismas unidades.
Ventajas y desventajas de la media aritmética

Ventajas Desventajas
- Es conocida y fácil de calcular e - En caso de existir valores
interpretar extremos o atípicos, la media
se ve afectada por estos
- Para su cálculo se utilizan todas las - No es recomendable para
observaciones del conjunto de datos variables con distribuciones
asimétricas
Media aritmética ponderada
La media ponderada de un conjunto de números denotados por
con ponderaciones , se calcula como sigue:

=
Media geométrica (M.G.)
LA MEDIA GEOMÉTRICA de un conjunto de n números positivos se define como: la raíz n-ésima del
producto de n números.
 
Si uno de los números es cero o negativo, no se puede calcular la media geométrica
M.G. ═ g═
Ejemplo
Supongamos que un capital de S/. 50 000 sea colocado a una tasa anual del 24% el primero
de enero del 2018. Si se capitaliza los días primero de enero de cada año, calcule el
promedio del dinero invertido entre el 31 de diciembre del 2018 y 31 de diciembre del 2022
M.G. ═

log M.G. =
AÑOS log
2018 50 000 4,698970
2019 62 000 4,792392

2020 76 880 4,885813


2022 93 331,2 4,979235
  19,356410
log M.G. 4,8391025
 
M.G. antilog 4, 8391025
 
M.G. 69,040.27 (Promedio invertido durante el período)
Desventajas de la media geométrica
1.- Su cálculo es muy engorroso.
2.- Está limitado para valores positivos para que pueda ser
interpretado.
3.- Si algún valor de la variable es cero, la media geométrica será igual
a cero.
4.- Si aparece algún valor negativo, el estadígrafo toma un valor
imaginario.
Media armónica (h ═ )
MEDIA ARMÓNICA (h = ) de términos no nulos es el reciproco de
la media aritmética de los recíprocos de esos términos.
Es decir:
Ejemplo
La media armónica de los números 3, 4, 6, y 8
= 4,57143
 
Ventajas y desventajas
1.- La media armónica se basa en todas las observaciones por lo
que está afectado por los valores extremos. Pero da a los valores
grandes un peso menor que el que da la media geométrica;
mientras que, a los valores pequeños, le da un peso mayor que el
que da la media aritmética y la media geométrica.
2.- La media armónica no está defina, si alguno de los valores es
cero.
La mediana
Valor en la posición central de los valores después de ordenarlos de menor a mayor o de mayor a menor. Hay tantos valores por encima de la mediana como por debajo de ella
en la ordenación de datos.
Ubicación de la mediana =
Si hay cinco datos, entonces la ubicación de la mediana (n+1) /2
será igual a (5+1) /2 igual a 3. Al ordenar los datos de menor a
mayor, se obtiene el valor del tercer elemento, que es 7, la
mediana.

Numero de elemento 1 2 3 4 5
Valor del elemento 2 4 7 8 15

mediana
En el siguiente ejemplo hay seis elementos de manera que (n+1) /2 será
igual a (6+1)/2 igual a 3,5 Después de ordenar los datos de menor a
mayor se encuentra la semi suma de los valores 3 y 4. Luego la mediana
será 31.
Numero de elemento 1 2 3 4 5 6
Valor del elemento 25 29 30 32 35 35

Mediana
Ventajas y desventajas de la mediana
1.- La mediana es única; esto es, a semejanza de la media solo existe una
mediana para un conjunto de datos.
2.- No es difícil determinar la mediana para datos no agrupados. Tan solo se
necesita ordenarlos de menor a mayor o viceversa, y encontrar el valor del
elemento central.
3.- No se ve afectada por valores muy grandes o muy pequeños y por tanto, es
una medida valiosa de tendencia central cuando ocurre este tipo de valores.
4.- Puede calcularse para datos de nivel de razón, de intervalo y ordinal.
La moda
Valor de la observación que aparece con mayor frecuencia.
La moda puede determinarse para todos los niveles de datos:
nominales, ordinales, de intervalo y de razón. La moda también tiene
la ventaja de no verse afectada por valores muy altos o muy bajos.

La distribución que no tiene moda se llama amodal


La distribución que tiene una moda se llama unimodal
La distribución que tiene dos modas se llama bimodal
La distribución que tiene más de dos modas se llama multimodal
Media, mediana y moda para datos agrupados

6,3 - 7,5 6,9 4 0,0625 4 0,0625


7,5 - 8,7 8,1 8 0,1250 12 0,1857
8,7 - 9,9 9,3 12 0,1875 24 0,3750
9,9 - 11,1 10,5 16 0,2500 40 0,6250
11,1 - 12,3 11,7 12 0,1875 52 0,8125
12,3 - 13,5 12,9 8 0,1250 60 0,9375
13,5 - 14,7 14,1 4 0,0625 64 1
La media aritmética se calcula con la siguiente fórmula

Donde
= Media muestral
=Frecuencia absoluta
Marca de clase
n= número total de datos
cj
=

La mediana se calcula de la siguiente manera:


Me +

Donde
= Límite inferior de la clase mediana.
= Intervalo de clase
= Frecuencia absoluta acumulativa de la clase de la mediana
= Frecuencia absoluta acumulativa anterior a la clase mediana
n= Número de observaciones
La moda se calcula con la siguiente fórmula

Mo
Donde
Mo= Moda
= Limite inferior de la clase modal
= Intervalo de clase
= Frecuencia absoluta de la clase modal
= Frecuencia absoluta simple de la clase anterior a la clase modal
=Frecuencia absoluta simple de la clase siguiente a la clase mo
6,3 - 7,5 6,9 4 0,0740 4 0,0740
7,5 - 8,7 8,1 20 0,3703 24 0,4443
8,7 - 9,9 9,3 10 0,1851 34 0,6294
9,9 - 11,1 10,5 8 0,1481 42 0,7775
11,1 - 12,3 11,7 6 0,1111 48 0,8886
12,3 - 13,5 12,9 4 0,0740 52 0,9626
13,5 - 14,7 14,1 2 0,0370 54 0,9996
6,3 - 7,5 6,9 2 0,0357 2 0,0357
7,5 - 8,7 8,1 4 0,0714 6 0,1071
8,7 - 9,9 9,3 6 0,1071 12 0,2142
9,9 - 11,1 10,5 10 0,1785 22 0,3927
11,1 - 12,3 11,7 12 0,2142 34 0,6069
12,3 - 13,5 12,9 20 0,3571 54 0,964
13,5 - 14,7 14,1 2 0,0357 56 0,9997
Relación entre media, mediana y moda en distribuciones simétricas
y asimétricas
Usos de la media aritmética, mediana y moda
a.- La media aritmética se utiliza
Cuando no existen valores extremos que afecten a la media.
Cuando se tengan que calcular otros valores estadísticos como la varianza.
b.- La mediana se utiliza
Cuando se desea conocer el valor de posición central.
Cuando se tienen valores extremos que afecten a la media.
c.- La moda se utiliza
Cuando se desea conocer el valor de la observación más frecuente.
Cuando se analizan variables cualitativas.
Cuando se desea tener una estimación rápida y aproximada de tendencia central.
Percentiles
Son 99 valores que dividen al conjunto de datos ordenados en 100 partes iguales. Cada
parte representa el 1% del total. Se denotan:
primer percentil
segundo percentil
percentil 25
percentil 50
percentil 75
percentil 99
 
Deciles
Los deciles son nueve valores (Dk; K= 1,2,3,…,9) que dividen al conjunto de
datos en diez partes iguales.
Por ejemplo, el decil 5 (D5) divide al conjunto de datos en dos partes; el 50%
de los datos son menores (menores o iguales) que el dedil 5 y el 50% de los
datos son mayores (mayores o iguales) que el decil 5
Cuartiles. 
Dividen a la masa de datos en cuatro grupos iguales. El primer cuartil, deja
el 25% de los datos ordenados a su izquierda, y el otro 75% a su derecha. El
segundo cuartil, , deja el 50% de los datos a su izquierda y el otro 50% a su
derecha, este valor coincide con la mediana, mientras que el tercer cuartil,
deja el 75% de los datos ordenados a su izquierda y el otro 25% a su
derecha.
P10 D1    
P20 D2    
P25   Q1  
P30 D3    
P40 D4    
P50 D5 Q2 Me
P60 D6    
P70 D7    
P75   Q3  
P80 D8    
P90 D9    
Cálculo del i – ésimo percentil para datos no agrupados
Se siguen los siguientes pasos:
1.- Ordenar los datos de forma ascendente.
2.- Calcule un índice k:
P (K) = i

Dónde i es el percentil de interés y n es la cantidad de observaciones


Ejemplo
Los siguientes datos corresponde a los pesos en kg de 10 personas:
53 750 52 77 64 63 50 76 54 80
Calcule el percentil 25
Solución
1.- Se ordenan los datos de menor a mayor, esto es:
50 52 53 54 63 64 75 76 77 80
2.- Cálculo del índice k
Para percentil 25
P(K) = i
P25 = 25 = 2,75
P25 = X (2) + 0,75 (X3 - X2)
P25 = 52 + 0,75 (53 – 52) = 52,75 kg
Interpretación
El 25% de las personas pesan menos de 52,75 kg y el otro 75% pesa más de 52,75%
Cálculo del i –ésimo percentil para datos agrupados
Se siguen los siguientes pasos:
1.- Se calcula , donde i 1, 2,3,………..,99
2.- Se identifica la clase que contiene el por la frecuencia acumulada
3.- Se emplea la fórmula

Donde

= Límite inferior de la clase que contiene a


= Tamaño del intervalo de clase.
= Frecuencia acumulada de la clase anterior a la clase que contiene a
f = Frecuencia simple de la clase que contiene a
n= Número de datos
Ejemplo
La tabla siguiente, determine el percentil 75

30 – 40 1 1
40 – 50 3 4
50 – 60 11 15
60 – 70 21 36
70 – 80 43 79
80 – 90 32 111
90 - 100 9 120
Solución
1.- Se calcula = 90

2.- La clase que contiene al es 80 – 90  

3.- Utilizando la fórmula:

83,47
Ejemplo
Los siguientes datos representan los sueldos mensuales para
una muestra de 12 Ingenieros Agrónomos.
 
2850 2950 3050 2880 2755 2710 2890 3130 2940 3325 2920
2880

Determine el
Solución
Cuartil uno,
1.- Se ordenan los datos en forma ascendente
2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325

2.- Calcular el es igual que calcular el , en ese sentido se calcula el índice K


i 25 = 3,25

P25 = X (3) + 0,25 (X4 – X3)

P25 =2850 + 0,25 (2880 – 2850) = 2857,5


Cuartil tres,
Implica calcular el percentil 75, entonces:
1.- Calcular el índice K
P75 i 75 = 9,75

P75 = X (9) + 0,75 (X10 – X9)

P75 =2950 + 0,75 (3050 – 2950) = 3025


Cálculo de cuartiles para datos agrupados
Ejemplo
Una empresa decide evaluar a sus empleados. La clasificación se lleva a cabo mediante la aplicación de un
test que arroja los siguientes puntajes:

0 - 20 94 94
20 - 40 140 234
40 - 60 160 394
60 - 80 98 492
80 - 100 8 500

Determine:
La puntuación que es excedida por el 75% de los trabajadores .
Solución
a.- En este caso Se debe calcular el primer cuartil

Luego
El lugar del cuartil 1 es la posición = 125. Es decir, que el cuartil está ubicado en la clase
20 – 40. Por lo tanto:

= 24.43

Esto quiere decir que el 75% de los trabajadores tienen una calificación mayor a 24.43

También podría gustarte