Medidas de Posición
Medidas de Posición
Medidas de Posición
ASIGNATURA: ESTADISTICA I
UNIDAD 3
MEDIDAS DE POSICION
Las medidas de posición no centrales: entre las que destacan especialmente los
percentiles, deciles y cuartiles
PROMEDIO ARITMÉTICO SIMPLE
Se obtiene al dividir la suma de todos los valores de una variable por la cantidad total de datos
(o tamaño de la muestra). En palabras más simples, corresponde a la suma de un conjunto de
datos dividida por el número total de dichos datos.
𝑛
𝑥 1+ 𝑥 2 +⋯ + 𝑥 𝑛 ∑ 𝑥𝑖
𝑆𝑢𝑚𝑎 𝑑𝑒 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒
𝑥=
´ = = 𝑖= 1
𝑇𝑎𝑚𝑎 ñ 𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑛 𝑛
Es única.
En algunas series estadísticas, no todos los valores tienen la misma importancia. Entonces, para
calcular la media se ponderan dichos valores según su peso, con lo que se obtiene una media
aritmética ponderada.
Si se tiene una variable con valores x1, x2, ... , xn, a los que se asigna un peso mediante valores
numéricos p1, p2, ..., pn, la media ponderada se calculará como sigue:
𝑠𝑢𝑚𝑎 𝑑𝑒 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑝𝑜𝑟 𝑠𝑢𝑠 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑐𝑖𝑜𝑛𝑒𝑠
´𝑥 𝑝=
𝑠𝑢𝑚𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑐𝑖𝑜𝑛𝑒𝑠
Ejemplo. Suponga, que un estudiante el pasado semestre lectivo obtuvo las siguientes notas en
los cursos matriculados ¿Cuál es promedio ponderado de notas?
Materia Nota/7 Ponderacion
Materia A B C D E 1º examen 3,2 25%
repasos () 4 3 2 4 4 2º Examen 4,2 25%
Nota final () 8.0 9.0 7.5 7.0 6.5 Asistencia 6,6 15%
Examen final 5,6 35%
Ejemplo: Una empresa de telefónica ha notado que el número de quejas por falta de cobertura
ha aumentado en los últimos 6 meses, pues han sido 123, 141, 237, 249, 300, 350. Con base en
estos datos, calcule e interprete la media geométrica.
218.04
Calcular la tasa de crecimiento mensual de las quejas.
𝑥𝑛
5
´𝑥 𝑔= √ 1.1463 ( 1.6809 ) ( 1.0506 ) ( 1.2048 ) ( 1.1667 )= 1.2326
´𝑥 𝑔=
√
𝑛 −1
𝑥1
LA MODA (
El valor que ocurre con más frecuencia se le conoce como moda. La moda es la medida de
tendencia central especialmente útil para describir mediciones de tipo ordinal, nominal y
variables cuantitativas discretas.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden al número de mensajes
WhatsApp por día en una muestra de 13 personas.
10 15 12 25 15 30 15 15 5
Los mensajes que más se repite es 15, por lo tanto, la Moda es 15 (= 15)
Ejemplo 2:
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de
valores no tiene moda.
50 40 27 65 80 10 28 33
Desventajas de la moda:
Para muchos conjuntos de datos no hay valor modal porque ningún valor aparece más de una vez.
Para algunos conjuntos de datos hay más de una moda (bimodal = que tiene dos modas).
LA MEDIANA(
𝑀𝑒= 𝑋 𝑛+1
Si el número de valores es impar, la Mediana corresponderá
[ ] 2
al valor central de dicho conjunto de datos.
15 23 27 30 32 35 38 40 42 45
32+35 𝑋 +𝑋
𝑴𝒆=
2
=33.5 ( 𝑛2 ) ( 𝑛2 +1)
𝑀𝑒=
2
´𝑥 ≤ 𝑀𝑒 ≤ 𝑀𝑜
´𝑥 =𝑀𝑒= 𝑀𝑜
´𝑥 ≥ 𝑀𝑒 ≥ 𝑀𝑜
LOS CUANTILOS
Un Cuantil se define como una puntuación que deja por bajo una proporción (o porcentaje)
conocida (m) de valores.
Los Cuartiles.
Los Deciles.
Los Percentiles.
PERCENTILES
Percentil m es la puntuación que deja por bajo el m por ciento de las puntuaciones de una
distribución. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los
datos
𝑃𝑚= 𝑋 [ 𝑚
( 𝑛+1 )
]
100
Los datos siguientes corresponden a los tiempos de reacción de una muestra aleatoria de 33
personas, medidas en centésimas de segundo. Calcular e interpretar el percentil 55.
55, 51, 60, 56, 64, 56, 63, 63, 61, 57, 62, 50, 49, 70, 72, 54, 48, 53, 58, 66, 68, 45, 74, 65, 58, 61, 62, 59, 64,
57, 63, 52, 67
Primero paso, ordenamiento de los datos en forma ascendente (de menor a mayor)
45, 48, 49, 50, 51, 52, 53, 54, 55, 56, 56, 57, 57, 58, 58, 59, 60, 61, 61, 62, 62, 63, 63, 63, 64, 64, 65, 66, 67,
68, 70, 72, 74
𝑃55 = 𝑋 55
= 𝑋 18.7=61
[ 100
( 33+1 )
] 61 61
El 0.55 de los tiempos de reacción de las personas son inferiores 61 centésimas de segundo.
DECILES
Un decil es cada uno de los 9 valores que dividen un grupo de datos (clasificados con una
relación de orden) en diez partes iguales, y de manera que cada parte representa un décimo de
la población.
20 31 15 40 14 40 26 30 22 27 22 10 18 35
10 14 15 18 20 22 22 26 27 30 31 35 40 40
𝐷 7= 𝑃 70 = 𝑋 70
= 𝑋 10.5=30.5
30 1
[ 100
( 14 +1 )
]
+0.5(31-30)
= 30+0.5(1)
= 30.5
El 0.70 de las personas tienen una edad inferior a 30.5 años.
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
iguales, son un caso particular de los percentiles.
Por ejemplo, el cuartil 3, nos indica que el valor obtenido representa bajo sí el 75 % de la
distribución de los datos y sobre sí, se encuentra el 25 % de la distribución de datos.
La estatura en centímetros de los integrantes de los 17 jugadores de un equipo de fútbol es:
175, 168, 171, 178, 181, 176, 174, 165, 169, 170, 172, 172, 167, 166, 170, 165, 177.
165, 165, 166, 167, 168, 169, 170, 170, 171, 172, 172, 174, 175, 176, 177, 178, 181
𝑄
1= 𝑃 25 = 𝑋 25
= 𝑋 4.5 =167 =168
[ 100
( 17+1)
]
167+0.5(168-167)
= 167+0.5(1)
= 167.5
El 0.25 de los jugadores del equipo de futbol tienen una estatura inferior a 167.5 centímetros.
MEDIDAS DE VARIABILIDAD
El recorrido (o rango) se suele definir como la diferencia entre los dos valores extremos
que toma la variable. Es la medida de dispersión más sencilla y también, por tanto, la
que proporciona menos información.
𝑅=𝑀𝑎𝑥
( 𝑥 ) − 𝑀𝑖𝑛( 𝑥 )
Ejemplo:
El tiempo requerido para atender a los clientes (en minutos) en las cajas de un supermercado.
4.1 7.0 3.6 5.2 3.2 4.5 2.1 3.3 4.7 5.9 4.6 3.8 1.0 4.6 1.3
=6.0
Entre el cliente que se tardo más tiempo en ser atendido en la caja y aquel que se
atendió más rápido hay 6.0 minutos de diferencia.
LA VARIANCIA
La variancia es una medida dispersión de los valores respecto a un valor central (media),
es decir, es el cuadrado de las desviaciones:
Si la varianza es pequeña, significa que los valores del conjunto están bastante
agrupados. Si la varianza es grande, significa que los números están más dispersos.
Ejemplo:
Durante un partido de baloncesto, se tiene los puntos anotados por 9 jugadores de un
equipo: 0, 2, 4, 5, 8, 10, 10, 15, 38
´𝑥 =10.22 𝑆
2
𝑥 =129.694 ( 𝑝𝑢𝑛𝑡𝑜𝑠 )
2
LA DESVIACIÓN ESTÁNDAR
La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadráticas.
Para evitar ese problema se define otra medida de dispersión, que es la desviación estándar,
que se halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre
la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más
dispersos estarán los datos.
Ejemplo:
Promedios ponderados de notas de una muestra de estudiantes
universitarios según sexo.
DIAGRAMA DE CAJA
Los diagramas de Caja (Boxplots) son una presentación visual que describe varias
características importantes, al mismo tiempo, tales como la dispersión y simetría. Para su
realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre
un rectángulo, alineado horizontal o verticalmente.
Ejemplo: Los siguientes datos representan el dinero del que suelen disponer semanalmente
un muestras de estudiantes de la universidad (en miles de colones): 10, 15, 12, 20, 5, 13, 8,
25, 14, 24, 20, 15, 12, 30, 15.
Min. = 5
Max.= 30
COEFICIENTE DE VARIACIÓN
(Dispersión relativa)
Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las
mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson
que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética
𝑆𝑥
𝐶𝑉 = ∗ 100
´𝑥
Ejemplo: Los siguientes datos representa el dinero del que suelen disponer semanalmente un muestras de
estudiantes de la universidad (en bolivianos) y el promedio ponderado de notas (PP):
Dinero: 10 15 12 20 5 13 8 25 14 24 20 15 12 30 15
PP : 8.0 7.0 9.2 8.4 6.0 7.7 7.0 9.0 8.3 7.9 7.5 7.1 8.5 9.0 8.5
6.770
𝐶𝑉 𝐷𝑖𝑛𝑒𝑟𝑜 = ∗ 100=42.7 %
15,87
𝑃𝑃 = 0.8983 ∗ 100=11.3 %
𝐶𝑉
7.940
PROMEDIO Y VARIANZA PARA DATOS AGRUPADOS
PROMEDIO VARIANZA
ARITMÉTICO
Ejemplo. El tiempo (en minutos) que han tardado los participantes de una carrera en
llegar a la meta, se ha obtenido los siguientes resultados.
´𝑥 =33.4
19.42857 𝑆 𝑥 =4.40778