Ma460 - 202302 - Cuaderno - de - Trabajo - Semana 04 - Sesión 2
Ma460 - 202302 - Cuaderno - de - Trabajo - Semana 04 - Sesión 2
Ma460 - 202302 - Cuaderno - de - Trabajo - Semana 04 - Sesión 2
Medidas de posición
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos
que comprenden el mismo número de valores.
Los cuantiles más importantes son los denominados cuartiles, deciles y percentiles.
Percentiles
Dividen el conjunto de datos en 100 partes porcentualmente iguales.
Pk
Cuartiles
Deciles
Décimo Décimo
inferior superior
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1=P10 D2 D3 D4 D5 D6 D7 D8 D9=P 90
Ejemplo 24
Si queremos determinar el puntaje mínimo para estar en el quinto superior, debemos calcular el
percentil 80.
Cálculo de un percentil
i= ( n+1
100 )
k=E ,d
donde:
n es el tamaño de muestra
E es la parte entera
0 , d es la parte decimal
donde:
X [ E ] es el dato de la posición E
X [ E +1 ] es el dato de la posición E+1
En Excel se usa la función =PERCENTIL.EXC(datos;k) donde k se escribe en forma decimal. Por ejem-
plo, si se quiere calcular el percentil 25, se usa la función =PERCENTIL.EXC(datos;0.25).
Ejemplo 25
En la figura se muestran los datos de algunos jugadores de la selección peruana y su edad en agosto
del 2020. Calcule e interprete el percentil 75 de la edad de estos jugadores.
Solución
Primero, ordenamos los datos.
Posición 13 14 15 16 17 18 19 20 21 22 23
Edad 28 29 30 30 30 30 30 31 31 35 36
i= ( n+1
100 )
k=E ,d
i= ( 23+
100 )
1
75=18 , 0
Esto quiere decir que, en agosto del 2020, el 75% de los jugadores de la selección peruana de fútbol
tenía 30 años o menos.
Estadística Descriptiva 2023 02 100
Ejercicios
87. Según los Censos Nacionales del 2017 en el Perú, el percentil 20 de la edad de los peruanos es 11
años. Interprete este valor.
88. Según los Censos Nacionales del 2017 en el Perú, el percentil 49 del número de habitaciones que
tiene una vivienda es 2. Interprete este valor. ¿Podría este percentil ayudar a entender la gran
cantidad de casos de COVID 19 en el Perú?
89. Rosa María Augusta Palacios McBride es una abogada y periodista peruana. Actualmente condu-
ce el programa Sin Guion trasmitido por YouTube en el canal RTV-La República, programa sobre
política peruana.
Se desea calcular algunas medidas de posición sobre el número de visualizaciones de sus videos
en febrero y marzo del 2023.
Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Rango
P25intercuartil=RIC=Q
RIC = P - P – Q1=P
P 75 – P25
75 25 3 75
25% 50% 25%
Características del rango intercuartil
Se puede calcular en variables medidas en escala de intervalo o razón.
No se ve afectado por valores extremos.
Estadística Descriptiva 2023 02 102
Diagrama de cajas
El diagrama de cajas o box plot es una gráfica que describe la distribución de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango
intercuartil como medida de referencia de dispersión.
Valor atípico
Es un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera valor atípico
a cualquier punto mayor al límite superior (a la derecha) o menor al límite inferior (o a la izquierda);
es decir, que se encuentre fuera de los límites.
Fuente: Variable 2
Estadística Descriptiva 2023 02 103
2. Trace un rectángulo con los extremos del percentil 25 y percentil 75, en cada categoría. En la caja
trace una recta horizontal en el lugar del percentil 50.
3. Ubique los límites inferior y superior mediante el rango intercuartil, el límite superior está a
1 ,5 RIC arriba del P75, mientras que, el límite inferior está a 1 ,5 RIC debajo del P25.
o Trace los bigotes desde los extremos de las cajas hasta los valores mínimo y máximo dentro
de los límites inferior y superior.
o Marque con asteriscos (*) las localizaciones de los valores atípicos.
*
Categoría 1 Categoría 2 Categoría 3
Fuente: Variable 2
En el diagrama de cajas, también se puede poner las categorías en el eje vertical, con lo que
las cajas y los bigotes estarán de forma horizontal.
En la construcción del diagrama de cajas se pueden presentar dos casos, cuando el valor mínimo o
máximo son valores atípicos.
Por ejemplo, si el límite inferior Li=1 , 7 ; el percentil 25 P25=3 , 5 y los datos son:
Entonces:
Entonces:
Bigote superior
3,8 Percentil 75 P75
Estadística Descriptiva 2023 02 105
Valor atípico
*
P75 *
Variable cuantitativa P50
Máximo
P25
Rango Asimetría
RIC
Asimetría en el 50%
central
Valor atípico
*
Mínimo
Ejemplo 26
Los registros policíacos del distrito A muestran los números de informes de delitos diarios para una
muestra de días durante los meses de invierno y una muestra de días durante los meses de verano.
Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28
Construya un gráfico que permita comparar, entre invierno y verano, los valores medianos, la variabi-
lidad y encontrar los valores atípicos del número de delitos diarios. Se destinará más efectivos poli -
ciales en la estación (invierno o verano) que presente mayor cantidad de delitos.
Solución
Estadística Descriptiva 2023 02 106
Interpretación
Se debe hacer un gráfico que permita comparar la cantidad de delitos diarios.
Representación
Se hará un diagrama de cajas del número de delitos diarios por estación.
Cálculo
Calculemos los percentiles y los rangos intercuartiles. Se debe calcular los percentiles con datos sim-
ples. No calcule la distribución de frecuencias.
En el invierno, los bigotes llegan como mínimo a 5 y como máximo a 22 y en el verano, llegan como
mínimo a 5 y como máximo a 28.
Análisis y argumentación
La mediana es mayor en verano, el RIC es más grande en invierno, no hay valores atípicos, pues
ningún dato está fuera de los límites.
Ejercicios
90. Según la página web https://www.facilito.gob.pe/, el precio del balón de gas de 10 kilos en las
ciudades de Cusco, Lima y Piura tiene el siguiente diagrama de cajas en el día 26 de febrero del
2023. Realice cuatro conclusiones usando el gráfico.
Fuente: Facilito.gob.pe
91. Se quiere comparar los tiempos para realizar una cierta tarea, con y sin capacitación. ¿Se podría
afirmar que la capacitación reduce el tiempo de realizar la tarea?
92. El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en la si-
guiente tabla.
6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60
Calcule el rango y el rango intercuartil de los datos. Rpta: Rango = 54, RIC = 6
Estadística Descriptiva 2023 02 108
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2
H1 19 19 19
0 1 1 2 2 2 2 3 3 3 4 5 5 6 6 7 8 8 0
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
H2 4 17 18
1 1 1 2 2 3 3 4 4 5 5 6 6 5 6 6 7
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
H3 9 9 15 17
0 0 0 1 2 2 2 2 3 3 3 3 4 4 5 5
Ejercicios
95. Complete el siguiente cuadro con la mejor respuesta posible de acuerdo con la frase menciona-
da.
96. Marque con una equis las medidas de resumen que se pueden calcular con una variable medida
en cada escala de medición.
Rpta: F, V, F, F, V, F, V, F, F, V, V, V, F, V, F, F