Ma460 - 202302 - Cuaderno - de - Trabajo - Semana 04 - Sesión 2

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 16

Estadística Descriptiva 2023 02 96

Medidas de posición
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos
que comprenden el mismo número de valores.

Los cuantiles más importantes son los denominados cuartiles, deciles y percentiles.

Percentiles
 Dividen el conjunto de datos en 100 partes porcentualmente iguales.

El k % de las unidades elementales El (100 – k) % de las unidades elementales


presentan valores en la variable de estudio presentan valores en la variable de estudio
iguales o menores al percentil k , Pk mayores al percentil k , Pk

Pk

Quinto inferior 20% 20% 20% 20% 20% Quinto superior


P20 P40 P60 P80
Estadística Descriptiva 2023 02 97

Cuartiles

 Dividen el conjunto de datos en cuatro partes porcentualmente iguales.


 Se les denota como Q 1, Q 2 y Q 3 respectivamente.
 Su equivalente en percentiles es Q 1=P25 , Q 2=P50=Me , Q 3=P75 .

Cuarto inferior 25% 25% 25% 25% Cuarto superior


Q1=P25 Q2=P50=Me Q3=P75

Deciles

 Dividen el conjunto de datos en 10 partes porcentualmente iguales.


 Se les denota como D 1, D 2, D 3, …, D 9 respectivamente.
 Su equivalente en percentiles es D 1=P10 , D 2=P20 , D 3=P30 ,…, D 9=P 90.

Décimo Décimo
inferior superior
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1=P10 D2 D3 D4 D5 D6 D7 D8 D9=P 90

Ejemplo 24
Si queremos determinar el puntaje mínimo para estar en el quinto superior, debemos calcular el
percentil 80.

El 80% de los estudian- El 20% de los estu-


tes tienen un puntaje diantes tienen un
menor o igual al per- puntaje mayor al
centil 80. percentil 80.
Estadística Descriptiva 2023 02 98

Cálculo de un percentil

1. Primero, ordenamos los datos de manera ascendente.

2. Calculamos la posición i del percentil k .

i= ( n+1
100 )
k=E ,d

donde:
n es el tamaño de muestra
E es la parte entera
0 , d es la parte decimal

3. Luego, calculamos el percentil k .


 Si d=0 , entonces Pk = X [ E ]
 Si d ≠ 0 , entonces Pk = X [ E ] +0 , d ( X [ E +1 ]− X [ E ] )

donde:
X [ E ] es el dato de la posición E
X [ E +1 ] es el dato de la posición E+1

En Excel se usa la función =PERCENTIL.EXC(datos;k) donde k se escribe en forma decimal. Por ejem-
plo, si se quiere calcular el percentil 25, se usa la función =PERCENTIL.EXC(datos;0.25).

Características de los percentiles


Se puede calcular en variables medidas en escala ordinal, de intervalo y razón.
El valor del percentil no se ve afectado por valores extremos.
Estadística Descriptiva 2023 02 99

Ejemplo 25
En la figura se muestran los datos de algunos jugadores de la selección peruana y su edad en agosto
del 2020. Calcule e interprete el percentil 75 de la edad de estos jugadores.

Solución
Primero, ordenamos los datos.

Posición 1 2 3 4 5 6 7 8 9 10 11 12


Edad 21 24 25 25 25 26 26 27 27 28 28 28

Posición 13 14 15 16 17 18 19 20 21 22 23
Edad 28 29 30 30 30 30 30 31 31 35 36

Calculamos la posición i del percentil 75.

i= ( n+1
100 )
k=E ,d

i= ( 23+
100 )
1
75=18 , 0

Como d=0 , entonces P75 =X [ 18 ] =30.

Esto quiere decir que, en agosto del 2020, el 75% de los jugadores de la selección peruana de fútbol
tenía 30 años o menos.
Estadística Descriptiva 2023 02 100

Ejercicios

87. Según los Censos Nacionales del 2017 en el Perú, el percentil 20 de la edad de los peruanos es 11
años. Interprete este valor.

88. Según los Censos Nacionales del 2017 en el Perú, el percentil 49 del número de habitaciones que
tiene una vivienda es 2. Interprete este valor. ¿Podría este percentil ayudar a entender la gran
cantidad de casos de COVID 19 en el Perú?

Tomado del Manual del Empadronador/a Censos Nacional 2017 INEI.

89. Rosa María Augusta Palacios McBride es una abogada y periodista peruana. Actualmente condu-
ce el programa Sin Guion trasmitido por YouTube en el canal RTV-La República, programa sobre
política peruana.
Se desea calcular algunas medidas de posición sobre el número de visualizaciones de sus videos
en febrero y marzo del 2023.

Día de es- Número de vi-


Título
treno sualizaciones
Perú ante Naciones Unidas y el destino de Castillo 1 de marzo 77128
Se acabó el bufé y financiamiento a partidos políticos 28 de febrero 93076
IEP: Encuestas duras y la bronca con México 27 de febrero 77134
Sin separación de poderes y ¿la protesta? 24 de febrero 89916
Crimen-castigo y el Congreso se divierte 23 de febrero 68631
El regreso de Alejandro Toledo y libertad de prensa bajo ataque 22 de febrero 106194
Protestas-Respuesta y no hay transición 21 de febrero 72945
El Congreso no se va y Pedro Castillo acusado 20 de febrero 62483
Graves violaciones a derechos; ¿y las elecciones? 17 de febrero 80730
El Ejecutivo quiere conversar y el asalto final a Sunedu 16 de febrero 76932
Judiciales del poder y sin elecciones 15 de febrero 76955

a. Calcule e interprete el valor del percentil 80.


b. ¿Cuál debe ser el mínimo valor del número de visualizaciones diarias para pertenecer al 25% de
sus videos más vistos?
c. ¿Cuál debe ser el máximo valor del número de visualizaciones diarias para pertenecer al 25% de
sus videos menos vistos?
Estadística Descriptiva 2023 02 101

Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.

Cálculo del rango intercuartil

Rango
P25intercuartil=RIC=Q
RIC = P - P – Q1=P
P 75 – P25
75 25 3 75
25% 50% 25%
Características del rango intercuartil
 Se puede calcular en variables medidas en escala de intervalo o razón.
 No se ve afectado por valores extremos.
Estadística Descriptiva 2023 02 102

Diagrama de cajas
El diagrama de cajas o box plot es una gráfica que describe la distribución de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posición y el valor del rango
intercuartil como medida de referencia de dispersión.

Valor atípico
Es un dato inusualmente grande o pequeño con respecto a los otros datos. Se considera valor atípico
a cualquier punto mayor al límite superior (a la derecha) o menor al límite inferior (o a la izquierda);
es decir, que se encuentre fuera de los límites.

Un valor atípico aparece cuando:


 Hay un elemento extraño en la muestra.

 Hay un error de ingreso en los datos.

Edad de un perro, en años 1 1 3 30 6 8 12

 El registro es correcto, pero es un caso poco común.

Pasos para trazar un diagrama de cajas


1. Dibuje el eje vertical, eje horizontal, título, rótulos de los ejes y fuente. La variable 1 (cuantitati -
va) se representa en el eje vertical y la variable 2 en el eje horizontal.

Distribución de unidades elementales según variable 1 por variable 2


Variable 1 (Cuantitativa)
Unidad de medición

Categoría 1 Categoría 2 Categoría 3

Fuente: Variable 2
Estadística Descriptiva 2023 02 103
2. Trace un rectángulo con los extremos del percentil 25 y percentil 75, en cada categoría. En la caja
trace una recta horizontal en el lugar del percentil 50.

Distribución de unidades elementales según variable 1 por variable 2


Variable 1 (Cuantitativa)
Unidad de medición
P75
P50
P25

Categoría 1 Categoría 2 Categoría 3


Fuente: Variable 2

3. Ubique los límites inferior y superior mediante el rango intercuartil, el límite superior está a
1 ,5 RIC arriba del P75, mientras que, el límite inferior está a 1 ,5 RIC debajo del P25.
o Trace los bigotes desde los extremos de las cajas hasta los valores mínimo y máximo dentro
de los límites inferior y superior.
o Marque con asteriscos (*) las localizaciones de los valores atípicos.

Distribución de unidades elementales según variable 1 por variable 2


Variable 1 (Cuantitativa)
*
Unidad de medición
P75
P50
P25

*
Categoría 1 Categoría 2 Categoría 3
Fuente: Variable 2

En el diagrama de cajas, también se puede poner las categorías en el eje vertical, con lo que
las cajas y los bigotes estarán de forma horizontal.

Diagrama de cajas en Excel


Para construir un diagrama de cajas usando Excel:
 Seleccione las columnas con los datos, incluidos los rótulos.
 Haga clic en la pestaña Insertar y, a continuación, haga clic en (el icono de gráfico
estadístico )

 Seleccione Cajas y bigotes .


Estadística Descriptiva 2023 02 104

Casos en la construcción del diagrama de cajas

En la construcción del diagrama de cajas se pueden presentar dos casos, cuando el valor mínimo o
máximo son valores atípicos.

Caso 1: Cuando el valor mínimo es un valor atípico


Si el valor mínimo es un valor atípico, entonces el bigote debe llegar hasta el dato siguiente al valor
mínimo, considerando a este valor como nuevo valor mínimo.

Por ejemplo, si el límite inferior Li=1 , 7 ; el percentil 25 P25=3 , 5 y los datos son:

1,5 1,8 2,2 3,4 4,2 … … … 5,8 6,7

Entonces:

3,5 Percentil 25 P25


Bigote inferior

Valor mínimo dentro de los límites 1,8


Límite inferior Li = 1,7
Valor atípico 1,5
*

Caso 2: Cuando el valor máximo es un valor atípico


Si el valor máximo es un valor atípico, entonces el bigote debe llegar hasta el dato anterior al valor
máximo, considerando a este valor como nuevo valor máximo.

Por ejemplo, si el límite superior Ls =6 , 2, ; el percentil 75 P75=3 , 8y los datos son:

1,5 1,8 2,2 3,4 4,2 … … … 5,8 6,7

Entonces:

Valor atípico * 6,7


Límite superior Ls = 6,2
Valor máximo dentro de los límites 5,8

Bigote superior
3,8 Percentil 75 P75
Estadística Descriptiva 2023 02 105

Interpretación de un diagrama de cajas

El diagrama de cajas permite:

 Comparar los cuartiles de dos o más conjuntos de datos.


 Comparar el rango de dos o más conjuntos de datos.
 Comparar el rango intercuartil de dos o más conjuntos de datos.
 Observar el tipo de distribución de los datos.
 Observar el tipo de distribución de los datos en el 50% central.
 Identificar la presencia de valores atípicos.
 Identificar los valores mínimos y máximos.

Distribución de elementos según variable cuantitativa por variable cualitativa

Valor atípico
*
P75 *
Variable cuantitativa P50
Máximo
P25
Rango Asimetría

RIC
Asimetría en el 50%
central
Valor atípico
*
Mínimo

Categoría A Categoría B Categoría C


Variable cualitativa
Fuente: ...

Ejemplo 26

Los registros policíacos del distrito A muestran los números de informes de delitos diarios para una
muestra de días durante los meses de invierno y una muestra de días durante los meses de verano.

Invierno 5 5 6 7 7 8 12 14 15 15 17 17 18 18 20 21 21 21 21 22
Verano 5 5 8 8 9 9 10 12 18 20 20 20 24 24 26 27 27 27 28 28

Construya un gráfico que permita comparar, entre invierno y verano, los valores medianos, la variabi-
lidad y encontrar los valores atípicos del número de delitos diarios. Se destinará más efectivos poli -
ciales en la estación (invierno o verano) que presente mayor cantidad de delitos.

Solución
Estadística Descriptiva 2023 02 106
Interpretación
Se debe hacer un gráfico que permita comparar la cantidad de delitos diarios.

Representación
Se hará un diagrama de cajas del número de delitos diarios por estación.

Cálculo
Calculemos los percentiles y los rangos intercuartiles. Se debe calcular los percentiles con datos sim-
ples. No calcule la distribución de frecuencias.

Estadísticos Invierno Verano


Percentil 25 7,25 9,0
Percentil 50 16,0 20,0
Percentil 75 20,75 26,75
Rango intercuartil 20,75 – 7,25 = 13,5 26,75 – 9,0 = 17,75
Largo máximo del bigote = 1,5 RIC 1,5 x 13,5 = 20,25 1,5 x 17,75 = 26,625
Límite inferior = P25 – 1,5 RIC 7,25 – 20,25 = -13 9,0 – 26,625 = -17,625
Límite superior = P75 + 1,5 RIC 20,75 + 20,25 = 41 26,75 + 26,625 = 53,375

En el invierno, los bigotes llegan como mínimo a 5 y como máximo a 22 y en el verano, llegan como
mínimo a 5 y como máximo a 28.

Distribución de delitos según estación del año

Fuente: Comisaría del distrito A

Análisis y argumentación
La mediana es mayor en verano, el RIC es más grande en invierno, no hay valores atípicos, pues
ningún dato está fuera de los límites.

De acuerdo al gráfico se debe destinar más efectivos policiales en verano.


Estadística Descriptiva 2023 02 107

Ejercicios

90. Según la página web https://www.facilito.gob.pe/, el precio del balón de gas de 10 kilos en las
ciudades de Cusco, Lima y Piura tiene el siguiente diagrama de cajas en el día 26 de febrero del
2023. Realice cuatro conclusiones usando el gráfico.

Fuente: Facilito.gob.pe

91. Se quiere comparar los tiempos para realizar una cierta tarea, con y sin capacitación. ¿Se podría
afirmar que la capacitación reduce el tiempo de realizar la tarea?

Tiempo, en minutos, para realizar una tarea, sin o con capacitación


Sin 10 13 20 22 25 26 27 30 34 35 35 40 41 42 43 46 47 54 80 86
Con 5 11 12 13 15 24 24 24 25 26 30 31 31 33 34 35 39 45 80

92. El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en la si-
guiente tabla.

6 7 11 12 13 15 15 15 16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 19 20 20 20 20 20 21 21 21 22
22 22 22 23 23 24 26 26 26 28 29 29 31 41 48 50 60

Calcule el rango y el rango intercuartil de los datos. Rpta: Rango = 54, RIC = 6
Estadística Descriptiva 2023 02 108

93. De datos sacados de la Intranet de la Universidad A, se desea comparar el resultado de la prime -


ra práctica de tres horarios de un curso de estadística, para lo cual, se tienen los siguientes resul-
tados.

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2
H1 19 19 19
0 1 1 2 2 2 2 3 3 3 4 5 5 6 6 7 8 8 0
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
H2 4 17 18
1 1 1 2 2 3 3 4 4 5 5 6 6 5 6 6 7
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
H3 9 9 15 17
0 0 0 1 2 2 2 2 3 3 3 3 4 4 5 5

Construya un diagrama de cajas que permita comparar el resultado de los horarios.


Indique el horario con mayor mediana de notas, el horario con mayor rango intercuartil y el
horario donde existen valores atípicos.

94. Complete el siguiente texto:

“Los datos atípicos se define como …”


“Se trazan los bigotes desde los … de las cajas hasta los valores mínimo y máximo … de los límites
inferior y superior.
Estadística Descriptiva 2023 02 109

Ejercicios

95. Complete el siguiente cuadro con la mejor respuesta posible de acuerdo con la frase menciona-
da.

Frase Se debe calcular o realizar:

“Calcule el valor más frecuente de los datos”

“Determine el grupo que tenga mayor variabilidad


en el 50% de los valores centrales”

“Encuentre el grupo que tenga valores concentra-


dos en los valores más pequeños”

“Determine el grupo que tenga mayor variabilidad


de los datos”

“Haga un gráfico que muestre la distribución por-


centual según la variable 1 por la variable 2”

“Calcule el valor mínimo para estar en el cuarto


superior de los datos”

“Calcule la mejor medida de tendencia central


(media o mediana) cuando hay mucha asimetría”

“Realice un gráfico que permita visualizar los valo-


res atípicos”

“Calcule el valor para el cual los valores están alre-


dedor”

“Calcular el valor que está en el centro de los da-


tos”

“Haga un gráfico que muestre que pocos factores


son vitales y muchos son triviales”

“Calcule el valor máximo para estar en el quinto


inferior de los datos”

“Calcule un estadístico que se pueda calcular en


todas las escalas de medición”

“Haga un gráfico que muestre las frecuencias acu-


muladas”

“Si la medida de variabilidad es igual a 15%, nos


referimos a…”

“Si la variable está en kilos y la medida de variabili-


dad es 100 kilos2, nos referimos a…”
Estadística Descriptiva 2023 02 110

Frase Se debe calcular o realizar:

“Si la variable está en kilos y la medida de variabili-


dad es 10 kilos, nos referimos a…”

“Si quiero realizar un diagrama de Pareto, solo


puedo usar una variable medida en escala…”

“Si la variable es el número de pisos de un edificio,


puedo hacer un gráfico de …”

96. Marque con una equis las medidas de resumen que se pueden calcular con una variable medida
en cada escala de medición.

Medida de resumen Nominal Ordinal Intervalo Razón


Media
Mediana
Moda
Percentil
Varianza
Desviación estándar
Coeficiente de variación
Rango
Rango intercuartil
Coeficiente de asimetría

97. Indique si son verdaderas o falsas las siguientes afirmaciones.

a. La mediana se puede calcular solo en variables cuantitativas.


b. La media es un valor que siempre está entre el mínimo valor y el máximo valor de los datos.
c. La media se puede calcular solo en variables medidas en escala de razón.
d. El percentil 90 es siempre mayor al percentil 10.
e. El cuartil 2 es igual al decil 5.
f. El percentil siempre se expresa en porcentaje.
g. Si todos los pesos son iguales, la media ponderada es igual a la media aritmética.
h. La media ponderada no tiene unidades.
i. El coeficiente de asimetría tiene unidades las mismas unidades que los datos.
j. Si a cada valor de un grupo de datos se le aumenta en 10%, el coeficiente de asimetría no
varía.
k. Si a cada valor de un grupo de datos se le aumenta 10 unidades, el coeficiente de asimetría
no varía.
l. En un diagrama de cajas siempre se puede conocer el máximo y mínimo de un grupo de da-
tos.
m. El coeficiente de variación se puede calcular en escalas de intervalo y de razón.
Estadística Descriptiva 2023 02 111
n. Si las unidades de los datos son minutos, la varianza se expresa en minutos al cuadrado.
o. El rango intercuartil se ve muy afectado por valores muy grandes o muy pequeños.
p. El coeficiente de variación tiene las mismas unidades que la varianza.

Rpta: F, V, F, F, V, F, V, F, F, V, V, V, F, V, F, F