Semana 06 AQP
Semana 06 AQP
LOGRO DE LA SESIÓN
Al finalizar la sesión de clase, el estudiante calcula e interpreta las medidas de posición y de forma para un
conjunto de datos.
Las medidas de posición o cuantiles son valores que dividen a un conjunto ordenado de datos en dos partes con
porcentajes específicos por debajo y por encima de éste valor, el orden de los datos que se considerará son de
menor a mayor. Entre los cuantiles más importantes tenemos a los cuartiles(Q), deciles(D) y percentiles(P ),
estos dividen al conjunto de datos en cuatro, diez y cien partes iguales respectivamente.
Las medidas de forma: Asimetría y Curtósis, que estudiaremos luego de las medidas de posición, estudian la
forma o deformación de una distribución tanto en el sentido horizontal como vertical.
Los cuatiles Q k , son medidas de posición que dividen a un conjunto de datos ordenados en cuatro partes
iguales. Estas medidas son: primer cuartil Q 1 , segundo cuartil Q 2 y tercer cuartil Q 3 , como se muestra en la
figura.
Cada uno de estos cuartiles dividen al conjunto de datos en dos partes; por ejemplo el 25 % de los datos son
menores o iguales que el Q 1 , y el 75 % de los datos son mayores o iguales que este valor.
Los deciles D k , son medidas de posición que dividen en 10 partes iguales al conjunto de datos ordenados.
Estas medidas son: primer decil D 1 , segundo decil D 2 y así sucesivamente hasta el noveno decil D 9 , como
se muestra en la figura.
Cada uno de los deciles dividen al conjunto de datos en dos partes, por ejemplo, el 10 % de los datos son menores
o iguales al decil uno D 1 y el 90 % de los datos son mayores o iguales a este valor, el 20 % de los datos son menores
o iguales al decil dos D 2 y el 80 % son mayores o iguales a este valor; así sucesivamente para cada uno de los nueve
deciles.
Definición 5.3 (Percentiles)
Los percentiles P k , son medidas de posición que dividen al conjunto de datos ordenados en 100 partes
iguales. Cada parte de las divisiones representa al 1 % del total de datos. Se pueden calcular 99 percentiles.
El percentil P k es un valor tal que el k % de los datos u observaciones son menores o iguales que este valor, y el
(100 − k) % de los datos son mayores o iguales que este valor.
Ejemplo 5.1
Se define el rango intercuartil o rango intercuartílico (llamado también propagación media) como la dife-
rencia entre el tercer cuartil y el primer cuartil en una serie de datos, es decir:
R I = Q 3 −Q 1
k(n + 1)
i=
100
donde k es el percentil k-ésimo deseado y n el tamaño de la muestra.
III . Cálculo del percentil
Si i es un número entero, entonces el percentil P k es el valor en la posición i .
Si i no es un número entero, entonces se calcula con la siguiente fórmula:
P k = L i + parte decimal × (L d − L i )
Donde:
Parte decimal: Se refiere a la parte decimal de i .
P k : Percentil k-ésimo.
L i : Valor del dato ubicado en la posición i (parte entera).
L d : Valor del dato inmediato superior a L i .
2. Cálculo del Decil (D k ): Para obtener los valores de los deciles, se puede proceder mediante el cálculo
de los percentiles correspondientes, estos son: D 1 = P 10 ; D 2 = P 20 ; · · · ; D 9 = P 90 .
3. Cálculo del Cuartil (Q k ): Para obtener los valores de los cuartiles, se puede proceder mediante el
calculo de los percentiles correspondientes, estos son: Q 1 = P 25 ; Q 2 = P 50 = Me; Q 3 = P 75 .
Las ecuaciones que se muestran a continuación, se emplean siempre y cuando los datos estén agrupados
por intervalos.
nk
" #
100 − F i −1
P k = L i n f +C
fi
Ejemplo 5.2
En el área de contabilidad se registró un reporte de los sueldos mensuales iniciales (en soles) de un grupo
de colaboradores de una empresa de telecomunicaciones, como sigue:
3310 3550 3650 3730 3925 3490 3520 3540 3355 3450 3480 3480
c. Se requiere saber cual es el máximo valor del sueldo mensual para pertenecer al 15 % de los colabo-
radores que menos ganan, pues el jefe del área incrementará el sueldo a los que están percibiendo
menos.
Permite identificar como se distribuyen los datos con respecto al centro de los datos.
Una distribución de datos es simétrica si su curva de frecuencias es simétrica con respecto al centro de los
datos. Para medir la asimetría utilizaremos el índice de Asimetría de Pearson:
3(x − Me)
As =
s
Interpretación
Mide la deformación vertical de una distribución de datos, es decir el grado de elevación o apuntalamiento
de la curva. Para medir la curtosis emplearemos el coeficiente de curtosis de Pearson:
P 75 − P 25
K=
2(P 90 − P 10 )
Interpretación
Ejemplo 5.3
Hoy en día se puede observar que varias personas tienen más de un equipo celular, los estudiantes del curso
de estadística descriptiva y probabilidades interesados en conocer sobre este tema, entrevistaron a cierta
cantidad de estudiantes de la universidad, a quienes se les preguntó ¿cuántos equipos celulares posee?, con
los datos obtenidos se elaboró el siguiente gráfico.
Ejemplo 5.4
EL administrador de Burger King examinó la cantidad de desperdicio de papas fritas durante los últimos
140 días en los locales ubicados en Arequipa y creó la siguiente distribución de frecuencias:
Ejercicios propuestos
1. En una compañía donde se está desarrollando un vehículo autónomo, los desarrolladores de este están
muy preocupados, ya que durante una muestra de 20 meses consecutivos se ha registrado cierta cantidad
de ataques de virus que sufrió su vehículo de prueba, se sospecha que estos ataques provendrían de un
extrabajador de la compañía. Los registros de los ataques en estos meses se muestran a continuación.
5 5 0 5 5 3 2 3 5 6 1 0 0 2 1 1 2 5 2 1
Número de errores 1 2 3 4 5 6 7 8
fi 4 6 5 6 10 9 4 6
El ingeniero encargado considera que la elaboración de estas piezas está debidamente controlado, si la
distribución de la cantidad de errores es leptocúrtica y simétrica, con una media máxima de 5 errores por
día, si no se satisface estas condiciones se debe realizar el mantenimiento a las máquinas. Según los datos
¿Está debidamente controlado la elaboración de estas piezas industriales? Se sabe que al día se elaboran 500
piezas industriales.
3. Al estar interesados en conocer el tiempo, en años, de permanencia de quince empleados de una empresa,
se obtuvieron los siguientes datos:
10 15 16 20 22 24 30 29 24 5 12 21 2 6 13
Se beneficiará con un incremento en su salario al 20 % de los empleados que tienen mayor tiempo de per-
manencia en esta empresa.
4. La distribución de frecuencias dada describe la velocidad de los conductores multados por la policía de la
ciudad en Kansas. Estos conductores viajaban por una zona, que pasa por la universidad y tiene un límite
de velocidad de 30 mi/h.
Velocidad Frecuencia
[42–45[ 25
[45–48[ 14
[48–51[ 7
[51–54[ 3
[54–57[ 1
Total
a. Calcule los percentiles 10, 25, 75 y 90; luego interprete los resultados.
b. Calcule el índice de asimetría de Pearson e interprete.
c. Calcule la Curtosis e interprete el resultado.
Tarea domiciliaria
1. Parte de un estudio de control de calidad tuvo como objetivo mejorar una línea de producción, se midieron
los pesos (en onzas) de 12 barras de jabón. Los resultados se muestran en la siguiente tabla de distribución
de frecuencias.
11.6 15 14.8 14.5 13.06 16 20.1 19.1 16.4 16.5 14.4 18.8
2. La tabla siguiente nos muestra las calificaciones de 10 alumnos, en un examen de cálculo matemático, al
inicio y final del curso.
Alumno 1 2 3 4 5 6 7 8 9 10
Inicio 4 5 1 5 2 3 2 1 1 3
Final 6 8 5 9 3 6 7 6 4 9
a. Determine el coeficiente de asimetría de Pearson para el inicio y final del curso, compare e interprete
los resultados obtenidos.
b. Determine la curtosis para el inicio y final del curso, e interprete los resultados.
3. A continuación se muestra el histograma de los precios en dólares por acción de una muestra de 25 acciones
de la compañía S&P.
4. La tabla que se presenta a continuación representa una distribución de frecuencias de la duración (en se-
gundos) de 40 erupciones del géiser Fly.