Semana 3 Parte 1 Estadísitica y Probabilidad AR y BR

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

UNIVERSIDAD DE PAMPLONA

DEPARTAMENTO DE MATEMÁTICAS
Asignatura: Estadística y Probabilidad
Tema Medidas de Dispersión, Medidas de Ubicación
Docente: Carolina Vargas Contreras
Fecha: Semana 3 Parte 1 Primer Corte Grupos: AR, BR

MEDIDAS DE DISPERSIÓN
Parámetros estadísticos que indican cómo se alejan los datos respecto de la media aritmética. Sirven
como indicador de la variabilidad de los datos; ya que una excesiva variabilidad o dispersión en los datos
indica la inestabilidad del proceso en análisis en la mayoría de los casos.

Las medidas de dispersión más utilizadas son el rango, la desviación estándar, la varianza y el coeficiente
de variación

➢ Rango o recorrido: Es la diferencia entre el valor más grande y el más pequeño del conjunto de
datos.

𝑅𝑎𝑛𝑔𝑜 = 𝑑𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟

Ejemplo: Se han tomado como muestras las mediciones de la resistencia a la tensión de la soldadura
usada para unir dos cables, estas son: 87.3kg, 82.4, 78.5 , 78.0, 90.0, 86.5, 77.9, 93.4, 73.9, determine
su rango o recorrido.

Solución
𝑅𝑎𝑛𝑔𝑜 = 93,4 − 73,9 = 19,5 𝐾𝑔

➢ Varianza de una población: La varianza de una población de 𝑁 mediciones es el promedio de


los cuadrados de las desviaciones de las mediciones alrededor de su media 𝜇(𝑚𝑢). La varianza
poblacional se denota con 𝜎 2 (𝜎 = 𝑠𝑖𝑔𝑚𝑎) y está dada por la fórmula
∑( ) 2
𝑋𝑖 − 𝜇
𝜎2 =
𝑁
➢ Varianza de una muestra: La varianza de una muestra de 𝑛 mediciones es la suma de las
desviaciones cuadradas de las mediciones alrededor la media 𝑋̅ dividida entre (𝑛 − 1). La
varianza muestral se denota con 𝑆 2 y está dada por la fórmula;

2
∑(𝑋𝑖 − 𝑋̅)2
𝑆 =
𝑛−1
➢ Desviación Estándar: La desviación estándar mide el grado de dispersión de los datos con
respecto a la media, se denota como 𝑆 para una muestra o como 𝝈 para la población. Se define
como la raiz cuadrada de la varianza según la expresión:

∑(𝑋𝑖 −𝜇 )2
- Desviación estándar de la población 𝜎=√
𝑁

∑(𝑋𝑖 −𝑋̅)2
- Desviación estándar de la muestra 𝑆=√ 𝑛−1
Ejemplo 1: Dos compañías, A y B; venden bolsas de café instantáneo de 12 onzas. Se seleccionaron
aleatoriamente 5 sobres de cada compañía disponibles en el mercado, y se pesó cuidadosamente su
contenido, con los siguientes resultados.

A: 12,02 12,08 11,99 11,96 11,98

B: 12,40 12,21 12,36 12,22 12,27

Determine:

1.. ¿Cuál compañía ofrece más café en sus sobres?


2.. ¿Cuál compañía llena sus sobres más consistentemente?

Solución: primero se determina la media en cada caso, luego se aplica la fórmula de la desviación estándar
para la muestra.
Compañía A Compañía B

12,02 + 12,08 + 11,99 + 11,96 + 11,98 12,40 + 12,21 + 12,36 + 12,22 + 12,27
𝑋̅𝐴 = 𝑋̅𝐵 =
5 5
60,03 61,46
𝑋̅𝐴 = 𝑋̅𝐵 =
5 5

𝑋̅𝐴 = 12,006 𝑋̅𝐵 = 12,292

Desviación Típica

0,00872 0,02868
𝑆𝐴 = √ = 0,0467 𝑆𝐵 = √ = 0,0847
5−1 5−1

1. . 𝐶𝑜𝑚𝑜 𝑋̅𝐵 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑞𝑢𝑒 𝑋̅𝐴 𝑠𝑒 𝑖𝑛𝑓𝑖𝑒𝑟𝑒 𝑞𝑢𝑒 𝑙𝑎 𝑐𝑜𝑚𝑝𝑎ñí𝑎 𝐵 𝑚𝑢𝑦 𝑝𝑟𝑜𝑏𝑎𝑏𝑙𝑒𝑚𝑒𝑛𝑡𝑒

𝑜𝑓𝑟𝑒𝑐𝑒 𝑚á𝑠 𝑐𝑎𝑓é 𝑝𝑜𝑟 𝑠𝑜𝑏𝑟𝑒

2. . 𝐶𝑜𝑚𝑜 𝑆𝐴 𝑒𝑠 𝑚𝑒𝑛𝑜𝑟 𝑞𝑢𝑒 𝑆𝐵 𝑠𝑒 𝑖𝑛𝑓𝑖𝑒𝑟𝑒 𝑞𝑢𝑒 𝑙𝑎 𝑐𝑜𝑚𝑝𝑎ñí𝑎 𝐴 𝑝𝑎𝑟𝑒𝑐𝑒 𝑚á𝑠 𝑐𝑜𝑛𝑠𝑖𝑠𝑡𝑒𝑛𝑡𝑒

(𝑚𝑒𝑛𝑜𝑟 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟)


Ejemplo 2: EJEMPLO: La siguiente tabla indica el peso en kilogramos de cuarenta niños entre los 2 y
4 años de edad. halle la media aritmética, la varianza y la desviación típica.

Solución: para calcular los datos solicitados completamos la tabla como se explicó en frecuencias de
datos agrupados, hay que añadirle dos columnas más, pero primero se debe calcular la media aritmética.

∑ 𝑓𝑋 585,5
Recuerda: 𝑋̅ = 𝑛 = 40 = 14,64 𝑘𝑔 El peso promedio de los niños entre 2 y 4 años es de 14,64 𝑘𝑔

Ojo explicación en Excel


Varianza Desviación típica

∑ 𝑓∗(𝑋 −𝑋̅ )2
𝑆2 = ∑ 𝑓 ∗ (𝑋 − 𝑋̅)2
𝑛−1 𝑆=√
𝑛−1
17,944 17,944
𝑆2 = 𝑆 = √ 40−1
40 − 1

𝑆 2 = 0,46 𝑆 = 0,68

➢ Coeficiente de variación: El coeficiente de variación o coeficiente de variación


de Spearman es una medida aplicada en la ciencia de las estadísticas, que relaciona la
desviación estándar y la media aritmética de un conjunto de datos definiendo la dispersión
relativa de la muestra en estudio.

𝑆
𝐶𝑣 = ̅ ∗ 100
𝑋

Ejemplo 3: Una empresa fabrica bombillas eléctricas en dos tipos A y B. Con base en muestras
de producción se sabe que las distribuciones de la duración en horas de esas bombillas son:

Tipo Media Varianza

A 800 horas 7800

B 650 horas 5400

¿Halle el coeficiente de variación, qué tipo de bombilla es mejor?

A B

̅̅̅
𝑋𝐴 = 800 ̅̅̅̅
𝑋𝐵 = 650

𝐶𝑜𝑚𝑜 𝑡𝑒𝑛𝑒𝑚𝑜𝑠 𝑒𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎, 𝐶𝑜𝑚𝑜 𝑡𝑒𝑛𝑒𝑚𝑜𝑠 𝑒𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎,


𝑑𝑒𝑏𝑒𝑚𝑜𝑠 ℎ𝑎𝑙𝑙𝑎𝑟 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑐𝑎 𝑑𝑒𝑏𝑒𝑚𝑜𝑠 ℎ𝑎𝑙𝑙𝑎𝑟 𝑙𝑎 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑐𝑎

𝑆𝐴 = √7800 𝑆𝐵 = √5400

𝑆𝐴 = 88,32 𝑆𝐵 = 73,48

88,32 73,48
𝐶𝑣𝐴 = ∗ 100 𝐶𝑣𝐵 = ∗ 100
800 650

𝐶𝑣𝐴 = 11,04% 𝐶𝑣𝐵 = 11,30%

La mejor bombilla es la del tipo A, porque tiene menor coeficiente de variación


Ejercicio :

El contenido de nicotina, en miligramos en 40 cigarrillos de cierta marca se registraron como sigue:

1,09 1,92 2,31 1,79 2,28 1,74 1,47 1,97 0,85 1,24
1,58 2,03 1,7 2,17 2,52 2,11 1,86 1,9 1,68 1,51
1,64 0,72 1,69 1,85 1,82 1,79 2,46 1,88 2,08 1,67
1,31 1,93 1,4 1,64 2,09 1,75 1,62 2,37 1,75 1,69

a). Determine: muestra, variable, tipo de variable


b). Construya una tabla de distribución de frecuencias para datos agrupados.
c). Calcule las medidas de tendencia central y concluya.
d). Halle la desviación típica y la varianza

“Si puedes soñarlo puedes hacerlo,


recuerda que todo esto comenzó con un
ratón.”
Walt Disney

MEDIDAS DE POSICIÓN o UBICACIÓN


Se llaman parámetros de ubicación o posición aquellos que dividen a los datos obtenidos
en partes proporcionales, de forma que cada parte tenga el mismo número de elementos. Para
poder hacerlo necesitamos que los datos estén ordenados de menor a mayor. Los hay de tres
tipos: cuartiles, deciles y percentiles.

Cuartiles
Se definen los cuartiles como los valores que dividen a la distribución de valores ordenados en
cuatro partes iguales. Son los siguientes:

𝑄1: primer cuartil. Tiene el 25% de los datos detrás de él y el 75% delante.
𝑄2 segundo cuartil. Coincide con la mediana 𝑀𝑑. Tiene el 50% de los datos delante y el
otro 50% detrás de él.
𝑄3 : deja detrás de él el 75% de la distribución y delante el 25%.

Se define el recorrido intercuartílico a la diferencia entre el tercer y el primer cuartil. Dentro de


este intervalo se encuentra el 50% de la distribución. Un estudio conjunto del recorrido y del
recorrido intercuartílico nos da información sobre la dispersión de la muestra. Si el recorrido
general es grande pero el intercuartílico pequeño, eso indica que hay valores extremos. Si ambos
son grandes, los datos son dispersos. Si ambos son pequeños, los datos están muy agrupados
respecto a los valores centrales.

Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

Los deciles dan los valores correspondientes al 10%, 𝑎𝑙 20% … 𝑦 𝑎𝑙 90% de los datos.

El quinto decil coincide con la mediana: 𝐷5 = 𝑀𝑑 . Pero también, coincide con el segundo cuartil:
𝑄2 = 𝑀𝑑 .

Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

Los percentiles dan los valores correspondientes al 1%, al 2%… y al 99% de los datos

El percentil cincuenta coincide con la mediana:


𝑃50 = 𝑀𝑑 .

También, coincide 𝑄2 = 𝐷5 = 𝑃50 = 𝑀𝑑 .

Medidas de ubicación en datos no agrupados

Para hallar las medidas de ubicación en datos no agrupados primero ordeno los datos de
menor a mayor y luego aplico la siguiente fórmula:
𝑛∗𝑘
1. Cuando n es par 𝑞
(𝑛+1)∗𝑘
2. Cuando n es impar 𝑞

𝒏 → 𝑒𝑠 𝑒𝑙 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠


𝒌 → 𝑠𝑢𝑏í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑑𝑎 𝑑𝑒 𝑢𝑏𝑖𝑐𝑎𝑐𝑖ó𝑛
𝒒 → 𝑣𝑎𝑙𝑜𝑟 𝑠𝑒𝑔ú𝑛 𝑙𝑎 𝑚𝑒𝑑𝑖𝑑𝑎 𝑑𝑒 𝑢𝑏𝑖𝑐𝑎𝑐𝑖ó𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡é ℎ𝑎𝑙𝑙𝑎𝑛𝑑𝑜

Fórmula 1 Fórmula 2

𝒏 𝒆𝒔 𝒑𝒂𝒓 𝒏 𝒆𝒔 𝒊𝒎𝒑𝒂𝒓
𝑛∗𝑘 (𝑛+1)∗𝑘
Si halla el cuartil 𝑄: Si halla el cuartil 𝑄:
4 4

𝑛∗𝑘 (𝑛+1)∗𝑘
Si halla el decil 𝐷: 10
Si halla el decil 𝐷: 10

𝑛∗𝑘 (𝑛+1)∗𝑘
Si halla el percentil 𝑃: Si halla el percentil 𝑃:
100 100
Si el resultado da un número decimal lo aproxima a un entero y ese resultado indica la posición
de la medida de ubicación; en ocasiones hay que interpolar.

Datos no agrupados
Ejemplo No 1

Los siguientes datos expresan los puntajes obtenidos en una prueba de admisión:

16 10 4 8 12 10 8 20 4 13 12 22 16 26 20

𝑎) 𝑃𝑟𝑖𝑚𝑒𝑟 𝑐𝑢𝑎𝑟𝑡𝑖𝑙 𝑦 𝑡𝑒𝑟𝑐𝑒𝑟 𝑐𝑢𝑎𝑟𝑡𝑖𝑙


Halle 𝑏) 𝐶𝑢𝑎𝑟𝑡𝑜 𝑑𝑒𝑐𝑖𝑙 𝑦 𝑠𝑒𝑥𝑡𝑜 𝑑𝑒𝑐𝑖𝑙
𝑐) 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑡𝑟𝑒𝑖𝑛𝑡𝑎 𝑦 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑛𝑜𝑣𝑒𝑛𝑡𝑎

Solución: ordeno los datos de menor a mayor y luego aplico la fórmula.

4 4 8 8 10 10 12 12 13 16 16 20 20 22 26

a)
• Primer cuartil 𝑛 = 15; como n es impar aplico la fórmula 2.
𝑄1
(𝑛+1)∗𝑘 (15+1)∗1
= = 4 el 4 indica la posición donde se encuentra el primer cuartil, 𝑄1 = 8
𝑞 4

Concluir: El 25% de los estudiantes obtuvieron hasta 8 puntos en la prueba de admisión.

• Tercer cuartil
𝑄3
(𝑛+1)∗𝑘 (15+1)∗3
= = 12 el 12 indica la posición donde se encuentra el tercer cuartil, 𝑄3 = 20
𝑞 4

Concluir: El 75% de los estudiantes obtuvieron hasta 20 puntos en la prueba de admisión.


b)
• Cuarto decil
𝐷4
(𝑛+1)∗𝑘 (15+1)∗4
= = 6,4 La posición 6,4 debe estar entre la sexta y la séptima posición, siendo
𝑞 10
el valor de 10 la sexta posición y la diferencia entre la séptima y sexta es 12 − 10 = 2 este
resultado se multiplica por la fracción 0.4 y se lo agregamos al valor anterior de 10. (Interpolar)

𝐷4 = 10 + (12 − 10) ∗ (0,4) = 10,8

𝐷4 = 10,8

Concluir: El 40 % de los estudiantes obtuvieron hasta 10,8 puntos en la prueba de admisión.

• Sexto decil
𝐷6
(𝑛+1)∗𝑘 (15+1)∗6
= = 9,6 La posición 9,6 debe estar entre la novena y la décima posición, siendo
𝑞 10
el valor de 13 la novena posición y la diferencia entre la décima y novena es 16 − 13 = 3 este
resultado se multiplica por la fracción 0.6 y se lo agregamos al valor anterior de 13. (Interpolar)

𝐷6 = 13 + (16 − 13) ∗ (0,6) = 14,8

𝐷6 = 14,8

Concluir: El 60% de los estudiantes obtuvieron hasta 14,8 puntos en la prueba de admisión.
• Percentil 30

𝑃30
(𝑛+1)∗𝑘 (15+1)∗30
𝑞
= 100
= 4,8 La posición 4,8 debe estar entre la cuarta y la quinta posición, siendo
el valor de 8 la cuarta posición y la diferencia entre la quinta y cuarta es 10 − 8 = 2 este
resultado se multiplica por la fracción 0.8 y se lo agregamos al valor anterior de 8. (Interpolar)

𝑃30 = 8 + (10 − 8) ∗ (0,8) = 9,6

La conclusión la hacen los estudiantes

• Percentil 90
𝑃90
(𝑛+1)∗𝑘 (15+1)∗90
= = 14,4
𝑞 100

𝑃90 = 22+(26 − 22) ∗ (0,4) = 23,6

Los estudiantes concluyen


Datos agrupados
𝑛∗𝑘
Para hallar las medidas de ubicación en datos agrupados primero hallo y ese resultado lo
𝑞
busco en 𝑓𝑎, luego encierro el intervalo en el cual voy a trabajar, por último aplico la siguiente
fórmula:

𝑛∗𝑘
− ∑ 𝑓𝑎
𝑞
𝑈 = 𝐿𝑖 + ( )∗𝐴
𝑓𝑛∗𝑘
𝑞

𝐿𝑖 = 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟

𝑛∗𝑘
𝑖𝑛𝑑𝑖𝑐𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑑𝑎 𝑑𝑒 𝑢𝑏𝑖𝑐𝑎𝑐𝑖ó𝑛 𝑎 𝑢𝑡𝑖𝑙𝑖𝑧𝑎𝑟
𝑞

∑ 𝑓𝑎 𝑙𝑎 𝑠𝑢𝑚𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎𝑠 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟𝑒𝑠

𝑓𝑛∗𝑘 𝑒𝑠 𝑓 (𝑜𝑗𝑜 𝑒𝑛 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑞𝑢𝑒 𝑒𝑛𝑐𝑒𝑟𝑟𝑎𝑚𝑜𝑠)


𝑞

𝐴 𝑒𝑠 𝑙𝑎 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑

Ejemplo No 2 : Los siguientes datos indican el peso en kilogramos de cuarenta niños entre los
2 y 4 años de edad.

13,9 14,7 13,7 15,6 14,3 14,9 15 16,1 15 14,2 14,4 15,8 13,3 14 14 15,8 13,9 14,7 13,3 14,5
15,1 14,5 15,3 13,9 14,3 15 16 14,7 14 14,8 16,1 14,3 15,3 15 14 15,4 14,7 14,2 14,5 14,8

I. Construye una distribución de frecuencias 𝑓 𝑦 𝑓𝑎 para datos agrupados.


𝑎) 𝑄1 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
II. Halla 𝑏) 𝐷5 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
𝑐) 𝑃92 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎

I.
II.
𝑎) 𝑄1 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎

𝑛 ∗ 𝑘 40 ∗ 1
= = 10 𝑒𝑠𝑡𝑒 𝑣𝑎𝑙𝑜𝑟 𝑙𝑜 𝑏𝑢𝑠𝑐𝑜 𝑒𝑛 𝑓𝑎 𝑦 𝑒𝑛𝑐𝑖𝑒𝑟𝑟𝑜 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑞 4

𝑛∗𝑘

𝑞 − 𝑓𝑎
𝑈 = 𝐿𝑖 + ( )∗𝐴
𝑓𝑛∗𝑘
𝑞

10 − 3
𝑄1 = 13,81 + ( ) ∗ (0,5)
11

𝑄1 = 14,13 kg

Conclusión: El 25% de los niños entre dos y cuatro años tienen un peso de hasta 14,13 𝑘𝑔

𝑏) 𝐷5 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎

𝑛 ∗ 𝑘 40 ∗ 5
= = 20 𝑒𝑠𝑡𝑒 𝑣𝑎𝑙𝑜𝑟 𝑙𝑜 𝑏𝑢𝑠𝑐𝑜 𝑒𝑛 𝑓𝑎 𝑦 𝑒𝑛𝑐𝑖𝑒𝑟𝑟𝑜 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑞 10

20 − 14
𝐷5 = 14,31 + ( ) ∗ (0,5)
12

𝐷5 = 14,56 kg

Conclusión: El 50% de los niños entre dos y cuatro años tienen un peso de hasta 14,56 𝑘𝑔
𝑐) 𝑃92 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎

𝑛 ∗ 𝑘 40 ∗ 92
= = 36,8 𝑒𝑠𝑡𝑒 𝑣𝑎𝑙𝑜𝑟 𝑙𝑜 𝑏𝑢𝑠𝑐𝑜 𝑒𝑛 𝑓𝑎 𝑦 𝑒𝑛𝑐𝑖𝑒𝑟𝑟𝑜 𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
𝑞 100

36,8 − 33
𝑃92 = 15,31 + ( ) ∗ (0,5)
4
𝑃92 = 15,79 kg

Conclusión: El 92% de los niños entre dos y cuatro años tienen un peso de hasta 15,79 𝑘𝑔

Diagrama de Caja y Bigotes

Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentación visual que
describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría.

Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos,
sobre un rectángulo, alineado horizontal o verticalmente.

Construcción:

Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran
el recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica
donde se posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero
(recordemos que el segundo cuartil coincide con la mediana).

Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y
máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes
tienen un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro
de este rango es marcado e identificado individualmente
EJEMPLO: DISTRIBUCIÓN DE EDADES

Los datos representan la edad de un colectivo de 20 personas con diferentes trastornos


psicológicos

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

ORDENAR LOS DATOS Para calcular los parámetros estadístico, lo primero es ordenar la
distribución

20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

CALCULO DE CUARTILES

𝑄1
𝑛∗𝑘 20∗1
= = 5; el 5 indica la posición donde se encuentra el primer cuartil, 𝑄1 = 24
4 4

𝑄2 el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable


que ocupa el lugar central en un conjunto de datos ordenados.

𝑛 20 𝑛∗𝑘 20∗2
Como = = 10 ; = = 10
2 2 4 4

𝑛+1 20+1 10
Mediana = = 10,5
2 2 11

(33 + 34)
𝑀𝑑 = 𝑄2 = = 33,5
2
𝑄3 ,
𝑛∗𝑘 20∗3 60
= = = 15; el 15 indica la posición donde se encuentra el tercer cuartil, 𝑄3 = 39
4 4 4

Dibujar el Diagrama de Cajas

Dato menor 20

Primer Cuartil 24

Segundo Cuartil=Mediana 33,5

Tercer cuartil 39

Dato mayor 45

El bigote de la izquierda representa al colectivo de edades ( Xmín, 𝑄1)


La primera parte de la caja a (𝑄1, 𝑄2 ),
La segunda parte de la caja a (𝑄2 , 𝑄3 )
El bigote de la derecha viene dado por (𝑄3 , Xmáx).

INFORMACIÓN DEL DIAGRAMA

Podemos obtener abundante información de una distribución a partir de estas


representaciones. Veamos alguna:

La parte izquierda de la caja es mayor que la de la


derecha; ello quiere decir que las edades
comprendidas entre el 25% y el 50% de la
población están más dispersas que entre el 50% y
el 75%.

El bigote de la izquierda ( Xmín, 𝑄1)es más corto que el de la derecha; por ello el 25% de los más
jóvenes están más concentrados que el 25% de los mayores.

Les deseo mucha felicidad


ACTIVIDAD

1. Los siguientes datos expresan los pesos en kg de niños entre los 4 y 6 años con
problemas de sobrepeso.

33,5 57,1 49,7 40,2 44,2 45,2 47,8 38,0 53,9 41,1 41,7 40,8 41,7 55,5 43,5 49,9

𝑎) 𝑄2 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
Halla 𝑏) 𝐷6 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
𝑐) 𝑃89 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
d)) Representa los datos en un diagrama de caja

2. El contenido de nicotina, en miligramos en 40 cigarrillos de cierta marca se registraron como


sigue:

𝑎) 𝑄3 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
Halla 𝑏) 𝐷2 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎
𝑐) 𝑃3 𝑦 𝑐𝑜𝑛𝑐𝑙𝑢𝑦𝑎

También podría gustarte