Unidad: Datos Y Azar Estadística Ii: Matemáticas - Programa Tercero Material: MT-20

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

Matemáticas – Programa Tercero

Material : MT-20

UNIDAD: DATOS Y AZAR


ESTADÍSTICA II

MEDIDAS DE POSICIÓN
Las medidas de posición dividen la distribución en partes iguales y sirven para clasificar a un
individuo o elemento dentro de una determinada población o muestra. Así en la PSU los
resultados de prueba que realiza un determinado individuo, sirve para clasificar a dicho
sujeto en una determinada categoría en función de la puntuación obtenida. En economía se
utiliza principalmente para definir sectores socioeconómicos según ingreso per cápita
familiar (por ejemplo quintiles).

Para determinar las medidas de posición es necesario que los datos se encuentren
ordenados en forma creciente.

Las medidas de posición, más utilizadas son: Cuartiles, Quintiles, Deciles y percentiles.

Así como la mediana divide la distribución en dos partes iguales, existen tres cuartiles,
cuatro quintiles, nueve deciles y noventa y nueve percentiles que dividen en cuatro, cinco,
diez y cien partes iguales a la distribución.

CUARTILES
Los cuartiles son 3, los que dividen los datos ordenados en 4 partes.
Los cuartiles son datos bajos los cuales se acumula el 25%, 50% y el 75% de los datos
estudiados, se representan como Q1, Q2 y Q3 respectivamente.

OBSERVACIÓN: Q2 coincide con la mediana.

QUINTILES
Los quintiles son 4, los que dividen los datos ordenados en 5 partes.
Los quintiles son datos bajos los cuales se acumula el 20%, 40%, 60% y el 80% de los
datos estudiados.

DECILES
Los deciles son 9, los que dividen los datos ordenados en 10 partes.
Los deciles son datos bajos los cuales se acumula el 10%, 20%, … y el 90% de los datos
estudiados

PERCENTILES
Los percentiles son 99, los que dividen los datos ordenados en 100 partes.
Los percentiles son datos bajos los cuales se acumula el 1%, 2%, 3%, 4%… y el 99% de los
datos estudiados.
Para determinar el LUGAR en el que se ubica la medida de posición buscada, existe una
relación que depende de la medida de posición que se desee calcular.

Medida de Cuartil Quintil Decil Percentil


Posición
Posición N+1 N+1 N+1 N+1
PQ = K  PK =K PD =K PP = K 
(lugar) K 4 K 5 K 10 K 100

PQ , indica la posición del cuartil K, siendo K = 1, 2, 3


K

PK , indica la posición del quintil K, siendo K = 1, 2, 3, 4


K

PD , indica la posición del decil K, siendo K = 1, 2, 3, 4, 5, 6, 7, 8, 9


K

PK , indica la posición del percentil K, siendo K = 1, 2, 3, 4,…………..,99


K

Para determinar una medida de posición para datos no agrupados, se procede de la


siguiente manera:

- Ordenar los datos en forma creciente


- Determinar el lugar que ocupa la medida de posición buscada.
- Respecto a la posición tenemos dos posibilidades de resultados:
Número entero: el valor será el dato que ocupa ese lugar.
Número decimal: el valor será el promedio entre los datos que se encuentra a la
izquierda de la posición con el dato que se encuentra a la derecha.

DATOS TABULADOS
Si los datos se encuentran tabulados en una tabla de frecuencia, se debe proceder de
manera similar a la utilizada para encontrar la mediana, se busca en la columna de
frecuencia acumulada el lugar que corresponde a la media de posición buscada y de esta
manera se determina el dato correspondiente.

OBSERVACIÓN
Cuando los datos se encuentren en una tabla de intervalos solo indicaremos el intervalo al
que pertenece la medida de posición buscada.

EJEMPLOS

1. Para la variable números de televisores por hogar, se obtuvo la distribución que


aparece en la tabla adjunta. El primer, segundo y tercer cuartil son, respectivamente

N° de televisores por hogar Frecuencia


A) 0, 2 y 4 0 26
B) 1, 3 y 5 1 22
C) 0, 3 y 5 2 30
D) 1, 3 y 4 3 54
E) 2, 3 y 4 4 30
5 38

2
2. La tabla se muestra una parte de la tabla de transformación de Puntaje Corregido (PC)
a Puntaje Estándar (PS) para un Facsímil de Matemática con 75 preguntas y sus
correspondientes percentiles. Si el puntaje de un alumno se ubica en el percentil 89
significa que

A) ocupa el puesto 89. PC PS Percentil


B) supera a 89 alumnos. 43 623 87
C) supera al 89% de los alumnos que 44 626 88
rindió esta prueba. 45 629 88
D) hay 89 alumnos que obtuvieron 633 puntos. 46 633 89
E) ninguna de las anteriores 47 640 90

3. El ingreso de Eugenio está ubicado en el tercer intervalo quintílico. Respecto a este


ingreso se puede afirmar que

A) supera solo al 40% de la población.


B) supera a menos del 40% de la población.
C) es menor al ingreso del 40% de ingresos más altos.
D) no más de un 40% es superior a él.
E) no más de un 40% es inferior a él.

4. El valor x en una muestra está ubicado entre el segundo y tercer decil. ¿Cuál(es) de
las siguientes afirmaciones respecto a x es (son) siempre verdadera(s)?

I) El valor de x es inferior al primer cuartil.


II) El valor de x es inferior al segundo quintil.
III) El valor de x es superior al percentil 28.

A) Solo I
B) Solo II
C) Solo I y III
D) Solo II y III
E) I, II y III

3
GRÁFICO DE CAJA Y BIGOTES

El diagrama de caja es una representación gráfica basada en cuartiles, que ayuda a ilustrar
una muestra de datos. Para elaborar este gráfico, sólo se necesitan cinco datos: el valor
mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor máximo de la muestra.

TIPOS DE MUESTRA

Muestra Simétrica: Los valores intercuartílicos están igualmente dispersos.

Valor Q1 Q2 Q3 Valor
mínimo máximo

Muestra Positivamente Asimétrica: Los valores más grandes se encuentran más


dispersos que los más pequeños.

Valor Q1 Q2 Q3 Valor
mínimo máximo

Muestra Negativamente Asimétrica: Los valores más pequeños se encuentran más


dispersos que los más grandes.

Valor Q1 Q2 Q3 Valor
mínimo máximo

4
EJEMPLOS

1. A partir del diagrama de cajas y bigotes de la figura adjunta, ¿cuál de las siguientes
afirmaciones es verdadera?

A) La distribución es simétrica
B) Los valores mayores están más dispersos
C) La muestra presenta una asimetría negativa.
D) Los valores menores están más concentrados.
E) Hay pocos valores altos.

2. En el diagrama de caja y bigotes que se muestra en la figura adjunta, se muestran las


estaturas de los alumnos de un determinado curso (en cm)

165 169 172 177 185

¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?

I) El 50% de los alumnos tienen estaturas entre 169 cm y 177 cm.


II) El rango de las estaturas es 20 cm.
III) La distribución de las estaturas es asimétrica.

A) Solo I
B) Solo I y II
C) Solo II y III
D) Solo I y III
E) I, II y III

5
MEDIDAS DE DISPERSIÓN

Las medidas de dispersión, o medidas de variabilidad, indican la dispersión de los valores de


la muestra respecto a su valor central. Mientras menor sea la medida de dispersión mas
homogénea será la muestra.

RANGO

Rango o recorrido es la diferencia entre el mayor y el menor de los datos.

DESVIACIÓN ESTÁNDAR o TÍPICA

Es una medida de dispersión y nos indica cuánto tienden a alejarse los datos del promedio
aritmético.

Para calcular la desviación estándar () se utiliza la siguiente fórmula:

Para datos no agrupados


(x1  x)2 + (x2  x)2 + ... + (xn  x)2
=
n

Para datos agrupados


en tablas de frecuencia f1 · (x1  x)2 +f2 · (x2  x)2 + ... + fn · (xn  x)2
=
f1 + f2 + f3 + ..... + fn

Donde xi : dato
fi : frecuencia

OBSERVACIÓN:

Al trabajar con datos agrupados en intervalos se utiliza la marca de clase de cada uno de
ellos, en lugar de xi.

PROPIEDADES

Sea x una variable aleatoria y k un número real

1.  (x)  0 La desviación estándar es un número real no negativo.


2.  (k) = 0 Si todos los datos de la muestra son iguales, entonces la desviación
estándar es cero.
3.  (x + k) =  (x) Si a todos los datos de una muestra se les suma una misma
cantidad, la desviación estándar no se modifica.
3.  (kx) = k ·  (x) Si todos los datos de una muestra se multiplican por el factor k, la
nueva desviación estándar será k veces la desviación estándar
original.

6
VARIANZA

Es otra medida de dispersión que corresponde al cuadrado de la desviación estándar.

(x1  x)2 + (x2  x)2 + ... + (xn  x)2


Para datos no agrupados Var(x) = 2 =
n

Para datos agrupados


en tablas de frecuencia f1(x1  x)2 + f2 (x2  x)2 + ... + fn(xn  x)2
Var(x) = 2 =
f1 + f2 + f3 + ... + fn
Donde xi : variable
fi : frecuencia

OBSERVACIÓN:

Al trabajar con datos agrupados en intervalos se utiliza la marca de clase de cada uno de
ellos, en lugar de xi.

PROPIEDADES DE LA VARIANZA

Sea x una variable aleatoria y k un número real

1) Var (x)  0 : La desviación estándar es un número real no negativo.

2) Var (k) = 0 : Si todos los datos de la muestra son iguales, entonces la


varianza es cero.

3) Var (x + k) = Var (x) : Si a todos los datos de una muestra se le suma un mismo
valor k, la varianza no sufre variación, se mantiene igual.

4) Var (kx) = k2 · Var(x) : Si todos los valores de una muestra se multiplican por k, la
nueva varianza será k2 veces la varianza original.

EJEMPLOS

1. El rango en el conjunto de datos {3, 7, 8, 11, 1, 10, 15, 20, 21, 22, 24, 23} es

A) 12
B) 20
C) 21
D) 22
E) 23

7
2. ¿Cuál(es) de las siguientes proposiciones es (son) verdadera(s)?

I) La desviación estándar es un número real no negativo.


II) La diferencia entre un dato y el promedio de la muestra puede ser
negativa.
III) El rango es una medida de dispersión que puede ser negativa.

A) Solo I
B) Solo I y II
C) Solo II y III
D) I, II y III
E) Ninguna de ellas.

3. En una familia las edades de sus hijos son 3, 4, 7, 9 y 12 años. ¿Cuál(es) de las
siguientes afirmaciones es (son) verdadera(s)?

I) Si todos aumentaran un año, entonces la media sería 5 unidades mayor.


II) La muestra es amodal.
III) La desviación estándar es de 10, 8 años.

A) Solo II
B) Solo III
C) Solo I y II
D) Solo I y III
E) Solo II y III

4. Con respecto a la tabla de frecuencias adjunta, ¿cuál(es) de la siguientes proposiciones


es (son) verdadera(s)?

I) El promedio es 6. Edad (años) Nº de niños


II) El total de datos es 5. [0 – 4[ 2
III) La desviación estándar es 12,8 . [4 – 8[ 1
[8 – 12[ 2

A) Solo I
B) Solo I y II
C) Solo I y III
D) Solo II y III
E) I, II y III

8
VARIANZA DE UNA VARIABLE ALEATORIA DISCRETA

VAR(X) = E(X2 )  E X 


2
Se define la varianza de una variable aleatoria como

Donde E(X) es la esperanza de la variable E(X2) es la esperanza de la variable al cuadrado.

Observación: La varianza es siempre un número real no negativo.

EJERCICIOS

1. El valor esperado de una variable aleatoria X es 2,5 y el valor esperado para los
cuadrados de la misma variable aleatoria es 6,5. ¿Cuál es la desviación estándar de la
variable?

A) 4
1
B)
2
1
C)
4
1
D)
16
1
E) -
2

2. ¿Cuál es la varianza de los datos de la tabla adjunta?

x p
A) 13
1 0,3
B) 10,2
2 0,2
C) 7,4
D) 2,8 3 0,1
E) 2,36 4 0,2
5 0,2

3. De los datos de la tabla adjunta, ¿cuál(es) de las siguientes afirmaciones es (son)


verdadera(s)?

I) El valor esperado para la variable aleatoria X es 0. x p


II) La varianza de la variable x es 0. -10 0,2
-20 0,3
III) La desviación estándar de los datos es  = 2 70 .
10 0,2
20 0,3
A) Solo I
B) Solo III
C) Solo I y II
D) Solo I y III
E) I, II y III

9
EJERCICIOS

1. Las temperaturas mínimas registradas durante la última semana en cierta ciudad son
-5, 2, 0, -3, -2, 1 y 0 °C, entonces el rango de estos valores es

A) -7
B) -5
C) 5
D) 6
E) 7

2. La tabla siguiente muestra los resultados sobre una encuesta hecha a un grupo de
30 adolescentes respecto al número de teléfonos celulares que han tenido. ¿Cuál(es) de
las siguientes afirmaciones es (son) verdadera(s)?

I) La media de los datos es 4.


II) La amplitud de cada intervalo es 1.
III) La desviación típica de muestra es 2,4 .

A) Solo I Nº celulares frecuencia


B) Solo II [1 – 3[ 9
C) Solo III
[3 – 5[ 12
D) Solo I y II
E) Solo I y III [5 – 7[ 9

3. La siguiente tabla muestra el número de personas a bordo de un vehículo que pasan


por cierta intersección de calles. ¿Cuáles de las siguientes afirmaciones son
verdaderas?

I) El percentil 75 corresponde al dato 3.


II) El decil 9 corresponde al dato 4.
III) El tercer quintil corresponde al dato 2.

A) Solo I y II Nº Personas Frecuencia


B) Solo I y III 1 200
2 410
C) Solo II y III
3 150
D) I, II y III
4 150
E) Ninguna de ellas. 5 90

10
4. La tabla muestra los puntajes obtenidos en un test de lógica, por tres grupos diferentes
de empleados, pertenecientes a una misma empresa.

Grupo 1 20 20 20 20 20
Grupo 2 20 10 0 -20 -10
Grupo 3 20 20 10 50 80

Si llamamos 1 a la desviación típica del grupo 1, 2 a la desviación típica del grupo 2 y


3 a la desviación típica del grupo 3, entonces se puede afirmar que

A) 1 = 2 = 3
B) 2 = 3 > 1
C) 1 < 3  2
D) 1 < 2 < 3
E) 1 < 3 < 2

5. Los cursos P y Q en el último control obtuvieron el promedio y desviación estándar


indicadas en la tabla adjunta. ¿Cuál(es) de las siguientes afirmaciones es (son)
verdadera(s)?

I) El curso Q es más homogéneo.


II) El curso P tiene una mayor varianza.
III) El curso Q presenta mayor variación en los puntajes.

A) Solo I Desviación
Curso Promedio
B) Solo II Estándar
C) Solo I y II P 5,3 1
D) Solo I y III Q 5,3 0,8
E) Solo II y III

6. Si todos los datos de una muestran se incrementan en 4 unidades, entonces la varianza

A) se incrementa en 4 unidades.
B) se incrementa en 2 unidades.
C) queda igual.
D) se incrementa en un 25%.
E) se incrementa en un 50%.

11
7. Con respecto a los conjuntos: A = {1, 2, 3}; B = {3, 4, 5} y C = {3, 6, 9}. ¿Cuál(es)
de las siguientes afirmaciones es (son) verdadera(s)?

I) La desviación estándar de los conjuntos A y B son iguales.


II) La varianza del conjunto C es equivalente a nueve veces la varianza del
conjunto A.
III) Los elementos del conjunto C son más dispersos que los elementos de los
conjuntos A y B.

A) Solo I
B) Solo II
C) Solo I y II
D) Solo II y III
E) I, II y III

8. Si todos los datos de una muestra se multiplican por 4, ¿cuál(es) de las siguientes
afirmaciones es (son) verdadera(s)?

I) El promedio se cuadruplica.
II) La desviación típica se cuadruplica.
III) La varianza se duplica.

A) Solo I
B) Solo II
C) Solo I y II
D) Solo I y III
E) I, II y III

9. Una prueba consta de 40 preguntas y fue respondida por 70 alumnos obteniéndose un


promedio de 30 respuestas correctas con una varianza igual a 9. Si el puntaje de esta
prueba se calcula mediante la fórmula

Puntaje = 4 · nº respuestas correctas + 64

¿Cuál es la desviación estándar para el puntaje?

A) 6
B) 10
C) 12
D) 36
E) 100

12
10. ¿Cuál es la desviación estándar de los datos mostrados en la tabla?

A) 16,4 X Frecuencia
B) 1,64 1 3
C) 16,4 2 2
3 1
D) 1,64 4 4
E) 0,504

11. Se tiene un conjunto de 4 números enteros cuya desviación estándar es p. Si a cada


valor se agregan 3 unidades, entonces la nueva desviación estándar es

A) p
B) 4p
C) p+4
D) p + 12
E) 12p

12. Al analizar los puntajes de los 4 controles realizados por Juan y Pedro, se obtuvieron
los siguientes resultados:

Juan Pedro
Promedio 613 613
Desviación estándar 54,47 168,74

De acuerdo con esta información, ¿cuál(es) de las siguientes afirmaciones es (son)


siempre verdadera(s)?

I) Juan tiene puntajes más cercanos a su promedio.


II) Ambos han obtenido los mismos puntajes en los controles.
III) Existe un error en el cálculo de las desviaciones estándar de Pedro o de
Juan, porque ambos tienen el mismo promedio.

A) Solo I
B) Solo I y II
C) Solo I y III
D) Solo II y III
E) I, II y III

13
13. ¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?

I) La varianza puede ser igual a la desviación estándar.


II) Si sumamos a todos los datos un mismo número real, la varianza no
cambia.
III) La varianza es la raíz cuadrada de la desviación estándar.

A) Solo I
B) Solo II
C) Solo III
D) Solo I y II
E) I, II y III

14. Se tienen cuatro números x, y, z, w cuya varianza es , entonces la varianza de kx,


ky, kz, kw, con k un número natural, es

A) 4k
B) k4
C) k2
D) k
E) 4(k + )

15. Sea una desviación estándar , tal que 0 <  < 1, ¿cuál(es) de las siguientes
afirmaciones es (son) siempre verdadera(s)?

I) La varianza es mayor que la desviación estándar.


II) La media aritmética es cero.
III) La mediana es cero.

A) Solo I
B) Solo II
C) Solo II y III
D) I, II y III
E) Ninguna de ellas.

16. El ingreso de Felipe está ubicado entre el segundo y tercer decil. ¿Cuál(es) de las
siguientes afirmaciones respecto a este ingreso en relación a la población es (son)
verdadera(s)?

I) Es inferior al 25%.
II) Es superior al 20%.
III) Es superior al 22%.

A) Solo I
B) Solo II
C) Solo I y III
D) Solo II y III
E) I, II y III

14
17. En una muestra de 10 datos se obtiene una desviación estándar igual a 1,5. Si a cada
elemento de la muestra se agregan 10 unidades, entonces la nueva desviación
estándar y varianza son, respectivamente

Desv. Est. Varianza


A) 101,5 102,25
B) 101,5 12,25
C) 11,5 12,25
D) 1,5 102,25
E) 1,5 2,25

18. La distribución de pensiones en miles de pesos que recibe un grupo de adultos mayores
se representa mediante el siguiente diagrama de caja y bigotes, figura adjunta.
¿Cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?

I) El 25% de los pensionados gana $ 750.000 ó más.


II) El promedio de las pensiones es $ 650.000.
III) El 25% de las personas del grupo gana a lo menos $ 300.000.

A) Solo I
B) Solo II
C) Solo I y II
D) Solo II y III
E) I, II y III 100 300 650 750 800

19. La siguiente tabla muestra los valores de una variable X y sus respectivas frecuencias.
¿Cuál es el valor que corresponde al segundo cuartil?

A) 5,5 X frecuencia
B) 6
4 4
C) 6,5
5 8
D) 7
E) 7,5 6 10
7 20
8 8

15
20. Si el valor de A es una variable que está entre el cuarto y quinto decil, entonces
¿cuál(es) de las siguientes afirmaciones es (son) verdadera(s)?

I) Su valor es superior al 40% de los datos.


II) La mediana del conjunto es mayor que el valor de A.
III) El valor de A es menor que el tercer cuartil.

A) Solo I
B) Solo III
C) Solo I y II
D) Solo II y III
E) I, II y III

21. La tabla muestra las notas obtenidas por todos los alumnos de un curso en una prueba

Notas frecuencia
[1,0 – 2,0[ 2
[2,0 – 3,0[ 3
[3,0 – 4,0[ 10
[4,0 – 5,0[ 15
[5,0 – 6,0[ 9
[6,0 – 7,0] 6

De acuerdo a la tabla, es correcto afirmar que

A) el primer cuartil se ubica en el intervalo [1,0 – 2,0[.


B) el intervalo modal es [3,0 – 4,0[.
C) la mediana se ubica en el intervalo [3,0 – 4,0[.
D) el séptimo decil se ubica en el intervalo [5,0 – 6,0[.
E) la media aritmética es menor que 4,0.

22. La distribución de ingresos de una población se representa mediante el siguiente


diagrama de caja y bigotes, figura adjunta. Entonces, ¿cuál(es) de las siguientes
afirmaciones es (son) verdadera(s)?

I) El 50% gana más 40 mil pesos.


II) El 25% gana a lo menos 30 mil pesos.
III) El 25% gana no menos de 60 mil pesos.

A) Solo I 10 30 40 60 90
B) Solo II
C) Solo I y III
D) Solo II y III
E) I, II y III

16
23. Los promedios de tiempos de 100 metros planos de dos atletas es 14,28 s, se debe
elegir entre los dos el que tenga menos variación en sus resultados, esto se puede
determinar, si:

(1) Se conoce la moda de cada muestra.


(2) Se conoce la desviación estándar de cada muestra.

A) (1) por sí sola


B) (2) por sí sola
C) Ambas juntas, (1) y (2)
D) Cada una por sí sola, (1) ó (2)
E) Se requiere información adicional

24. Se puede determinar el valor de la desviación estándar de una muestra, si:

(1) La muestra no tiene moda.


(2) Todos los datos tienen la misma frecuencia.

A) (1) por sí sola


B) (2) por sí sola
C) Ambas juntas, (1) y (2)
D) Cada una por sí sola, (1) ó (2)
E) Se requiere información adicional

25. Se puede determinar el valor de la mediana de una distribución, si:

(1) Se conoce el valor de Q3 – Q1.


(2) La distribución es simétrica.
A) (1) por si sola
B) (2) por si sola
C) Ambas juntas, (1) y (2)
D) Cada una por si sola, (1) ó (2)
E) Se requiere información adicional

17
RESPUESTAS EJEMPLOS

EJEMPLO
Pág.
1 2 3 4
2y3 E C C B
5 C E
7y8 E B E E
9 B E D

RESPUESTAS PÁG. 10

1. E 6. C 11. A 16. B 21. D


2. E 7. E 12. A 17. E 22. C
3. D 8. C 13. D 18. A 23. B
4. D 9. C 14. C 19. D 24. E
5. C 10. B 15. E 20. E 25. E

MT-20

Puedes complementar los contenidos de esta guía visitando nuestra web


http://www.pedrodevaldivia.cl/

18