MT-12 Clase Nº21 - Estadística II - Cropped

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

UNIDAD: ESTADSTICA II

DATOS Y AZAR

MEDIDAS DE POSICIN
Las medidas de posicin dividen la distribucin en partes iguales y sirven para clasificar a un
individuo o elemento dentro de una determinada poblacin o muestra. As en la PSU los
resultados de prueba que realiza un determinado individuo, sirve para clasificar a dicho
sujeto en una determinada categora en funcin de la puntuacin obtenida. En economa se
utiliza principalmente para definir sectores socioeconmicos segn ingreso per cpita
familiar (por ejemplo quintiles).

Para determinar las medidas de posicin es necesario que los datos se encuentren
ordenados en forma creciente.

Las medidas de posicin, ms utilizadas son: Cuartiles, Quintiles, Deciles y percentiles.

As como la mediana divide la distribucin en dos partes iguales, existen tres cuartiles,
cuatro quintiles, nueve deciles y noventa y nueve percentiles que dividen en cuatro, cinco,
diez y cien partes iguales a la distribucin.

CUARTILES
Los cuartiles son 3, los que dividen los datos ordenados en 4 partes.
Los cuartiles son datos bajos los cuales se acumula el 25%, 50% y el 75% de los datos
estudiados, se representan como Q1, Q2 y Q3 respectivamente.

OBSERVACIN: Q2 coincide con la mediana.

QUINTILES
Los quintiles son 4, los que dividen los datos ordenados en 5 partes.
Los quintiles son datos bajos los cuales se acumula el 20%, 40%, 60% y el 80% de los
datos estudiados.

DECILES
Los deciles son 9, los que dividen los datos ordenados en 10 partes.
Los deciles son datos bajos los cuales se acumula el 10%,20%, y el 90% de los datos
estudiados

PERCENTILES
Los percentiles son 99, los que dividen los datos ordenados en 100 partes.
Los percentiles son datos bajos los cuales se acumula el 1%,2%, 3%,4% y el 99% de los
datos estudiados.
Para determinar el LUGAR en el que se ubica la medida de posicin buscada, existe una
relacin que depende de la medida de posicin que se desee calcular.

Medida de Cuartil Quintil Decil Percentil


Posicin
Posicin N+1 N+1 N+1 N+1
(lugar) PQ = K PK = K PD = K PP = K
K 4 K 5 K 10 K 100

PQ , indica la posicin del cuartil K, siendo K = 1, 2, 3


K

PK , indica la posicin del quintil K, siendo K = 1, 2, 3, 4


K

PD , indica la posicin del decil K, siendo K = 1, 2, 3 ,4 , 5, 6, 7, 8, 8, 9


K

PK , indica la posicin del percentil K, siendo K = 1, 2, 3, 4,..,99


K

Para determinar una medida de posicin para datos no agrupados, se procede de la


siguiente manera:

- Ordenar los datos en forma creciente


- Determinar el lugar que ocupa la medida de posicin buscada.
- Respecto a la posicin tenemos dos posibilidades de resultados:
Nmero entero: el valor ser el dato que ocupa ese lugar.
Nmero decimal: el valor ser el promedio entre los datos que se encuentra a la
izquierda de la posicin con el dato que se encuentra a la derecha.

DATOS TABULADOS
Si los datos se encuentran tabulados en una tabla de frecuencia, se debe proceder de
manera similar a la utilizada para encontrar la mediana, se busca en la columna de
frecuencia acumulada el lugar que corresponde a la media de posicin buscada y de esta
manera se determina el dato correspondiente.

OBSERVACIN
Cuando los datos se encuentren en una tabla de intervalos solo indicaremos el intervalo al
que pertenece la medida de posicin buscada.

EJEMPLOS

1. Para la variable nmeros de televisores por hogar, se obtuvo la distribucin que


aparece en la tabla adjunta. El primer, segundo y tercer cuartil son, respectivamente

N de televisores por hogar Frecuencia


A) 0, 2 y 4 0 26
B) 1, 3 y 5 1 22
C) 0, 3 y 5 2 30
D) 1, 3 y 4 3 54
E) 2, 3 y 4 4 30
5 38
2. La tabla se muestra una parte de la tabla de transformacin de Puntaje Corregido (PC)
a Puntaje Estndar (PS) para un Facsmil de matemtica con 75 preguntas y sus
correspondientes percentiles. Un alumno que qued en el Percentil 89 significa que

A) ocupa el puesto 89. PC PS Percentil


B) supera a 89 alumnos de un total de 100. 43 623 87
C) supera al 89% de los alumnos que 44 626 88
rindi esta prueba. 45 629 88
D) hay 89 alumnos que obtuvieron 633 puntos. 46 633 89
E) ninguna de las anteriores 47 640 90

3. El ingreso de Eugenio est ubicado en el tercer intervalo quintlico. Respecto a este


ingreso se puede afirmar que

A) Supera solo al 40% de la poblacin.


B) Supera a menos del 40% de la poblacin.
C) Es menor al ingreso del 40% de ingresos ms altos.
D) No ms de un 40% es superior a l.
E) No ms de un 40% es inferior a l.

4. El valor x en una muestra est ubicado entre el segundo y tercer decil. Cul(es) de
las siguientes afirmaciones respecto a x es (son) verdadera(s)?

I) El valor de x es inferior al primer cuartil.


II) El valor de x es inferior al segundo quintil.
III) El valor de x es superior al percentil 28.

A) Solo I
B) Solo II
C) Solo I y III
D) Solo II y III
E) I, II y III
MEDIDAS DE DISPERSIN

Las medidas de dispersin, o medidas de variabilidad, indican la dispersin de los valores de


la muestra respecto a su valor central. Mientras menor sea la medida de dispersin mas
homognea ser la muestra.

RANGO

Rango o recorrido es la diferencia entre el mayor y el menor de los datos.

DESVIACIN ESTNDAR o TPICA

Es una medida de dispersin y nos indica cunto tienden a alejarse los datos del promedio
aritmtico.

Para calcular la desviacin estndar () se utiliza la siguiente frmula:

Para datos no agrupados


(x1 x)2 + (x2 x)2 + ... + (xn x)2
=
n

Para datos agrupados


en tablas de frecuencia f1 (x1 x)2 +f2 (x2 x)2 + ... + fn (xn x)2
=
f1 + f2 + f3 + ..... + fn

Donde xi : dato
fi : frecuencia

OBSERVACIN:

Al trabajar con datos agrupados en intervalos se utiliza la marca de clase de cada uno de
ellos, en lugar de xi.

PROPIEDADES

Sea x una variable aleatoria y k un nmero real

1) (x) 0
2) (k) = 0
3) (x + k) = (x)
4) (kx) = k (x)
VARIANZA

Es otra medida de dispersin que corresponde al cuadrado de la desviacin estndar.

(x1 x)2 + (x2 x)2 + ... + (xn x)2


Var(x) = 2 =
n

Para datos agrupados


en tablas de frecuencia f1(x1 x)2 + f2 (x2 x)2 + ... + fn(xn x)2
Var(x) = 2 =
f1 + f2 + f3 + ... + fn
Donde xi : variable
fi : frecuencia

OBSERVACIN:

1. El valor de la varianza es siempre un nmero no negativo


2. Al trabajar con datos agrupados en intervalos se utiliza la marca de clase de cada uno
de ellos, en lugar de xi.

PROPIEDADES DE LA VARIANZA

Sea x una variable aleatoria y k un nmero real

1) Var (x) 0

2) Var (k) = 0

3) Var (x + k) = Var (x)

4) Var (kx) = k2 Var(x)

EJEMPLOS

1. El rango en el conjunto de datos {3, 7, 8, 11, 1, 10, 15, 20, 21, 22, 24, 23} es

A) 12
B) 20
C) 21
D) 22
E) 23
2. Cul(es) de las siguientes proposiciones es (son) verdadera(s)?

I) La desviacin estndar es un nmero real no negativo.


II) La diferencia entre un dato y el promedio de la muestra puede ser
negativa.
III) El rango es una medida de dispersin que puede ser negativa.

A) Solo I
B) Solo I y II
C) Solo II y III
D) I, II y III
E) Ninguna de ellas.

3. Con respecto a la tabla de frecuencias adjunta, cul(es) de la siguientes proposiciones


es (son) verdadera(s)?

I) El promedio es 6. Edad (aos) N de nios


II) El total de datos es 5. [0 4[ 2
III) La desviacin estndar es 12,8 . [4 8[ 1
[8 12[ 2

A) Solo I
B) Solo I y II
C) Solo I y III
D) Solo II y III
E) I, II y III

4. En una familia las edades de sus hijos son 3, 4, 7, 9 y 12 aos. Cul(es) de las
siguientes afirmaciones es (son) verdadera(s)?

I) Si todos aumentaran un ao, entonces la media sera 5 unidades mayor.


II) La muestra es amodal.
III) La desviacin estndar es de 10, 8 aos.

A) Solo II
B) Solo III
C) Solo I y II
D) Solo I y III
E) Solo II y III
GRFICO DE CAJA Y BIGOTES

El diagrama de caja es una representacin grfica basada en cuartiles, que ayuda a ilustrar
una muestra de datos. Para elaborar este grfico, slo se necesitan cinco datos: el valor
mnimo, el primer cuartil, la mediana, el tercer cuartil y el valor mximo de la muestra.

TIPOS DE MUESTRA

Muestra Simtrica: Los valores intercuartlicos estn igualmente dispersos.

Valor Q1 Q2 Q3 Valor
mnimo mximo

Muestra Positivamente Asimtrica: Los valores ms grandes se encuentran ms


dispersos que los ms pequeos.

Valor Q1 Q2 Q3 Valor
mnimo mximo

Muestra Negativamente Asimtrica: Los valores ms pequeos se encuentran ms


dispersos que los ms grandes.

Valor Q1 Q2 Q3 Valor
mnimo mximo
EJEMPLOS

1. A partir del siguiente diagrama de cajas y bigotes de la figura 1, cul de las siguientes
afirmaciones es verdadera?

A) La distribucin es simtrica
B) Los valores mayores estn ms dispersos
C) La muestra presenta una asimetra negativa.
D) Los valores menores estn ms concentrados. fig. 1
E) Hay pocos valores altos.

2. En el diagrama de caja y bigotes que se muestra en la figura, se muestran las estaturas


de los alumnos de un determinado curso (en cm)

fig. 2

165 169 172 177 185

Cul(es) de las siguientes afirmaciones es (son) verdadera(s)?

I) El 50% de los alumnos tienen estaturas entre 169 cm y 177 cm.


II) El rango de las estaturas es 20 cm.
III) La distribucin de las estaturas es asimtrica.

A) Solo I
B) Solo I y II
C) Solo II y III
D) Solo I y III
E) I, II y III

También podría gustarte