Curso de Estadistica 2
Curso de Estadistica 2
Curso de Estadistica 2
Toma de datos
La toma de datos es la obtención de una colección de los mismos
que no han sido ordenados numéricamente. Un ejemplo es el
conjunto de alturas de 100 estudiantes, obtenidas de una lista
alfabética de una universidad.
Ordenación
Una ordenación es una colocación de los datos numéricos tomados,
en orden creciente o decreciente de magnitud. La diferencia entre
el mayor y el menor se llama intervalo de los datos. Por ejemplo, si
la altura mayor de los 100 estudiantes es 170 cm y la menor 150 cm
el intervalo es 170-150 = 20cm.
Tabulación y Graficas
Todo análisis estadístico son estrategias para
traducir la cantidad de información obtenida en la
recolección de datos, a índices que sean
interpretables y que representen alguna
dimensión del comportamiento de las variables
Altura Núm. de
(pulgadas) estudiantes
60-62 5
63-65 18
66-68 42
69-71 27
un intervalo de clase que al menos teóricamente, no tiene
limite superior o inferior, se conoce como intervalo de clase
abierto. Por ejemplo al referirse a la edad de grupos de
individuos el intervalo de clase, <<mayores de 65 años>> es un
intervalo de clase abierto
Li + Ls
Vi =
2
5. Calculo de las frecuencias absolutas de clase (ni )
ni
fi =
Número total de observaciones
7. Cálculo de las frecuencias acumuladas absolutas (Ni)
Ni
Fi =
Número total de observaciones
Ejemplo 2.1. Obtener la tabla de frecuencia para los datos de la
Tabla 2
Tabla 2.1Rendimiento (en kilogramos) de plantas de maíz atacadas por el barrenador europeo.
3.81 6.81 7.49 4.56 7.16 8.61 3.86 6.78 9.02 8.65 6.72
5.26 6.90 8.64 5.47 6.07 6.48 8.72 9.16 5.85 8.51 8.96
7.44 8.82 5.88 7.62 5.67 9.00 5.60 7.64 8.82 10.08 5.64
8.26 7.90 10.27 6.65 7.25 6.26 6.43 7.71 7.52 6.68 7.98
7.64 7.17 8.06 6.66 8.26 6.67 6.25 7.63 6.73 7.60 8.14
10.34 6.91 7.82 6.76 7.75 7.36 8.52 7.23 7.63 6.95 778
Con relación a esta tabla encontrar (a) la puntuación mas alta, (b) la puntuación
mas baja, (c) las puntuaciones de los cinco estudiantes de mayor puntuación, (d)
las puntuaciones de los cinco estudiantes de menor puntuación, (e) la
puntuación del decimo estudiante de mayor puntuación, (f) cuantos estudiantes
obtuvieron puntuación de 75 o mayor, (g) cuantos estudiantes obtuvieron
puntuación menor de 85, (h) que porcentaje de estudiantes obtuvo una
puntuación mayor que 65 pero no mayor que 85, (i) que puntuaciones no tienen
ningún estudiante.
MÉTODOS GRÁFICOS PARA LA REPRESENTACIÓN DE LOS DATOS
GRÁFICO DE BARRAS
Ejemplo
Tabla 2.4 Preferencia religiosa de 100 individuos
de cierta ciudad.
Religión Número de individuos
Católica 50
Protestante 33
Otra 17
Total 100
60
50
Número de Individuos
40
30
20
10
CATOLICA PROTESTA OTRA
RELIGION
(a) Sus bases sobre un eje horizontal (eje X) con centros en las
marcas de clase y longitud igual al tamaño de los intervalos de
clase
16
14
Número de automóviles
12
10
0
<= 15 (15,20] (20,25] (25,30] (30,35] (35,40] (40,45] (45,50] (50,55] > 55
Velocidades
40
F
R 20
E
C.
A
C
O
M.
0
40 60 80 100
PESO
Las curvas de frecuencia presentan determinas formas características que les distinguen
como se indica
Distribuciones simétricas
Distribuciones asimétricas
13
12,6
12,2
11,8
11,4
11
10,6
10,2
9,8
9,4
8,6
8,2
A B C D
Errores Gráficos
•Ausencia de título
•Visualización confusa
Ejercicio 4
• Requisitos
– Variables cuantitativas
– Los resultados están ordenados de menor a
mayor
– Las medidas de posición son variables discretas
• Equivalencias
– Como todas las medidas se refieren al mismo
grupo de datos, se pueden hacer equivalentes
entre sí
Percentiles
P50 = Me
• Traslademos el gráfico de barra a su respectiva tabla
de frecuencia y tratemos de localizar los Percentiles
expuestos en el ejemplo:
Li Ls ni Ni fi Fi
5 15 14 14 14% 14%
15 25 12 26 12% 26%
25 35 20 46 20% 46%
35 45 18 64 18% 64%
45 55 14 78 14% 78%
55 65 12 90 12% 90%
65 75 10 100 10% 100%
[80, 90) 14 48
[90, 100) 10 58
[100, 110) 5 63
[110, 120) 2 65
Percentil 60
65
Deciles
• Para los deciles, tomaremos el total de los datos divididos en
10 partes iguales, por tanto, existirán 10 deciles representado
como Dk
Fórmula para calcular Deciles
ê 10 * N - N i ú percentil.
ê ni ú
n= frecuencia en el intervalo crítico
é 32.5 - 18 ù
D5 = 70 + ê • 10 = 79.06
ë 16 úû
CUARTILES
• Para los cuartiles, tomaremos el total de los datos divididos en
4 partes iguales.
• Denotaremos el cuartil como Qk.
Fórmula para calcular cuartiles
ê 4 * N - Ni ú percentil.
ê ni ú
n= frecuencia en el intervalo crítico
é 65 - 63 ù
Q4 = 110 + ê • 10 = 120
ë 2 úû
Ejercicio 5
A partir de las siguientes tabla de frecuencia calcular:
ni Ni
Li Ls ni Ni
[300,399) 14 14
12 15 13 13
[400, 499) 46 60
15 18 11 24 [500, 599) 58 118