Estadistica 6° y 7° PDF
Estadistica 6° y 7° PDF
Estadistica 6° y 7° PDF
1
INTRODUCCIÓN
Este módulo tiene como función trabajar conceptos, definiciones y talleres básicos
con el objetivo de que el estudiante los reconozca y entienda mejor cada uno de los
temas a desarrollar en la asignatura.
OBJETIVOS
2
CONTENIDO
PÁG.
1) Historia de la Estadística……………………………………………………. 4
2) Concepto de la Estadística…………………………………………………. 7
3) División de la estadística:
3.1 Estadística descriptiva………………………………………….. 8
3.2 Estadística inferencial…………………………………………… 8
4) Conceptos básicos:
4.1 Población…………………………………………………………. 8
4.2 Muestra………………………………………………………….... 8
4.3 Muestra Aleatoria………………………………………………… 10
4.4 Variable……………………………………………………………. 11
4.5 Dato………………………………………………………………… 11
4.6 Parámetro…………………………………………………………. 11
4.7 Estadístico………………………………………………………… 11
4.8 Censo……………………………………………………………… 11
4.9 Encuesta………………………………………………………….. 11
5) Pasos en un estudio estadístico……………………………………………. 12
6) Técnicas de Muestreo……………………………………………………….. 12
7) Tipos de variables……………………………………………………………. 15
8) Tablas de frecuencias……………………………………………………..… 18
9) Medidas de tendencia central………………………………………………. 22
10) Pictogramas…………………………………………………………………. 25
11) Diagramas de barras……………………………………………………….. 27
12) Estadística de posición continua…………………………………………… 33
01. Cuartiles………………………………………………………….. 34
02. Déciles……………………………………………………………. 36
03. Percentiles……………………………………………………….. 37
13) Prepárate para el icfes……………………………………………………… 41
3
1. HISTORIA DE LA ESTADÍSTICA
4
Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron
de revivir la técnica romana, los métodos estadísticos permanecieron casi olvidados
durante la Edad Media. Durante los siglos XV, XVI, y XVII, hombres como Leonardo
de Vinci, Nicolás Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René
Descartes, entre otros, hicieron grandes operaciones al método científico, de tal forma
que cuando se crearon los Estados Nacionales y surgió como fuerza el comercio
internacional existía ya un método capaz de aplicarse a los datos económicos.
Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de
los recursos nacionales, comprensiva de datos sobre organización política,
instrucciones sociales, comercio y poderío militar. Durante el siglo XVII aportó
indicaciones más concretas de métodos de observación y análisis cuantitativo y
amplió los campos de la inferencia y la teoría Estadística. Los eruditos del siglo XVII
demostraron especial interés por la Estadística Demográfica como resultado de la
especulación sobre si la población aumentaba, decrecía o permanecía estática. En
los tiempos modernos tales métodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus
respectivos países. El primer empleo de los datos estadísticos para fines ajenos a la
política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán
5
que vivía en Breslau. Este investigador se propuso destruir la antigua creencia popular
de que en los años terminados en siete moría más gente que en los restantes, y para
lograrlo hurgó pacientemente en los archivos parroquiales de la ciudad. Después de
revisar miles de partidas de defunción pudo demostrar que en tales años no fallecían
más personas que en los demás. Los procedimientos de Neumann fueron conocidos
por el astrónomo inglés Halley, descubridor del cometa que lleva su nombre, quien
los aplicó al estudio de la vida humana. Sus cálculos sirvieron de base para las tablas
de mortalidad que hoy utilizan todas las compañías de seguros.
Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis
Maseres, Lagrange y Laplace desarrollaron la teoría de probabilidades. No obstante
durante cierto tiempo, la teoría de las probabilidades limitó su aplicación a los juegos
de azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas
científicos. Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en
1760 la palabra estadística, que extrajo del término italiano statista (estadista). Creía,
y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del
gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el
término latino status, que significa estado o situación; Esta etimología aumenta el
valor intrínseco de la palabra, por cuanto la estadística revela el sentido cuantitativo
de las más variadas situaciones.
Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este
interpretó la teoría de la probabilidad para su uso en las ciencias sociales y resolver
la aplicación del principio de promedios y de la variabilidad a los fenómenos sociales.
Quételect fue el primero en realizar la aplicación práctica de todo el método
Estadístico, entonces conocido, a las diversas ramas de la ciencia. Entretanto, en el
período del 1800 al 1820 se desarrollaron dos conceptos matemáticos fundamentales
para la teoría Estadística; la teoría de los errores de observación, aportada por
Laplace y Gauss; y la teoría de los mínimos cuadrados desarrollada por Laplace,
Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ideó el método conocido
por Correlación, que tenía por objeto medir la influencia relativa de los factores sobre
las variables. De aquí partió el desarrollo del coeficiente de correlación creado por
Karl Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R.
6
H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las
relaciones. Los progresos más recientes en el campo de la Estadística se refieren al
ulterior desarrollo del cálculo de probabilidades, particularmente en la rama
denominada indeterminismo o relatividad, se ha demostrado que el determinismo fue
reconocido en la Física como resultado de las investigaciones atómicas y que este
principio se juzga aplicable tanto a las ciencias sociales como a las físicas.
2. EL CONCEPTO DE LA ESTADÍSTICA.
3. DIVISIÓN DE LA ESTADÍSTICA
➢ Estadística Descriptiva.
➢ Estadística Inferencial.
7
Son aquellos métodos y técnicas se utilizan para obtener conclusiones
generales sobre una población a partir de una muestra representativa dada.
4. CONCEPTOS BÁSICOS
❏ Población estadística:
❏ MUESTRA:
Ejemplo 3.1
8
Imaginemos que en una cuadra de una calle hay 22 familias y
queremos realizar una encuesta y para ello se eligen 8 familias al azar,
para que la muestra sea representativa. Una forma para que la elección
sea completamente al azar es por ejemplo escribir las familias en
papeles y doblarlos para depositarlos en una urna o bolsa y luego sacar
los papeles que contienen las familias a encuestar. Así, nos
aseguraremos que las familias sean diferentes y seleccionadas al azar.
1 𝑥
=
8 24
Despejando
1
𝑥 = 24 ∗ =3
8
EJERCICIOS:
9
¿Cuántas camisas defectuosas se podrían hallar en un lote de
2.000 camisetas?
3. Un biólogo quiere estudiar si en un lago, donde hay una cierta
especie de pez, hay peces con hongos. Y para ello se encarga
de sacar en distintas horas cierta cantidad de peces. Así, obtiene
una muestra de 60 peces. Al realizar los análisis ve que de esos
60 peces hay 4 con esta enfermedad. Si, llega a la conclusión
que en la población de peces que viven en el lago hay 90 peces
infectados con hongos, ¿cuál es la cantidad de peces en el lago
o la población de peces en ese lago?
❏ VARIABLE O CARÁCTER:
❏ DATO:
❏ PARÁMETRO:
10
reducir toda la información obtenida de una población en unos pocos
números (parámetros).
❏ ESTADÍSTICO
❏ CENSO:
❏ ENCUESTA:
11
de la aceptación de los fumadores (estadístico). tanto porcentaje de la
población no acepta a los fumadores (frecuencias), gráficos, tablas, etc. Luego,
se realiza una inferencia sobre la población, La no aceptación de los fumadores
entre un rango de edades de la población está por encima de la medio, por
ejemplo. Por último, se cuantifica la confianza de la inferencia.
6. MÉTODOS DE MUESTREO.
·El estudio llevaría tanto tiempo que sería impracticable e incluso las
propiedades de la población podrían variar con el tiempo.
TIPOS DE MUESTREO
❏ Muestreo Estratificado.
¿Cuándo de utiliza?
12
1) Cada elemento de la población tiene la misma probabilidad de ser
escogido,
¿Cómo se realiza?
MUESTREO ESTRATIFICADO:
13
¿Cómo se realiza?
MUESTREO SISTEMÁTICO
7. TIPOS DE VARIABLES
● CUALITATIVAS
14
Los valores (modalidades) no se pueden determinar a través de
cantidades numéricas (no se pueden hacer operaciones algebraicas
entre ellas). Y tempos dos tipos de variables cualitativas:
01. Nominales:
02. Ordinales:
● CUANTITATIVAS O NUMÉRICAS
01. DISCRETAS:
15
Si toman valores enteros. Por ejemplo; números de mascotas,
números de hijos, número de personas en el núcleo familiar, etc.
02. CONTINUA:
EJERCICIOS:
Escribe:
1-
16
❏ La variable número de letras de las palabras de un texto
es una variable cuantitativa continua.
8. TABLAS DE FRECUENCIAS.
Las tablas son de vital importancia ya que permite de alguna forma resumir la
información recogida a partir de una muestra representativa, además nos
facilitan la comprensión de la información encontrada en la muestra. En ellas,
se pueden introducir cualquier tipo de variable. Para la construcción se definen
primero las categorías o clases de la muestra, donde los participantes de la
muestra entran en juego, luego tenemos las siguientes definiciones:
𝑓
ℎ𝑖 = 𝑛𝑖; Donde 𝒇𝒊 es la correspondiente frecuencia absoluta y n es el
Ejemplo 8.1:
8, 4, 5, 10, 8, 6, 5, 4, 8, 2.
Solución:
17
Primero organicemos los datos en orden: 2, 4, 4, 5, 5, 6, 8, 8, 8, 10.
Ahora, podemos organizarlos en una tabla
DATO 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
2 1 0,1 1 0,1
4 2 0,2 3 0,3
5 2 0,2 5 0,5
6 1 0,1 6 0,6
8 3 0,3 9 0,9
10 1 0,1 10 1
10 10 1
∑
𝑖=1
18
Ejemplo 8.2: Con frecuencia Acumulada
Solución:
4 x 5=20
L=D-d
n°
L= 87-73 L= 14 = 2
7 7
19
4. Después de tener el número de intervalos de clase se determinarán
el número de rangos en el que se comenzará desde el número menor
sumando el resultado de la ecuación a cada uno hasta llegar a el
número mayor de la secuencia de datos.
20
∑𝑛
𝑖=1 𝑥1 +𝑥2 +...+𝑥𝑛
𝑥= 𝑛
∑𝑛𝑖=1 𝑥𝑖 ∗ 𝑓𝑖
𝑥=
𝑛
Solución:
∑ 𝑥𝑖 ∗ 𝑓𝑖 = 2 + 4 ∗ 2 + 5 ∗ 2 + 6 + 8 ∗ 3 + 10 = 60
𝑖=1
Entonces
60
𝑥= =6
10
2. Moda (𝑀𝑜 ).
3. Mediana (𝑴𝒆 ).
21
En un conjunto de números donde el número de ellos es impar, una vez
ordenados de menor a mayor, la mediana es el dato que divide la
muestra en dos partes iguales o el dato central. En el caso que el
número de datos sea par lo que hace es elegir a los dos datos que
dividan la muestra en dos partes iguales o sean los datos centrales, y
luego se saca la media aritmética de ambos datos elegidos.
5+6
𝑥= = 5,5
2
EJERCICIOS
22
2. En una fábrica textil se recogieron la siguiente información sobre
su producción de telas durante 30 días.
DATO 𝒇𝒊 𝒉𝒊 𝑭𝒊 𝑯𝒊
4 6
6 0,3
8 26
10 0,25
12
40 40 1
∑
𝑖=1
10. PICTOGRAMAS.
23
Los pictogramas son signos que, a través de una figura o de un símbolo, se
puede entender la representación de algo. En la antigüedad se el alfabeto de
ciertas regiones se crearon a través de pictogramas. Hoy en día, por ejemplos
las señales de tránsito son pictogramas.
Ejemplo 9.1:
= 10 muñecos.
24
Mes Charizads N° de peluches
Primero 30
segundo 40
tercero 50
cuerto 40
25
Ejemplo 10.1:
MATERIAS
Matemáticas (M)
Español (E)
Civismo (C)
Historia (H)
Geografía (G)
Inglés (I)
I G C M ED G M G E
ED H E M I I E H ED
C E H ED I ED ED ED I
ED H E C ED H E I E
ED E I E H ED M C E
26
La tabla de frecuencia es
MATERIAS
Matemáticas (M) 4
Español (E) 10
Civismo (C) 4
Historia (H) 6
Geografía (G) 3
Inglés (I) 7
TOTAL 45
EJERCICIOS
27
1. La fábrica de arequipe establece que en un paquete hay 12 unidades
de arequipe café y lo representan con la siguiente figura:
28
2016= 9.500 peras
11, 15, 12, 15, 12, 19, 23, 11, 12, 24, 15, 19, 20, 11, 20, 23, 13, 14, 23,
17, 20, 16, 24, 17, 20, 13, 21, 16, 16, 19.
29
ASIGNATURAS O MATERIAS
MATEMÁTICAS M
FÍSICA F
QUÍMICA Q
EDUCACIÓN FÍSICA ED
INGLÉS I
ESPAÑOL E
BIOLOGÍA B
CIENCIAS SOCIALES CS
NOTAS
Estudiante M F Q ED I E B CS
Andrés Fernández A. 3,2 2,6 3,9 4,0 3,9 3,5 3,9 4,6
Laura S. Ortiz H. 3,2 2,5 2,6 3,6 4,0 1,9 2,2 3,0
Felipe A. Aguilar P. 3,0 3,6 4,0 3,9 4,6 2,6 2,9 3,6
Sebastián Cuadros D. 1,0 2,3 1,8 2,6 3,5 2,4 4,0 2,8
María J. Pérez M. 2,6 3,4 4,3 5,0 3,6 3,0 3,6 4,0
Isabella Yale L. 3,0 2,8 3,9 4,2 3,6 4,0 4,6 2,5
Alexandra Malla O. 3,9 4,2 3,4 4,0 4,6 3,9 3,5 4,0
Uriel A. Cuadros M. 3,0 3,0 3,6 2,8 3,2 3,4 3,7 4,0
Iban Ruiz R. 1,6 2,8 3,0 2,0 3,4 3,4 2,5 1,8
Melanie Cardina A. 2,0 2,6 2,9 3,5 2,4 3,2 2,6 3,9
Obtener la moda, mediana y promedio del curso. Para ello debe realiza
una tabla de frecuencia con la información suministrada. Luego dibuja
un diagrama de barras para el curso y otro para cada estudiante. Según
el diagrama de barras, ¿cuáles son los estudiantes que perdieron el
30
primer periodo, si para perderlo se necesita perder al menos 2 materias?
¿La moda, mediana y promedio son iguales? ¿Qué estudiante o
estudiantes ganan estímulos? Nota: Para ganar estímulo el estudiante
no debe de tener
CUARTILES
Los cuartiles son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil
es precisamente la mediana. El primer cuartil, es el valor en el cual o
por debajo del cual queda un cuarto (25%) de todos los valores de la
31
sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo
del cual quedan las tres cuartas partes (75%) de los datos.
Datos Agrupados
32
Fórmula de Q2, para series de Datos agrupados:
Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida
solicitada.
Ic = intervalo de clase
• El tercer cuartil Q3, es el menor valor que es mayor que tres
cuartas partes de los datos, es decir aquel valor de la variable que
supera al 75% y es superado por el 25% de las observaciones.
Fórmula de Q3, para series de Datos agrupados:
Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida
solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino
casos particulares del percentil, ya que el primer cuartil es el 25%
percentil y el tercer cuartil 75% percentil.
Para Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante
las siguientes fórmulas:
- El primer cuartil:
Cuando n es par:
Cuando n es impar:
Cuando n es impar:
33
DECILES
k= 1, 2,3,... 9
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil
k.
Fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra fórmula para calcular los deciles:
• El cuarto decil, es aquel valor de la variable que supera al 40%,
de las observaciones y es superado por el 60% de las observaciones.
34
Fa-1 = frecuencia acumulada anterior a la que contiene la medida
solicitada.
Ic = intervalo de clase.
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante
las siguientes fórmulas:
Cuando n es par:
Cuando n es impar:
Siendo A el número del decil.
CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas más utilizadas para propósitos
de ubicación o clasificación de las personas cuando atienden
características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos
ordenados en cien partes porcentualmente iguales. Estos son los 99
valores que dividen en cien partes iguales el conjunto de datos
ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,...,
percentil 99.
Datos Agrupados
Cuando los datos están agrupados en una tabla de frecuencias, se
calculan mediante la fórmula:
k= 1, 2,3,... 99
Donde:
Lk = Límite real inferior de la clase del decil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil
k.
Fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
35
Otra forma para calcular los percentiles es:
· Primer percentil, que supera al uno por ciento de los valores y es superado por
el noventa y nueve por ciento restante.
Salarios No. De fa
200-299 85 85
300-299 90 175
500-599 70 365
600-699 62 427
700-800 36 463
36
La posición del primer cuartil.
La posición del 7 decil.
La posición del percentil 30.
Entonces,
El primer cuartil:
115.5 – 85 = 30.75
Li = 300, Ic = 100 , fi = 90
El 7 decil:
Posición:
324.1 – 295 = 29.1
Li = 500, fi = 70
El percentil 30
Posición:
138.9 – 85 = 53.9
fi = 90
Estos resultados nos indican que el 25% de los empleados ganan
salarios por debajo de $ 334; que bajo 541.57 gana el 57%de los
empleados y sobre $359.88, gana el 70% de los empleados.
Ejercicios:
3, 5, 2, 7, 6, 4, 9.
3, 5, 2, 7, 6, 4, 9, 1.
10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18
xi fi Fi
37
[10, 15) 12.5 3 3
21
38
RESPUESTA NÚMERO DE FAMILIAS
Si 230
No 56
Está inseguro 85
No responde 160
b.
39
c.
d.
40
Tabla 1: Nacimientos en la primera semana.
Lunes 3 8
Martes 6 1
Miércoles 4 12
Jueves 1 13
Viernes 10 9
Sábado 2 5
Domingo 7 4
Lunes 20 16
Martes 15 5
Miércoles 18 8
Jueves 6 5
Viernes 30 2
Sábado 24 14
Domingo 12 10
3. Con los datos registrados los estudiantes quieren hacer un gráfico comparativo
sobre los nacimientos de hombres durante las dos semanas. ¿Cuál de las
siguientes gráficas representa mejor esta comparación?
Nota: Las columnas azules son los de la primera semana y los de la columna
roja los de la segunda semana.
a.
41
b.
c.
42
d.
43
b.
c.
d.
44
Responda las preguntas de la 7 a 9 de acuerdo a los conceptos básicos dados
inicialmente
7. Es una Variable Cuantitativa Continua:
1) Sexo (M, F).
2) Bebe (no, poco, mucho).
3) Nº muelas cariadas.
4) Temperatura corporal.
5) Raza (blanca, negra, amarilla).
45
1) Sexo (M, F.)
2) Bebe (no, poco, mucho).
3) Nº de dientes cariados.
4) Raza (blanca, negra, amarilla).
5) Ciertas 1, 2, 4.
46
La siguiente tabla muestra el número de cuadras que deben recorrer para llegar a una
escuela los 50 alumnos de 1º básico.
13.
a) ¿Qué significa que la frecuencia del intervalo 11 – 15 sea 7?
b) ¿Cuántos niños deben recorrer entre 21 y 25 cuadras?
c) ¿Qué porcentaje de niños recorre menos de 10 cuadras?
14.
a) ¿Qué porcentaje de niños recorre entre 16 y 30 cuadras?
b) ¿Cuántos niños deben recorrer más de 30 cuadras?
47