Teoria de La Estimación Estadística
Teoria de La Estimación Estadística
Teoria de La Estimación Estadística
A. CONCEPTOS PREVIOS
1. Parámetro Estadístico
2. Estimado de un parámetro
mucho tiempo.
parámetro θ.
Ejemplo 1:
1
posibilidades seria P= porcentaje de los 100000 ciudadanos que estarían aptos
de apoyarlo con sus votos. Es obvio que para calcular exactamente el valor
125
(aproximado) es ^p= x 100 %=25 %; es decir, de cada 100 ciudadanos 25
500
lo apoyarían aproximadamente.
^220
cual el nuevo estimado seria p=¿ x 100 %=22 % ¿ .
1000
La teoría estadística nos dice que es mejor aquel que ha sido calculado con
una muestra más grande, en el sentido de que hay una mayor posibilidad de
que está más cerca o más próximo al verdadero parámetro de interés, aún
cuando no lo conozcamos.
2
500- 1000
La segunda muestra del 22% porque ha sido calculado con una muestra mas
grande
El 23% es mas creíble porque a sido calculado con una muestra mas grande
de 1200 ciudadanos
muestra”.
por intervalo.
y a este universo, primero tomamos una muestra de este universo y con ella
3
correspondientes estadígrafos que se deben calcular como su estimado o
aproximado.
estimados.
Estimados
Parámetros Símbolo
(estadígrafos)
Media Poblacional u X́
Mediana Poblacional Me
~
X
Moda Poblacional Mo Ẋ
Porcentaje Poblacional P ^
P
K-Porcentil Poblacional PK ^
PK
Rango Poblacional R ^
R
Varianza Poblacional ϭ2 S2
Desviación estándar
ϭ S
Poblacional
NOTA: Las fórmulas para calcular los estimados que aparecen en este cuadro, se
Ejemplo 2:
Se quiere estimar el gasto promedio mensual (u) que realizan los estudiantes de
estudios.
Para saber exactamente el valor exacto de u se tendría que preguntar a los 2000
esto no resultaría práctico, más bien solo seleccionamos al azar una muestra de
preguntamos a estos 100 cuánto gastan mensualmente por sus estudios. De esta
4
manera tendríamos una muestra estadística de 100 datos referidos a los gastos y,
Supongamos que la información recogida de los gastos que realizan los 100
CUADRO 1
DE LA UNJFSC
postgrado de la UNJFSC.
1
x́= ¿
100
¿ S/. 426
Según este resultado, inferimos que el gasto promedio mensual por estudios de los
5
porque precisamente eso es lo que es por haber sido calculado en base a una muestra
Ejemplo 3:
primera palabra del extremo superior de la pagina del lado izquierdo y el número de
letras que contiene la primera palabra del extremo derecho superior de la pagina del
Lado izquierdo: 14 7 10 4 4 9 10 9 6 10
Lado derecho: 12 8 8 15 9 6 8 9 9 6
parámetros:
a) El número promedio u de letras que contiene las palabras del idioma español.
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
_______________________________________________________________
parámetros anteriores?
6
_______________________________________________________________
“casi seguros” de que θ se encuentre allí, se dice que hemos estimado a θ por
intervalo. Adrede hemos encomillado las palabras “casi seguros” para indicar que
toda estimación por intervalo incluye una probabilidad alta (al 95% o 99%) para
casi garantizar que allí en ese intervalo se halla el parámetro θ de interés. Decir,
por ejemplo, que existe una probabilidad del 95% de que tal intervalo incluye el
parámetro θ, quiere decir que si determinamos 100 intervalos del mismo tipo para
una muestra de datos con una probabilidad 95% o 99% fijada de antemano.
parámetros de interés.
7
K 1= X́−E
K 2= X́ + E
Donde:
ts N−n
E=
√n √
.
N
(se llama error de estimación)
X́ : Media muestral
TABLA 1 DE VALORES t
n 5 10 15 20 25 30 35 40 45 50 100 >100
95% 2.78 2.26 2.15 2.09 2.06 2.05 2.03 2.02 2.01 2.00 1.98 1.96
99% 4.60 3.25 2.98 2.86 2.80 2.76 2.73 2.70 2.69 2.68 2.63 2.58
Ejemplo 4:
dicho colegio bajo la percepción de los docentes. Para esto el investigador selecciona
al azar 30 docentes a quienes les aplicó un cuestionario especial para medir sus
por los 30 docentes (a mayor valor mayor nivel del clima organizacional observado)
8
32 50 38 84 91 52 63 56 45 54
25 74 48 69 72 76 58 63 55 65
46 65 42 33 60 68 61 76 57 78
A partir de esta muestra de datos estimar por intervalo, con una probabilidad del 95%,
el parámetro u=Nivel promedio del clima organizacional percibido por los 156
Solución:
N = 156
n = 30
p = 95%
2,05(15,8) 156−30
E=
√ 30
.
√ 156
E = 5,3
9
{ 53,2 ≤ u ≤ 63,8}
El verdadero nivel promedio u del clima organizacional percibido por los docentes del
colegio se encuentra desde 53,2 puntos hasta 63,8 puntos, inferencia que tiene una
corresponden a una variable numérica X. Cuanto mayor es ϭ 2 significa que los datos
dispersión.
( n−1 ) S2
K 1=
X 22
( n−1 ) S2
K 2=
X 21
Los valores X2 y X 22 los obtenemos por lectura de la tabla 2 de valores chi cuadrado,
10
n 5 10 15 20 25 30 40 50 60 70 80 90 100
X 2
1
0.48 2.70 5.63 8.91 12.4 16. 24.4 32.4 40.5 48. 57.2 65.6 74.2
0 8
X 22 11.14 19.0 26.1 32.8 39.4 45. 59.3 71.4 83.3 95. 106. 118.1 129.6
2 2 5 7 0 6
n 5 10 15 20 25 30 40 50 60 70 80 90 100
X 2
1
0.21 1.73 4.07 6.84 9.9 13.1 20.7 28.0 35.5 43.3 51.2 59.2 67.3
X 2
2
14.86 23.59 31.32 38.58 45.6 52.3 66.8 79.5 92.0 104.2 116.3 128.3 140.2
Ejemplo 5:
Estimar por intervalo, al 99% de probabilidad, la variabilidad ϭ 2 del nivel del clima
Solución:
n= 30
11
El cual se interpreta asi: la verdadera variabilidad ϭ2 de los niveles de clima
inferencia que tiene una probabilidad del 99% de ser cierta, para muestras de tamaño
30.
K1 = ^p – E
K2 = ^p + E
Donde:
^p (i− ^p ) N −n
E=Z
√ n √ .
N
(E se llama error de estimación)
muestra de tamaño n.
TABLA 4 DE VALORES Z
12
PROBABILIDAD Z
95% 1,96
99% 2,58
99,74% 3,00
Ejemplo 6:
Al aplicarse una entrevista a 400 familias se constató que de ellos había 125
Solución:
n= 400 familias
E= 0,06
{25% ≤ p ≤ 37%}
13
inferencia que tiene una probabilidad del 99% de que sea verdad, para una
N −n
tamaño N de la muestra es pequeña relativamente, entonces el factor
√ N
Trabajando en equipo:
Ganancia f F
10-15 7 7
15-20 14 21
20-25 25 46
25-30 41 87
30-35 52 139
35-40 35 174
40-45 21 195
45-50 5 200
TOTAL 200 -
14
d) El tercer cuartil (Q3) de los ingresos diarios de los 7000 mototaxistas.
muestra deseada.
d) Fijar la probabilidad (95% o 99%) con que se quiere estimar, para luego
hallar por lectura de las tablas dadas anteriormente los valores que se
15
e) El número de parámetros que se va a estimar a partir de una sola muestra
física. En muchos casos a partir de una sola muestra física se tiene que
registrar diversos datos para diferentes variables (es el caso de las encuestas)
mide con el error E que debe fijarlo el investigador. A mayor exactitud exigida
muestra
Caso 1:
anteriores:
n= ( ZE ) ϭ
2 2
16
Z: Se obtiene en la tabla 4, en función de la probabilidad o nivel de confianza
(95% 0 99%) .
Caso 2:
n= ( Et ) S
2 2
n0
n=
n0
1+
N
n0= (Z/E)2 ϭ2
Z= Se lee en la tabla 4
muestra piloto.
N0
n=
1+ N 0
N
n0 = ( Et ) S
2 2
17
4.3 Cálculo secuencial de n para estimar la media poblacional u cuando
caso contrario se incrementa otro poco la muestra anterior. Los pasos son:
tS 1
E 1= ; con t leído en la tabla 1
√ n1
tS 2
E 2= ; con t leído en la Tabla 1 en función a n1 + n2
√ n1 +n2
Si, E2 > E; entonces se toma otra muestra de tamaño n3 y se prosigue con los
18
4.4 Cálculo de N para estimar el porcentaje P poblacional
1 Z
n= ( )
4 E
2
Z= Se lee en la Tabla 4
N0
n=
N0
1+
E
1 Z 2
n0 = ( )
4 E
; Z se lee en la tabla 4.
NOTA:
Los errores E fijado previamente para calcular n se dan en las mismas unidades en
Ejemplos:
mensual de las familias de un centro poblado que tiene 1350 familias, con una
probabilidad del 95%, con un error E= s/. 10. Una muestra piloto de n=50 familias
19
Solución:
Este problema corresponde al caso expuesto en el punto 4.2; es decir debemos usar
la fórmula:
n0
n=
n0
1+
N
Con:
N= 1350 familias
E= S/. 10
2,01 2
n0 = ( )10
1657=70
70
n= =67
70
1+
1350
Rpta: Se tiene que encuestar a 67 familias, pero como ya se había recogido datos con
una muestra piloto de n=50, entonces habrá que encuestar a 67-50=17 familias más.
empleados que opinan a favor de las nuevas políticas laborales del directorio de la
empresa. La estimación se requiere hacer con un error del 5%, con una probabilidad
Solución:
20
El problema corresponde al caso expuesto en el punto 4.4
N= 2512 empleados
E= 5% = 0,05
1 2.58 2
n0 = ( )
4 0,05
=665
665
n= =526 empleados
665
1+
2512
empleados hará perder mucho tiempo y que puede ser costosa; razón por la cual
decide fijar el error E en el 10% y una nueva probabilidad del 95%. ¿Ahora, a cuántos
Solución:
1 1,96 2
N= 2512 empleados n0 = ( )
4 0,10
=96
E= 10%= 0,10
96
n= =92
Z=1,96 96
1+
2512
Trabajando en Equipo
21
1. Un equipo de psicólogos y educadores desean estimar el porcentaje P de niños,
sus hogares por la pandemia ocasionada por el Covid-19. ¿A cuántos niños deberá de
aplicarse un Test especial para medir el estrés si la estimación desea hacerse con una
probabilidad del 95% y un error del 5%, si el universo de niños es de tamaño N= 4853.
que tienen preferencia por cierto candidato potencial para las elecciones
presidenciales en nuestro país. Esta empresa acostumbrada usar un error del 3,5%
con una probabilidad del 95%. ¿A cuántos electores deberá de aplicarse la encuesta
de sondeo electoral?
los niveles de azúcar, con una probabilidad del 95% y con un error E=0,025 gr/cm 3.
Como quiera que éste experimento resulta caro, se tomó una muestra provisional de 5
se les midió el nivel de azúcar, cuyos datos así recolectados arrojaron una desviación
pacientes, para cumplir con las exigencias del muestreo o es que acaso deberá de
22