Teoria de La Estimación Estadística

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 22

TEORIA DE LA ESTIMACIÓN ESTADÍSTICA

A. CONCEPTOS PREVIOS

1. Parámetro Estadístico

Llamamos parámetro estadístico a cualquier constante o valor θ que se calcula

tomando en consideración a cada uno de los elementos u objetos que

constituyen un universo o población estadística. Es decir, para calcular un

parámetro θ se tiene que hacer un censo estadístico.

Los parámetros son importantes porque constituyen indicadores que se utilizan

para describir un universo estadístico de interés.

2. Estimado de un parámetro

En la gran mayoría de casos se sabe que realizar un censo estadístico es

demasiado costoso, requiere de mucho tiempo y el trabajo necesario para

procesar toda la información recogida es demasiado voluminoso; por lo que

podríamos decir que calcular un parámetro θ resulta caro, trabajoso y se pierde

mucho tiempo.

Debido a estas evidentes desventajas es preferible tomar una muestra del

universo de interés y con ella procurar calcular un valor θ^ que se aproxime al

parámetro θ.

En este caso decimos que θ^ es un estimado (aproximado) de θ.

Este estimado θ^ tiene la propiedad de que se acerca o aproxima al verdadero

parámetro θ cuanto más grande es la muestra tomada del universo estadístico

de quien deseamos calcular su parámetro θ.

Ejemplo 1:

Cierto distrito de una provincia tiene N=100000 ciudadanos. Supongamos que

un político X desea postular a la alcaldía de este distrito, para lo cual estaría

interesado en medir sus posibilidades de ser elegido. Un indicador de sus

1
posibilidades seria P= porcentaje de los 100000 ciudadanos que estarían aptos

de apoyarlo con sus votos. Es obvio que para calcular exactamente el valor

que adoptaría al parámetro P se tendría que preguntar a cada una de los

N=100000 ciudadanos si estarían prestos a apoyarlo con sus votos, lo cual no

seria práctico por las consideraciones económicas, de tiempo y volumen de

trabajo que antes hemos visto. ¿Entonces qué hacer?

Lo más práctico es consultarle solo a una muestra de n ciudadanos, digamos

que a 500 y de ellos supongamos que 125 respondieron que si estarían de

acuerdo en apoyarlo con sus votos para la alcaldía, entonces un estimado

125
(aproximado) es ^p= x 100 %=25 %; es decir, de cada 100 ciudadanos 25
500

lo apoyarían aproximadamente.

Pero, ahora supongamos que se consultó a una muestra de n=1000

ciudadanos, entre los cuales respondieron en apoyarlo 220 ciudadanos, con lo

^220
cual el nuevo estimado seria p=¿ x 100 %=22 % ¿ .
1000

Ahora bien, de los 2 estimados hallados, ¿Cuál es mejor o más creíble?

La teoría estadística nos dice que es mejor aquel que ha sido calculado con

una muestra más grande, en el sentido de que hay una mayor posibilidad de

que está más cerca o más próximo al verdadero parámetro de interés, aún

cuando no lo conozcamos.

En relación al ejemplo 1, responder las siguientes preguntas:

¿Cuál es el universo estadístico?

Los 100000 mil ciudadanos

¿Cuáles son las muestras?

2
500- 1000

De los 2 estimados hallados para P, ¿Cuál es mejor? ¿Y por qué?

La segunda muestra del 22% porque ha sido calculado con una muestra mas

grande

Si, a partir de una muestra de 1200 ciudadanos se ha calculado que ^p es 23%,

ahora de los 3 estimados, ¿Cuál es mejor? ¿y por qué?

El 23% es mas creíble porque a sido calculado con una muestra mas grande

de 1200 ciudadanos

Completa la siguiente frase: “Parámetro es a universo como su estimado es a

muestra”.

3. FORMAS DE ESTIMAR UN PARÁMETRO ESTADÍSTICO

Hay 2 formas de estimar un parámetro, la estimación por punto y la estimación

por intervalo.

3.1 ESTIMADOS POR PUNTO

Sea X una variable estadística considerada en un universo estadístico. Para

hallar el estimado por punto, de un parámetro cualquiera ligado a esta variable

y a este universo, primero tomamos una muestra de este universo y con ella

registramos los valores x1,x2,x3,…xn que adopta la variable X.

Con esta muestra estadística x1,x2,x3,…xn calculamos el estimado o aproximado

del parámetro deseado. El resultado de estos cálculos (estadígrafos) se llama

“estimación por punto” porque precisamente al ser ubicado en una recta

numérica se origina un solo punto.

A continuación en el siguiente cuadro 1 se da el nombre de los principales

parámetros que usamos en estadística , su símbolo que adopta, y los

3
correspondientes estadígrafos que se deben calcular como su estimado o

aproximado.

Cuadro 1: Principales parámetros estadísticos y sus correspondientes

estimados.

Estimados
Parámetros Símbolo
(estadígrafos)
Media Poblacional u X́
Mediana Poblacional Me
~
X
Moda Poblacional Mo Ẋ
Porcentaje Poblacional P ^
P
K-Porcentil Poblacional PK ^
PK
Rango Poblacional R ^
R
Varianza Poblacional ϭ2 S2
Desviación estándar
ϭ S
Poblacional

NOTA: Las fórmulas para calcular los estimados que aparecen en este cuadro, se

hallan en el primer módulo de estadística descriptiva. También se pueden

calcular con el programa SPSS.

Ejemplo 2:

Se quiere estimar el gasto promedio mensual (u) que realizan los estudiantes de

postgrado de la UNJFSC (que son aproximadamente 2000) por concepto de sus

estudios.

Para saber exactamente el valor exacto de u se tendría que preguntar a los 2000

estudiantes ¿Cuánto gastan mensualmente por sus estudios de postgrado? Pero

esto no resultaría práctico, más bien solo seleccionamos al azar una muestra de

N=100 estudiantes (después estudiaremos como seleccionar muestras) y les

preguntamos a estos 100 cuánto gastan mensualmente por sus estudios. De esta

4
manera tendríamos una muestra estadística de 100 datos referidos a los gastos y,

con estos datos calcularíamos el estimado de u; o mejor dicho calcularíamos la

media muestral x́ que es precisamente lo que se indica en el cuadro 1.

Supongamos que la información recogida de los gastos que realizan los 100

estudiantes es como sigue:

CUADRO 1

GASTOS MENSUALES POR ESTUDIOS DE 100 ESTUDIANTES DE POSTGRADO

DE LA UNJFSC

GASTOS (S/.) FRECUENCIA (f)


300-350 12
350-400 23
400-450 30
450-500 21
500-550 14
TOTAL 100

Con estos datos calculamos x́ (para datos agrupados) que es precisamente el

estimado de u: Promedio de gastos realizados por estudios de los 2000 estudiantes de

postgrado de la UNJFSC.

1
x́= ¿
100

¿ S/. 426

Según este resultado, inferimos que el gasto promedio mensual por estudios de los

estudiantes de postgrado asciende aproximadamente a S/. 426. Es necesario resaltar

que en la inferencia que hagamos debe incluirse la palabra “aproximadamente”,

5
porque precisamente eso es lo que es por haber sido calculado en base a una muestra

de 100 estudiantes y no en base a N=2000.

Ejemplo 3:

El diccionario “El pequeño Laraousse” contiene aproximadamente 90 mil palabras. Se

abrió al azar 10 veces el diccionario y se registró el número X de letras que contiene la

primera palabra del extremo superior de la pagina del lado izquierdo y el número de

letras que contiene la primera palabra del extremo derecho superior de la pagina del

lado derecho del diccionario abierto, resultando los siguientes datos:

Lado izquierdo: 14 7 10 4 4 9 10 9 6 10

Lado derecho: 12 8 8 15 9 6 8 9 9 6

Hallar la estimación por punto y luego realizar la inferencia, de los siguientes

parámetros:

a) El número promedio u de letras que contiene las palabras del idioma español.

_______________________________________________________________

b) El porcentaje P de palabras que superan las 10 letras.

_______________________________________________________________

c) El porcentil P25 (Primer Cuartil) del número de letras.

_______________________________________________________________

d) El rango R del número de letras.

_______________________________________________________________

e) ¿Qué acción debemos hacer si deseamos mejorar la aproximación para los

parámetros anteriores?

6
_______________________________________________________________

3.2 ESTIMACIÓN POR INTERVALO

Las posibilidades de que un estimado θ^ coincida exactamente con su parámetro θ

son nulas. En cambio, si determinamos un intervalo numérico en el que estemos

“casi seguros” de que θ se encuentre allí, se dice que hemos estimado a θ por

intervalo. Adrede hemos encomillado las palabras “casi seguros” para indicar que

toda estimación por intervalo incluye una probabilidad alta (al 95% o 99%) para

casi garantizar que allí en ese intervalo se halla el parámetro θ de interés. Decir,

por ejemplo, que existe una probabilidad del 95% de que tal intervalo incluye el

parámetro θ, quiere decir que si determinamos 100 intervalos del mismo tipo para

θ, entonces en promedio 95 de ellos contiene a θ. Tales intervalos son de la forma

K1≤θ≤K2 de tal modo que:

Prob. (K1 ≤ θ ≤ K2) = 95% o 99%

K1 ≤θ ≤ K2 se llama “Intervalo de Confianza” y, la probabilidad 95% o 99% se llaman

“niveles de confianza”. Los extremos K1 y K2 de dicho intervalo se calculan en base a

una muestra de datos con una probabilidad 95% o 99% fijada de antemano.

A continuación, veremos cómo determinar intervalos de confianza para algunos

parámetros de interés.

a) Intervalo de confianza para la media u.

Los extremos del intervalo se calculan del siguiente modo:

7
K 1= X́−E

K 2= X́ + E

Donde:

ts N−n
E=
√n √
.
N
(se llama error de estimación)

X́ : Media muestral

S: Desviación estándar muestral

N : Tamaño del universo

n : Tamaño de la muestra usada para estimar

t : Se lee en función del tamaño n de la muestra y la probabilidad 95% o 99% fijada

de antemano, en la siguiente tabla:

TABLA 1 DE VALORES t

n 5 10 15 20 25 30 35 40 45 50 100 >100
95% 2.78 2.26 2.15 2.09 2.06 2.05 2.03 2.02 2.01 2.00 1.98 1.96
99% 4.60 3.25 2.98 2.86 2.80 2.76 2.73 2.70 2.69 2.68 2.63 2.58

Ejemplo 4:

Un colegio de la localidad tiene 156 docentes entre contratados y nombrados. Cierto

investigador esta interesado en medir el nivel del clima organizacional existente en

dicho colegio bajo la percepción de los docentes. Para esto el investigador selecciona

al azar 30 docentes a quienes les aplicó un cuestionario especial para medir sus

percepciones acerca del clima organizacional de su colegio. Los puntajes observados

por los 30 docentes (a mayor valor mayor nivel del clima organizacional observado)

son los siguientes:

8
32 50 38 84 91 52 63 56 45 54

25 74 48 69 72 76 58 63 55 65

46 65 42 33 60 68 61 76 57 78

A partir de esta muestra de datos estimar por intervalo, con una probabilidad del 95%,

el parámetro u=Nivel promedio del clima organizacional percibido por los 156

profesores del colegio.

Solución:

X́ = 58, 5 (Se calculó con SPSS)

S = 15,8 (Se calculó de SPSS)

N = 156

n = 30

p = 95%

t = 2,05 (Para determinarlo se observa la Tabla 1 de valores t)

Con estos valores calculamos primero E:

2,05(15,8) 156−30
E=
√ 30
.
√ 156

E = 5,3

Luego calculamos los extremos K1 y K2 del intervalo

K1 = 58,5 – 5,3 = 53,2

K2 = 58,5 + 5,3 = 63,8

Entonces el intervalo de confianza donde esta comprendido el nivel promedio u del

clima organizacional percibido por los docentes es:

9
{ 53,2 ≤ u ≤ 63,8}

Este intervalo resultante debe ser interpretado del siguiente modo:

El verdadero nivel promedio u del clima organizacional percibido por los docentes del

colegio se encuentra desde 53,2 puntos hasta 63,8 puntos, inferencia que tiene una

probabilidad del 95% de ser verdadera, para una muestra de 30 docentes.

b) Intervalo de confianza para la Varianza ϭ2

Como se sabe la varianza ϭ2 mide la dispersión o la variabilidad de los datos que

corresponden a una variable numérica X. Cuanto mayor es ϭ 2 significa que los datos

presentan mayor variabilidad y cuanto menor es significa menos variabilidad o

dispersión.

Para estimar ϭ2 por intervalo, calculamos los extremos K1 y K2 del mismo.

( n−1 ) S2
K 1=
X 22

( n−1 ) S2
K 2=
X 21

Donde la varianza muestral S2 lo calculamos con una muestra de tamaño n.

Los valores X2 y X 22 los obtenemos por lectura de la tabla 2 de valores chi cuadrado,

que a continuación se da, en función del tamaño de la muestra n y la probabilidad de

estimación 95% o 99%.

TABLA 2 VALORES CHI CUADRADO AL 95%

10
n 5 10 15 20 25 30 40 50 60 70 80 90 100
X 2
1
0.48 2.70 5.63 8.91 12.4 16. 24.4 32.4 40.5 48. 57.2 65.6 74.2

0 8
X 22 11.14 19.0 26.1 32.8 39.4 45. 59.3 71.4 83.3 95. 106. 118.1 129.6

2 2 5 7 0 6

TABLA 3 DE VALORES CHI CUADRADO AL 99%

n 5 10 15 20 25 30 40 50 60 70 80 90 100
X 2
1
0.21 1.73 4.07 6.84 9.9 13.1 20.7 28.0 35.5 43.3 51.2 59.2 67.3
X 2
2
14.86 23.59 31.32 38.58 45.6 52.3 66.8 79.5 92.0 104.2 116.3 128.3 140.2

Ejemplo 5:

Estimar por intervalo, al 99% de probabilidad, la variabilidad ϭ 2 del nivel del clima

organizacional percibido por los docentes del ejemplo 4.

Solución:

n= 30

S= 15.8 entonces S2 = 249.6

X 21 = 13.1 (Leido en la tabla chi cuadrado al 99%)

X 22 = 52.3 (Leido en la tabla chi cuadrado al 99%)

Luego, calculamos los extremos K1 y K2 :

K1= (30-1) 249.6/52.3 = 138,4 puntos cuadrados

K2= (30-1) 249.6/13.1 = 552,5 puntos cuadrados

Entonces el intervalo de confianza para ϭ2 es {138.4 ≤ ϭ2 ≤ 552.5}

11
El cual se interpreta asi: la verdadera variabilidad ϭ2 de los niveles de clima

organizacional a partir de 138,4 puntos cuadrados hasta 552,5 puntos cuadrados,

inferencia que tiene una probabilidad del 99% de ser cierta, para muestras de tamaño

30.

c) Intervalo de confianza para el parámetro porcentaje P

Los extremos K1 y K2 para el intervalo que contiene a P con una probabilidad

alta (95%;99% o 99.74%) se calculan del siguiente modo:

K1 = ^p – E

K2 = ^p + E

Donde:

^p (i− ^p ) N −n
E=Z
√ n √ .
N
(E se llama error de estimación)

^p= K/n (Es el estimado de P)

K=¿ Número de veces que ocurre algún suceso de interés dentro de la

muestra de tamaño n.

n=¿ Tamaño de muestra que debe ser mayor que 100

N=¿ Tamaño del universo de interés

Z=¿Se lee en la siguiente Tabla

TABLA 4 DE VALORES Z

12
PROBABILIDAD Z

95% 1,96

99% 2,58

99,74% 3,00

Ejemplo 6:

Se requiere estimar por intervalo con una probabilidad 99% el porcentaje P de

familias que están en extrema pobreza en un distrito de la capital que tiene un

universo de 200 mil familias.

Al aplicarse una entrevista a 400 familias se constató que de ellos había 125

familias en extrema pobreza.

Solución:

N= 200 000 familias

n= 400 familias

K= 125 familias en extrema pobreza.

^p= 125/400 = 0,31

Z= 2,58 (leído en la tabla)

(0,31)(0,69) 200 000−400


E=2,58
√ 400 √.
200 000

E= 0,06

Calculando los extremos K1 y K2 :

K1 = 0,31 - 0,06= 0,25 x 100% = 25%

K2= 0,31 + 0,06 = 0,37 x 100% = 37%

Por lo tanto, el intervalo de confianza que resulta es:

{25% ≤ p ≤ 37%}

Cuya interpretación es: la verdadera proporción P de familias en extrema

pobreza en el distrito se encuentra comprendido desde el 25% al 37%,

13
inferencia que tiene una probabilidad del 99% de que sea verdad, para una

muestra de 400 familias.

NOTA: Cuando el tamaño N de un universo estadístico es muy grande y el

N −n
tamaño N de la muestra es pequeña relativamente, entonces el factor
√ N

se puede ignorar en el cálculo de los intervalos de confianza.

Trabajando en equipo:

A una muestra de n=200 mototaxistas se les preguntó acerca de sus ganancias

diarias por el servicio de mototaxis que prestan en el distrito de Huacho y

aledaños. Sus respuestas se tabularon en el siguiente cuadro (se sabe que el

tamaño del universo de mototaxistas es aproximadamente N=7000).

REPORTE DIARIA DE GANANCIAS DE UNA MUESTRA DE 200

MOTOTAXISTAS - HUACHO 2018

Ganancia f F
10-15 7 7
15-20 14 21
20-25 25 46
25-30 41 87
30-35 52 139
35-40 35 174
40-45 21 195
45-50 5 200
TOTAL 200 -

1. Hallar é interpretar la estimación por punto de los siguientes parámetros:

a) El ingreso promedio diario(u) de los 7000 mototaxistas.

b) La variabilidad (ϭ2) de los ingresos diarios de los 7000 mototaxistas.

c) La mediana (Me) de los ingresos diarios de los 7000 mototaxistas.

14
d) El tercer cuartil (Q3) de los ingresos diarios de los 7000 mototaxistas.

2. Hallar e interpretar la estimación por intervalo, al 95% de probabilidad, de

los siguientes parámetros:

a) El ingreso promedio diario(u) de los 7000 mototaxistas.

b) La variabilidad (ϭ2) de los ingresos diarios de los 7000 mototaxistas.

c) El porcentaje P de mototaxistas que ganan menos de S/. 30 diarios.

d) El porcentaje P de mototaxistas que ganan un mínimo de S/. 40 diarios.

4. Cálculo del tamaño n de una muestra

En toda investigación por muestreo estadístico se tiene que fijar primero el

tamaño n óptimo de la muestra que se requiere utilizar, para luego obtener la

muestra deseada.

Por lo común, el tamaño n de una muestra se calcula en función a ciertos

requerimientos del investigador, tales como:

a) El tipo de parámetro que deseamos estimar, porque las fórmulas de cálculo

varían de un tipo a otro.

b) El error E con que se desea estimar un parámetro. Se sabe que el error E y

el tamaño n están en relación inversamente proporcional; es decir, a menos

error E más grande n y viceversa.

c) La varianza ϭ2 (o su estimado S2) que se utilizará para calcular n. Se sabe

que ϭ2 y n están en relación directamente proporcional; esto es, cuanto más

pequeña es ϭ2(o S2) más pequeña será N, y viceversa.

d) Fijar la probabilidad (95% o 99%) con que se quiere estimar, para luego

hallar por lectura de las tablas dadas anteriormente los valores que se

requieren en la fórmula para calcular n.

15
e) El número de parámetros que se va a estimar a partir de una sola muestra

física. En muchos casos a partir de una sola muestra física se tiene que

registrar diversos datos para diferentes variables (es el caso de las encuestas)

las mismas que tienen diferentes parámetros para cuyos estimados se

requieren tamaños diferentes de muestras. En estos casos, se debe trabajar

con el tamaño máximo de los otros tamaños.

f) La exigencia de una exactitud al estimarse un parámetro. Esta exactitud se

mide con el error E que debe fijarlo el investigador. A mayor exactitud exigida

(menor valor de E) mayor es el tamaño de la muestra.

g) El presupuesto económico que se tiene para recoger la muestra. Muchas

veces el investigador tiene que decidir entre exactitud de estimación y el

presupuesto que se tiene. Recuérdese que a mayor exactitud de estimación

(menor valor de E) mayor es el tamaño n de la muestra y, a mayor tamaño de n

se requiere más presupuesto. Entonces, en estos casos, el investigador debe

de evaluar los costos y beneficios y llegar a una buena decisión.

A continuación, veremos distintas formas de calcular el tamaño n de una

muestra

en función a los requerimientos vistos anteriormente.

4.1 Cálculo de n para estimar la media poblacional u, para universos

infinitos o muy grandes o para muestreos con reposición.

Caso 1:

Se conoce la varianza poblacional ϭ2 por antecedentes o experiencias

anteriores:

n= ( ZE ) ϭ
2 2

16
Z: Se obtiene en la tabla 4, en función de la probabilidad o nivel de confianza

(95% 0 99%) .

Caso 2:

No se conoce la varianza poblacional ϭ2 , en su lugar se utiliza su

estimado S2 calculado a partir de una muestra pequeña y provisional

(muestra piloto) de tamaño N0.

n= ( Et ) S
2 2

t= se obtiene en la tabla 1, en función del tamaño provisional N0.

4.2 Cálculo de n para estimar la media poblacional u para universos

finitos de tamaño N y muestreos sin reposición.

Caso 1: Cuando se conoce ϭ2

n0
n=
n0
1+
N

n0= (Z/E)2 ϭ2

Z= Se lee en la tabla 4

Caso 2: No se conoce ϭ2, se conoce su estimado S2 calculado con una

muestra piloto.

N0
n=
1+ N 0
N

n0 = ( Et ) S
2 2

t = Se obtiene de la tabla 1 en función del tamaño de la muestra piloto.

17
4.3 Cálculo secuencial de n para estimar la media poblacional u cuando

no se conoce la varianza poblacional ϭ2 (criterio de Einstein).

Esta forma de calcular n permite ahorrar tiempo y costos en la operación de

muestreo. Se trata de ir aumentando poco a poco la muestra y en cada paso

evaluar el error E observado. Si este error no sobrepasa al error E fijado por el

investigador, entonces se queda con el tamaño utilizado hasta ese momento,

caso contrario se incrementa otro poco la muestra anterior. Los pasos son:

i) Se fija el error E y la probabilidad de estimación (95% o 99%)

ii) Se toma una pequeña muestra de tamaño n1 y se calcula su desviación S1,

con estos valores se calcula el error E1 :

tS 1
E 1= ; con t leído en la tabla 1
√ n1

Si, E1 ≤ E, entonces es suficiente el tamaño n1

Si, E > E; entonces se corre al siguiente paso.

iii) Se toma otra muestra de tamaño n 2 y se junta con la muestra de tamaño n 1.

Se calcula la desviación S2 con la muestra conjunta de tamaño n 1 + n2 , y luego

se calcula el nuevo error E2:

tS 2
E 2= ; con t leído en la Tabla 1 en función a n1 + n2
√ n1 +n2

Si, E2 ≤ E; entonces es suficiente el tamaño N1 + N2

Si, E2 > E; entonces se toma otra muestra de tamaño n3 y se prosigue con los

pasos, hasta lograr que el error calculado no sobrepase al error E fijado.

18
4.4 Cálculo de N para estimar el porcentaje P poblacional

CASO 1: Para universos infinitos o muy grandes.

1 Z
n= ( )
4 E
2

Z= Se lee en la Tabla 4

CASO 2: Para universos finitos de tamaño N.

N0
n=
N0
1+
E

1 Z 2
n0 = ( )
4 E
; Z se lee en la tabla 4.

NOTA:

Los errores E fijado previamente para calcular n se dan en las mismas unidades en

que están expresadas el parámetro que se quiere estimar.

Ejemplos:

1. A cuántas familias se tendrá que encuestar para estimar el ingreso promedio

mensual de las familias de un centro poblado que tiene 1350 familias, con una

probabilidad del 95%, con un error E= s/. 10. Una muestra piloto de n=50 familias

arrojó una varianza S2=1657 soles cuadrados.

19
Solución:

Este problema corresponde al caso expuesto en el punto 4.2; es decir debemos usar

la fórmula:

n0
n=
n0
1+
N

Con:

N= 1350 familias

E= S/. 10

S2= 1657 soles cuadrados

t = 2,01; leído en la tabla 1 en función a la probabilidad 95% y al tamaño n =50

2,01 2
n0 = ( )10
1657=70

70
n= =67
70
1+
1350

Rpta: Se tiene que encuestar a 67 familias, pero como ya se había recogido datos con

una muestra piloto de n=50, entonces habrá que encuestar a 67-50=17 familias más.

2. Cierta empresa tiene 2512 empleados. Se requiere estimar el porcentaje P de

empleados que opinan a favor de las nuevas políticas laborales del directorio de la

empresa. La estimación se requiere hacer con un error del 5%, con una probabilidad

del 99%, ¿A cuántos empleados se deberá entrevistar?

Solución:

20
El problema corresponde al caso expuesto en el punto 4.4

N= 2512 empleados

E= 5% = 0,05

Z= 2,58; leído en la tabla 4 para una probabilidad del 99%

1 2.58 2
n0 = ( )
4 0,05
=665

665
n= =526 empleados
665
1+
2512

Rpta: Se deberá entrevistar a 526 empleados

3. La gerencia de la empresa del problema anterior piensa que entrevistar a 526

empleados hará perder mucho tiempo y que puede ser costosa; razón por la cual

decide fijar el error E en el 10% y una nueva probabilidad del 95%. ¿Ahora, a cuántos

empleados deberá entrevistarse?

Solución:

1 1,96 2
N= 2512 empleados n0 = ( )
4 0,10
=96

E= 10%= 0,10

96
n= =92
Z=1,96 96
1+
2512

Rpta: Se deberá entrevistar solo a 92 empleados. Obsérvese que a menos exigencias

en los requerimientos el tamaño de la muestra disminuye.

Trabajando en Equipo

21
1. Un equipo de psicólogos y educadores desean estimar el porcentaje P de niños,

entre 5 y 10 años; que presentan ciertos niveles de estrés debido al confinamiento en

sus hogares por la pandemia ocasionada por el Covid-19. ¿A cuántos niños deberá de

aplicarse un Test especial para medir el estrés si la estimación desea hacerse con una

probabilidad del 95% y un error del 5%, si el universo de niños es de tamaño N= 4853.

Sug: Aplicar el caso 2 de la sección 4.4

2. Cierta empresa encuestado es contratado para medir el porcentaje P de electores

que tienen preferencia por cierto candidato potencial para las elecciones

presidenciales en nuestro país. Esta empresa acostumbrada usar un error del 3,5%

con una probabilidad del 95%. ¿A cuántos electores deberá de aplicarse la encuesta

de sondeo electoral?

Sug: Aplicar el caso 1 de la sección 4.4

3. Se requiere estimar el nivel promedio u de azúcar (gr/cm 3) hallado en pacientes

diabéticos, después de habérseles administrado un nuevo medicamento para rebajar

los niveles de azúcar, con una probabilidad del 95% y con un error E=0,025 gr/cm 3.

Como quiera que éste experimento resulta caro, se tomó una muestra provisional de 5

pacientes a quienes se les administró el nuevo medicamento y, después de una hora

se les midió el nivel de azúcar, cuyos datos así recolectados arrojaron una desviación

estándar de S= 0,018 gr/cm3. ¿Es suficiente la muestra provisional de tamaño n= 5

pacientes, para cumplir con las exigencias del muestreo o es que acaso deberá de

aumentarse este tamaño?

Sug: Aplicar el caso expuesto en la sección 4.3

22

También podría gustarte