Unidad II 10abr2024 Ejercicios

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 74

Unidad II: Teoría del muestreo y estimaciones

ESTADÍSTICA INFERENCIAL APLICADA

M.A. Ivet del Rocío Linares García

Universidad de San Martin de Porres - USMP

0 / 60
Contenido

1. Teoría del muestreo

2. Estimaciones puntuales y por intervalo para variables


cuantitativas

3. Estimaciones puntuales y por intervalo para variables


cualitativas

1 / 60
1. Teoría del muestreo

1. Teoría del muestreo 2 / 60


1. Teoría del muestreo

▶ La población es el conjunto de todos los elementos de interés


en un estudio determinado.
▶ La muestra es un subconjunto de la población.
▶ El resultado de observar o medir una característica de un ele-
mento de la población, se denomina dato u observación.
▶ Una variable es una característica de los elementos de una
población. Dicha característica debe ser factible de medirse u
observarse.

1. Teoría del muestreo 3 / 60


Población y muestra

Población: El conjunto de todos los alumnos universitarios.


Unidad estadística: Alumnos universitarios.
Muestra: El conjunto de los alumnos de la USMP, el conjunto de
alumnos del curso de Uso de Probabilidad.
Variables: Edad, sexo, ciclo, promedio ponderado, ingresos, etc.

1. Teoría del muestreo 4 / 60


Marco Muestral

¿Qué es un Marco Muestral?


▶ Lista de los elementos o grupos de elementos desde la cual, la
muestra es seleccionada.
▶ Sin ellos es muy difícil poder utilizar un muestreo probabilístico.
▶ También forman parte de él: mapas, direcciones, información
auxiliar.

Por ejemplo: Guía telefónica, lista de empresas o locales productivos,


listado de viviendas, listado de pacientes dentro de un hospital, etc.

1. Teoría del muestreo 5 / 60


Marco Muestral

¿Por qué es tan importante?


Porque de el depende:
▶ La población que realmente se va a estudiar y sobre la que se
va hacer inferencia.
▶ El tipo de diseño muestral a emplear.
▶ Del tipo de unidad que se va a muestrear.
▶ De como se va a llegar a la población.
▶ El tipo de procedimiento de estimación para obtener los resul-
tados.

1. Teoría del muestreo 6 / 60


Tipo de errores muestrales
Errores muestrales

▶ Es el error que surge por estudiar a una parte de la población.


▶ Su magnitud es desconocida y por lo tanto imposible de calcular.
▶ Se sabe que disminuye cuando aumenta el tamaño de la muestra, que
depende del diseño aplicado y del estimador empleado.
▶ Si la muestra está diseñada de forma probabilística es posible controlar
su magnitud y dar una estimación del mismo.
▶ Tanto la varianza como la desviación estándar lo cuantifican pero no
son las únicas medidas que lo hacen.

Errores no muestrales

▶ Otros errores ajenos al muestreo: no respuesta, codificación, encues-


tador, encuestado, lógico, etc.
▶ No disminuyen cuando el tamaño de la muestra aumenta.
▶ Muy pero muy difíciles de medir.
1. Teoría del muestreo 7 / 60
Parámetros poblacionales

▶ Es una medida resumen de una característica o atributo medido


sobre la población objetivo, o sea, θ = f (y1 , y2 , ..., yN )
▶ Es una magnitud fija y desconocida.
▶ Es descriptivo de la población en cuestión.
▶ Tiene sentido práctico y estadístico
▶ Algunos ejemplos:
▶ Total poblacional
▶ Media poblacional
▶ Un parámetro puede ser función de valores de 2 o más variables,
por ejemplo, la razón entre los totales poblacionales y y z.

P
ty Yk
θ= = PU
tz U Zk

1. Teoría del muestreo 8 / 60


Estimador (o estadístico)
▶ Llamaremos θ̂ = θ̂(S) al estimador de θ.
▶ Es una formulación algebraíca aplicable a la muestra que trata de
dar respuesta sobre un parámetro, o sea, θ̂ = g(yi1 , yi2 , ...., yin ).
▶ Existen infinitos estimadores para cualquier parámetro.

Distribución muestral del estimador

▶ Para cada muestra posible se origina una estimación y estos val-


ores permiten definir la distribución muestral o probabilística del es-
timador.
▶ La distribución muestral de un estimador me va permitir:
▶ Conocer sus propiedades.
▶ Fijar criterior comparativos entre distintos estimadores.
▶ Evaluar su precisión y su exactitud.
▶ Determinar si es adecuado o no para un diseño muestral
específico.
▶ Calcular el tamaño de una muestra (con otros insumos).
1. Teoría del muestreo 9 / 60
Muestreo aleatorio

En el muestreo aleatorio todos los elementos tienen la misma proba-


bilidad de ser elegidos. Los individuos que formarán parte de la mues-
tra se elegirán al azar mediante números aleatorios. El muestreo
aleatorio puede realizarse de distintas maneras, las más frecuentes
son el sistemático, el estratificado y el muestreo por conglomerados.

1. Teoría del muestreo 10 / 60


Tipos de muestreo
Muestreo simple al azar

▶ Es aquella que para un tamaño dado todas las muestras posibles del marco
tienen la misma posibilidad de ser seleccionadas.
▶ Esto permite que cada miembro de la población tenga igual chance o prob-
abilidad de ser incluido en una muestra.
▶ Probabilidades de inclusión iguales para todos.
▶ Bajo el muestreo simple al azar, cada muestra s de tamaño n tiene la misma
probabilidad de selección:

 1
si s es de tamaño n
Pd (s) = (Nn )
0 en otro caso

▶ La probabilidad de inclusión de primer orden es πk = n


N
= f ∀k ∈ U,
donde f se denomina fracción de muestreo.
n(n−1)
▶ La probabilidad de inclusión de segundo orden es πk = N(N−1)
∀k ̸= I, k ∧
I∈U

1. Teoría del muestreo 11 / 60


Determinación del tamaño de muestra

▶ De que depende el tamaño de muestra?


▶ De los recursos y del presupuesto.
▶ Del tipo de población en estudio.
▶ Del tipo de variable bajo estudio (cuantitativa o atributo)
▶ Del grado de homogeneídad de la misma en la población.
▶ Del diseño muestral empleado.
▶ Del tipo de estimador a emplear.
▶ Elementos necesarios para determinar el tamaño
▶ Margen de error.
▶ Nivel de confianza.
▶ Magnitud de la dispersión de la variable en estudio.

1. Teoría del muestreo 12 / 60


Caclulo del tamaño de la muestra
▶ Para la estimación de una media poblacional:

z 2S 2
n0 =
c2

▶ Para la estimación de una proporción poblacional:

z 2 pq
n0 =
c2

▶ En ambos casos, si n0
N no es despreciable, el tamaño difinitivo
es:

n0
n=
1 + nN0

1. Teoría del muestreo 13 / 60


Tamaño de muestra para la estimación de la media
poblacional “u”

(zα/2 )2 σ 2 N
n=
(zα/2 )2 σ 2 + e 2 (N − 1)

n : Tamaño de muestra
N : Tamaño de la población
zα/2 : Valor estándar de Z con nivel de α
e : Precisión o error admitido
σ : Desviación estándar poblacional

1. Teoría del muestreo 14 / 60


Tamaño de muestra para la estimación de la
proporción poblacional “p”

(zα/2 )2 p(1 − p)N


n=
(zα/2 )2 p(1 − p) + e 2 (N − 1)

n : Tamaño de muestra
N : Tamaño de la población
zα/2 : Valor estándar de Z con nivel de α
e : Precisión o error admitido
p : Proporción poblacional de éxito

1. Teoría del muestreo 15 / 60


Margen de error
Son dos números que para un tamaño de muestra y un estimador
dado permiten fijar el porcentaje de muestras (sobre todas las posi-
bles) que brindan estimaciones entre los límites que esos números
definen.

Es la cantidad de error que se espera con un tamaño de muestra y


un diseño dado a cierto nivel de confianza.

1. Teoría del muestreo 16 / 60


Nivel de confianza

Magnitud que señala el porcentaje de muestras sobre las posibles


que brindan estimaciones dentro de los márgenes de error fijados.

el nivel de confianza indica el porcentaje de “muestras buenas” que


nos permitimos.

1. Teoría del muestreo 17 / 60


Grado de homogeneídad

▶ Es la dispersión de la variable en la población.


▶ Es la magnitud que señala cuán diferentes son las unidades de
la población en la variable de estudio.
▶ Varianza, desviación estándar, rango intercuartil, son elementos
que dan idea de esta magnitud.

1. Teoría del muestreo 18 / 60


Muestreo sistemático

En este caso se elige el primer individuo al azar y el resto viene


condicionado por aquél. Este método es muy simple de aplicar en
la práctica y tiene la ventaja de que no hace falta disponer de un
marco de encuesta elaborado.
▶ Un primer elemento es seleccionar al azar, con igual probabili-
dad entre los primeros x elementos del marco muestral.
▶ El número x (entero y positivo) es fijado y se lo denomina
intervalo muestral.
▶ El resto de la muestra es determinada sistematicamente
tomando cada x elementos hasta llegar al final de la lista.
▶ Por lo tanto hay solo x muestras posibles, cada una con prob-
abilidad de selección igual a x1 .

1. Teoría del muestreo 19 / 60


Muestreo estratificado

Se divide la población en grupos en función de un carácter determinado


y después se muestrea cada grupo aleatoriamente, para obtener la parte
proporcional de la muestra.
¿Por qué se estratifica?

▶ Para lograr homogeneídad en las sub poblaciones o estratos y por lo


tanto disminuir la dispersión general de la variable en estudio.
▶ Para lograr mayor precisión en los resultados.
▶ Para disminuir el tamaño de la muestra.
▶ Para brindar estimaciones en las sub poblaciones o estratos más
importantes.
▶ Cuando se requiere incrementar la eficiencia de la muestra por
unidad de costo operativo.

1. Teoría del muestreo 20 / 60


Tamaño de muestra para la estimación de la media
poblacional “u”
Asignación proporcional
Este método de asignación de la muestra a los estratos es llamado asignación propor-
cional por que los tamaños de muestra n1 , n2 , n3 , ...nL son proporcionales a los tamaños
de los estratos N1 , N2 , N3 , ...NL .
B2
D= 4

PL
N σ2
i=1 i i
n= L
1
P
ND + N
N σ2
i=1 i i
!
Ni
ni = n PL
i=1
Ni

n : Tamaño de muestra total


ni : Tamaño de la muestra de cada estrato L
B : Error de estimación
σ 2 : Varianza poblacional
N : Tamaño de la población
1. Teoría del muestreo 21 / 60
Tamaño de muestra para la estimación de la
proporción poblacional “p”
Asignación proporcional
Este método de asignación de la muestra a los estratos es llamado asignación propor-
cional por que los tamaños de muestra n1 , n2 , n3 , ...nL son proporcionales a los tamaños
de los estratos N1 , N2 , N3 , ...NL .
B2
D= 4

PL
i1
Ni p̂i q̂i
n= PL
1
ND + N i=1
Ni p̂i q̂i
!
Ni
ni = n PL
i=1
Ni

n : Tamaño de muestra total


ni : Tamaño de la muestra de cada estrato L
B : Error de estimación
p : Proporción poblacional de éxito
N : Tamaño de la población
1. Teoría del muestreo 22 / 60
Muestreo conglomerado

Se divide la población en varios grupos de características parecidas


entre ellos y luego se analizan completamente algunos de los gru-
pos, descartando los demás. Dentro de cada conglomerado existe
una variación importante, pero los distintos conglomerados son pare-
cidos.

1. Teoría del muestreo 23 / 60


Pruebas paramétricas y no paramétricas

Se le conoce como aquel número determinado de sujetos o cosas que


componen la muestra extraída de una población, necesarios para que
los datos obtenidos sean representativos de la población.
Pruebas paramétricas
Las pruebas paramétricas son una herramienta estadística que se
utiliza para el análisis de los factores de la población. Esta muestra
debe cumplir ciertos requisitos como el tamaño, ya que mientras
más grande sea, más exacto sera el cálculo.
Pruebas no parametricas
Son las que se basan en determinadas hipótesis, pero los datos obser-
vados no tienen una organización normal. Generalmente, las pruebas
no paramétricas contienen resultados estadísticos que provienen de
su ordenación, lo que las vuelve más fáciles de comprender.

1. Teoría del muestreo 24 / 60


2. Estimaciones puntuales y por intervalo
para variables cuantitativas

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 25 / 60
Estimación por intervalos

La estimación por intervalos consiste en establecer el intervalo de


valores donde es más probable se encuentre el parámetro.
µ1 = media poblacional 1
µ2 = media poblacional 2
La diferencia de medias poblacionales es µ1 − µ2
Para estimar µ1 − µ2 ,se calculan las dos medias muestrales x¯1 − x¯2
Estimador puntual de la diferencia entre las dos medias pobla-
cionales

x¯1 − x¯2

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 26 / 60
Error estandar de la diferencia de medias

Cuando se tienen dos muestras aleatorias simples independientes, el


error estándar de x¯1 − x¯2 es el siguiente:
s
σ12 σ22
σx¯1 −x¯2 = +
n1 n2

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 27 / 60
Estimación puntual de la media poblacional

Estimación de la media poblacional

PN
i1 xi
µ=
N
Intervalo de estimación para la media poblacional

σ
x̄ ± zα/2 √
n

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 28 / 60
Estimación por intervalo de la diferencia entre dos
medias poblacionales conocidas

s
σ12 σ22
(x¯1 − x¯2 ) ± zα/2 +
n1 n2

x̄1 y x̄2 : Son las medias muestrales


σ1 y σ2 ; Son las desviaciones estándar

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 29 / 60
Ejemplo para la estimación de intervalo de una
diferencia de medias poblacionales

En una tienda de departamento. De acuerdo con datos de anteriores


estudios demográficos sobre los clientes, las dos desviaciones están-
dar poblacionales se conocen y son σ1 = 9 años y σ2 = 10 años. De
los datos de las dos muestras aleatorias simples independientes de
los clientes de la tienda de departamento se obtuvieron los siguientes
resultados.

Tienda principal Tienda secundaria


Tamaño de la muestra n1 = 36 n2 = 49
Media muestral x̄1 = 40 años x̄2 = 35 años

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 30 / 60
Solución
La diferencia entre las dos medias poblacionales es x̄1 − x̄2 = 40 − 35 = 5
años. Por ende, se estima que, en promedio, los clientes de la tienda
principal son cinco años mayores que los clientes de la tienda secundaria.
Ahora, calculamos el margen de error y se proporciona una estimación por
intervalo de µ1 − µ2 . Si tiene 95% de confianza y zα/2 = z0.025 = 1.96 :
s
σ12 σ2
(x̄1 − x̄2 ) ± zα/2 + 2
n1 n2
r
92 102
(40 − 35) ± 1.96 +
36 49

5 ± 4.06

El margen de error es 4.06 años y la estimación por intervalo de 95% de


confianza va de 5 - 4.06 = 0.94 años a 5 + 4.06 = 9.06 años.
2. Estimaciones puntuales y por intervalo para variables
cuantitativas 31 / 60
Ejercicio 1

Una muestra de 150 bombillas de la marca A mostró un tiempo de


vida media de 1400 horas y una desviación estándar de 120 horas.
Una muestra de 200 bombillas de la marca B mostró un tiempo de
vida media de 1200 horas y una desviación estándar de 80 horas.
Encontrar los limites de confianza de 95%, para la diferencia de los
tiempos de vida media de las poblaciones de la marca A y B.

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 32 / 60
Solución

Marca A Marca B
n1 = 150 bombillas n2 = 200 bombillas
x̄1 = 1400 horas x̄2 = 1200 horas
σ1 = 120 horas σ2 = 80 horas

α = 0.05
s
σ12 σ22
(x̄1 − x̄2 ) ± zα/2 +
n1 n2

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 33 / 60
Solución

s
1202 802
(1400 − 1200) ± 1.96 +
150 200

177.83 ≤ µ1 − µ2 ≤ 222.17

La diferencia de los tiempos de vida de las poblaciones de la marca


A y B oscila entre 177.83 y 222.17 para un nivel de confianza de
95%.

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 34 / 60
Ejercicio 2

El banco del Estado de Río desea estimar la diferencia entre las me-
dias de los saldos de las tarjetas de crédito de dos de sus sucursales.
Una muestra independiente de tarjeta de habitantes generaron los
resultados que aparecen en la siguiente tabla. Determinar un in-
tervalo de confianza de 90% para la diferencia entre medias de los
saldos.

Sucursal 1 Sucursal 2
n1 = 32 n2 = 36
x̄1 = $500 x̄2 = $375
σ1 = $150 σ2 = $130

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 35 / 60
Solución

Sucursal 1 Sucursal 2
Medias 500 375
Desviaciones 150 130
n 32 36

α = 0.1
s
σ12 σ22
(x̄1 − x̄2 ) ± zα/2 +
n1 n2

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 36 / 60
Solución

s
1502 1302
(500 − 375) ± 1.65 +
32 36

68.5 ≤ µ1 − µ2 ≤ 181.5

El intervalo de confianza de 90% para la diferencia entre las medias


de los saldos oscila entre 68.5 y 181.5.

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 37 / 60
Prueba de hipótesis

Ahora se veran las pruebas de hipótesis acerca de la diferencia


entre dos medias poblacionales, D0 denota la diferencia hipotética
entre µ1 y µ2 , las tres formas que pueden tener una prueba de
hipótesis son las siguientes:
H0 : µ 1 − µ 2 ≥ D 0 H0 : µ 1 − µ 2 ≤ D 0 H0 : µ1 − µ2 = D0
Ha : µ 1 − µ 2 < D 0 Ha : µ 1 − µ 2 > D 0 Ha : µ1 − µ2 ̸= D0

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 38 / 60
Estadístico de prueba para prueba de hipótesis

Para µ1 − µ2 : σ1 y σ2 conocidas

(x̄1 − x̄2 ) − D0
z= r
σ12 σ22
n1 + n2

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 39 / 60
Ejemplo

En exámenes estandarizados practicados ya en diversas ocasiones,


siempre se ha obtenido una desviación estándar cercana a 10 puntos.
Por tanto, usará esta información y considerará que las desviaciónes
estándar poblacionales se conocen y que son σ1 = 10 y σ2 = 10.
Para este estudio se especifica un nivel de significancia α = 0.05.
Con muestras aleatorias simples independientes de n1 = 30 individ-
uos del centro de enseñanza A y n2 = 40 individuos del centro de
enseñanza B. Las medias muestrales correspondientes son x̄1 = 82
y x̄2 = 78. ¿Estos datos indican que existen una diferencia significa-
tiva entre las medias poblacionales de los dos centros de enseñanza?.

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 40 / 60
Solución

Para responder esta pregunta se calcula el estadístico de prueba empleando


la siguiente ecuación.

(x̄1 − x̄2 ) − D0 (82 − 78) − 0


z= q 2 2
= q = 1.66
σ1 σ2 102 102
n1 + n2 30 + 40

A continuación se calcula el valor-p de esta prueba de dos colas. Como el


estadístico de prueba z se encuentra en la cola superior, se calcula primero
el área bajo la curva a la derecha de z = 1.66. En la tabla de la distribución
normal estándar, el área a la izquierda de z = 1.66 es 0.9515. Por ende,
el área en la cola superior de la distribución es 1.000 - 0.9515 = 0.0485.
Como es una prueba de dos colas, hay que duplicar el área que queda a la
cola: el valor-p = 2(0.0485) = 0.0970. Como la regla es rechazar H0 si el
valor-p ≤ α , puesto que el valor-p es 0.0970, no se puede rechazar H0 al
nivel de significancia 0.05.

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 41 / 60
Inferencia acerca de la diferencia entre dos medias
poblacionales desconocidas
Estimación por intervalos para la diferencia entre dos medias
poblacionales desconocidas
s
s12 s2
(x̄1 − x̄2 ) ± tα/2 + 2
n1 n2

donde 1 - α es el coeficiente de confianza.


Estadistico de prueba para pruebas de hipótesis
Para µ1 − µ2 : σ1 y σ2 desconocidas

(x̄1 − x̄2 ) − D0
t= r
s12 s22
n1 + n2

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 42 / 60
Ejemplo

El investigador encargado de la evaluación del nuevo software espera


poder demostrar que con el nuevo software se necesita menos tiempo
para el proyecto del sistema de información. De manera que el
investigador tratará de hallar evidencias que le permitan concluir que
µ2 es menor que µ1 , caso en el que la diferencia µ1 - µ2 será mayor
que cero. La hipótesis de investigación µ1 - µ2 > 0 se establece
como la hipótesis alternativa. Por lo que la prueba de hipótesis será
H0 : µ1 − µ2 ≤ 0
Ha : µ1 − µ2 > 0
Como nivel de significancia se usará α = 0.05

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 43 / 60
Ejemplo
Datos:

Software antiguo Software nuevo


300 274
280 220
344 308
385 336
372 198
360 300
288 315
321 258
376 318
290 310
301 332
283 263

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 44 / 60
Resumen Estadístico

Resumen estadístico Software antiguo Software nuevo


Tamaño de la muestra n1 = 12 n2 = 12
Media muestral x̄1 = 325 horas x̄2 = 286 horas
Desviación estándar muestral s1 = 40 s2 = 44

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 45 / 60
Solución

(325 − 286) − 0
t= q = 2.27
402 442
12 + 12

Para calcular los grados de libertad usamos la siguiente fórmula y


reemplazamos:

s2 s22 2 442
( n11 + n2 ) ( 40
12 + 12 )
gl = s12 2 s22 2
= 1 402 2 1 442 2
= 21.8
12−1 ( 12 ) + 12−1 ( 12 )
1 1
n1 −1 ( n1 ) + n2 −1 ( n2 )

Al redondear hacia abajo, se usará una distribución t con 21 grados


de libertad.

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 46 / 60
Solución

Área en la cola superior 0.20 0.10 0.05 0.025


Valor t (21 gl) 0.859 1.323 1.721 2.080

α
Entonces para un valor t (21 gl) y 2 = 0.025 es de 2.080.
En una prueba de la cola superior, el valor-p es el área en la cola
superior a la derecha de t = 2.27. De acuerdo con este resultado
se ve que el valor-p está entre 0.025 y 0.01. Por tanto, el valor-p
es menor que α = 0.05 y se rechaza H0 . Los resultados muestrales
permiten al investigador concluir que µ1 − µ2 > 0, o que µ1 > µ2 .
La investigación favorece la conclusión de que con el nuevo software
el tiempo requerido es menor.

2. Estimaciones puntuales y por intervalo para variables


cuantitativas 47 / 60
3. Estimaciones puntuales y por intervalo
para variables cualitativas

3. Estimaciones puntuales y por intervalo para variables


cualitativas 48 / 60
3. Estimaciones puntuales y por intervalo para
variables cualitativas

Para las inferencias acerca de estas diferencias, se seleccionan


dos muestras aleatorias independientes, una de n1 unidades de la
población 1 y otra de n2 unidades de la población 2.
Inferencia acerca de la diferencia entre dos proporciones pobla-
cionales

p̄1 − p̄2

Como ocurre con otros estimadores puntuales, p̄1 y p̄2 tiene una
distribución muestral que refleja los valores que podría tomar p̄1 y p̄2
si se tomaran repetidas muestras aleatorias simples independientes.

3. Estimaciones puntuales y por intervalo para variables


cualitativas 49 / 60
Error estándar y estimación de intervalos

Error estandar
s
p1 (1 − p1 ) p2 (1 − p2 )
σp̄1 −p̄2 = +
n1 n2

Estimación por intervalo para la diferencia entre dos porpor-


ciones poblacionales
s
p̄1 (1 − p̄1 ) p̄2 (1 − p̄2 )
p̄1 − p̄2 ± zα/2 +
n1 n2

donde 1 - α es el coeficiente de confianza.

3. Estimaciones puntuales y por intervalo para variables


cualitativas 50 / 60
Ejemplo
tenemos los siguintes datos de 2 oficinas en la siguiente tabla.

Oficina 1 Oficina 2
n1 = 250 n2 = 300
Número de declaraciones con Número de declaraciones con
errores = 35 errores = 27

Las proporciones muestrales en cada una de las oficinas son las siguientes.
35
p̄1 = 250 = 0.14
27
p̄2 = 300 = 0.09
La estimación puntual de la diferencia entre las proporciones de declara-
ciones con errores en las dos poblaciones es p1 − p2 = 0.14 − 0.09 = 0.05.
Entonces se estima que la oficina 1 comete 0.05 o 5% más errores que la
oficina 2.

3. Estimaciones puntuales y por intervalo para variables


cualitativas 51 / 60
Ejemplo

Ahora calcularemos la estimación por intervalos, para lo cual reem-


plazamos los datos, con un 90% de confianza.
donde zα/2 = z0.05 = 1.645
s
0.14(1 − 0.14) 0.09(1 − 0.09)
0.14 − 0.09 ± 1.645 +
250 300

0.05 ± 0.045
El margen de error es 0.045 y el intervalo de 90% de confianza es el
intervalo que va de 0.005 a 0.095.

3. Estimaciones puntuales y por intervalo para variables


cualitativas 52 / 60
Prueba de hipótesis acerca de p1 - p2

Ahora se considerarán las pruebas de hipótesis acerca de la diferen-


cia entre las proporciones de dos poblaciones. Se verán pruebas que
comprenden el caso en que no hay diferencia entre las dos propor-
ciones poblacionales. En tal caso, las tres formas de las pruebas de
hipótesis son las siguientes:
H0 : p 1 − p 2 ≥ 0 H0 : p1 − p2 ≤ 0 H0 : p1 − p2 = 0
Ha : p 1 − p 2 < 0 Ha : p1 − p2 > 0 Ha : p1 − p2 ̸= 0

3. Estimaciones puntuales y por intervalo para variables


cualitativas 53 / 60
Error estándar y estimador combinado de p cuando
p1=p2=p

Para p̄1 − p̄2 cuando p̄1 = p̄2 = p


s s
p(1 − p) p(1 − p) 1 1
σp̄1 −p̄2 = + = p(1 − p)( − )
n1 n2 n1 n2

Estimador combiando

n1 p̄1 + n2 p̄2
p̄ =
n1 + n2

El estimador combinado de p es un promedio ponderado de p̄1 y p̄2 .

3. Estimaciones puntuales y por intervalo para variables


cualitativas 54 / 60
Estadístico de prueba para pruebas de hipótesis

(p̄1 − p̄2 )
z=q
p̄(1 − p̄)( n11 + 1
n2 )

Ejemplo
Una empresa que se dedica a elaborar declaraciones de impuestos,
suponga que la empresa desea realizar una prueba de hipótesis para
determinar si las proporciones de errores en las dos oficinas son
diferentes. Para esto, se requiere una prueba de hipótesis de dos
colas. Las hipótesis nula y alternativa son las siguientes:
H0 : p 1 − p 2 = 0
Ha : p1 − p2 ̸= 0

3. Estimaciones puntuales y por intervalo para variables


cualitativas 55 / 60
Ejemplo
Para un nivel de significancia se usará α = 0.10
En los datos muestrales recogidos previamente se encuentra que p̄1 = 0.14
en la muestra de n1 = 250 declaraciones de la oficina 1 y p̄2 = 0.09 en
la muestra de n2 = 300 declaraciones en la muestra de la oficina 2. A
continuación se calculará la estimación combinada de p.

n1 p̄1 + n2 p̄2 250(0.14) + 300(0.09)


p̄ = = = 0.1127
n1 + n2 250 + 300

con la estimación combinada y la diferencia entre las proporciones mues-


trales, se obtienen el valor estadístico de prueba como se indicara a con-
tinuación:

(p̄1 − p̄2 ) (0.14 − 0.09)


z=q =q = 1.85
p̄(1 − p̄)( n11 + 1
n2 )
1
0.1127(1 − 0.1127)( 250 + 1
300 )

3. Estimaciones puntuales y por intervalo para variables


cualitativas 56 / 60
Ejemplo

Para calcular el valor-p para esta prueba de dos colas, se observa,


primero, que z = 1.85 se encuentra en la cola superior de la dis-
tribución normal estándar. A partir de z = 1.85 y la tabla de la
distribución normal estándar, se encuentra que el área en la cola
superior es 1.0000 - 0.9678 = 0.0322. Multiplicando esta área por
dos, dado que se trata de una prueba de dos colas, se encuentra que
el valor-p es 2(0.0322) = 0.0644. Como el valor-p es menor a α =
0.10, se rechaza H0 para el nivel de significancia 0.10.

3. Estimaciones puntuales y por intervalo para variables


cualitativas 57 / 60
Ejercicio

La proporcion de votantes a favor del candidato A es mayor que la


proporción de votantes del candidato B? use 95% de confianza para
responder.
Suponga que en una muestra de 1000 personas, 340 dijeron que
votarían por A. En otra muestra de 1000 personas 450 dijeron que
votarían por B.
Calcular el intervalo de confianza y interprete su respuesta.

3. Estimaciones puntuales y por intervalo para variables


cualitativas 58 / 60
Solución
Calculamos el porcentaje de éxitos en las muestras p1 y p2 :

x1 340
p̂1 = = = 0.34
n1 1000

x2 450
p̂2 = = = 0.45
n2 1000

Según la confianza el valor de Z α será:


2

Z α = 1.96
2

Primero, el límite inferior del intervalo

r
0.34(1 − 0.34) 0.45(1 − 0.45)
(0.34 − 0.45) − 1.96 + = −0.1525776
1000 1000

Ahora el límite superior:

r
0.34(1 − 0.34) 0.45(1 − 0.45)
(0.34 − 0.45) + 1.96 + = −0.06742241
1000 1000
3. Estimaciones puntuales y por intervalo para variables
cualitativas 59 / 60
Solución

El intervalo va de -0.153 a -0.067. Se observa que el 0 no está


contenido en el intervalo y que los dos límites son negativos, por lo
que se puede decir que:
Al 95% de confianza, la proporción que votará por A es menor que
la proporción de votantes de B.

3. Estimaciones puntuales y por intervalo para variables


cualitativas 60 / 60
Ejercicios de la semana 5
1.- Un Tercero Retenedor incorporado al Nuevo Sistema de Embargo por Medios Telemáticos
(Nuevo SEMT - TR) tiene la obligación de comunicar las cuentas por pagar de los
proveedores que pueden ser deudores coactivos o tienen deudas con la SUNAT. El
Tercero Retenedor quiere estimar la proporción de proveedores que se comprometerían
a pagar la deuda, tomó un marco muestral de 6500 proveedores de frutas, verduras y
legumbres para restaurantes de Lima y provincias y utilizó un nivel de confianza de 95%,
un error de 8%. Se sabe que años anteriores, la proporción de proveedores que se
comprometieron a pagar la deuda fue 0.60. ¿Cuál es el tamaño de muestra de
proveedores de frutas, verduras y legumbres para restaurantes de Lima y provincias?

a) 151

b) 161

c) 171

d) 141

2.- Una especialista en Marketing, delimitó una población de 850 consumidores que exigen
boletas de ventas, cuyo objetivo es determinar el promedio de gastos diarios del consumidor a
negocios acogidos al Nuevo Régimen Único Simplificado (NRUS). Tenemos información anterior
que la desviación estándar es 2 soles y el error máximo al estimar el promedio de gastos sea
0.35. ¿Con un nivel de confianza del 95% , a cuántos consumidores habrá que encuestar?

a) 120

b) 109

c) 190

d) 102
3.- El desarrollo de las actividades empresariales de Micro y Pequeñas empresas acogidas al
Régimen MYPE esta expuesta a una acción u omisión, de no cumplir con algunas obligaciones
tributarias, de ser así podrían encontrarse ante una infracción tributaria sancionable por la
SUNAT. Un funcionario de la SUNAT, desea estimar la proporción de Micro y Pequeñas empresas
que cometen infracción por emitir documentos que no son comprobante de pago y así evitar
una sanción del 50% de la UIT o cierre. En el estudio se tomó una población de 8000 Micro y
Pequeñas empresas de Lima, un error de estimación de 0.09 y un nivel de confianza del 95%.
p=0.50. ¿Cuál es el tamaño de muestra de Micro y Pequeñas empresas de Lima?

a) 171

b) 111

c) 117

d) 127

4.- Se realizó una encuesta para estimar el promedio de beneficios mensuales de pequeños
empresarios informales. El investigador considera un error de estimación de 100 soles, con un
95% de nivel de confianza. También realizó una encuesta piloto, hallando una desviación
estándar de los beneficios mensuales que fue 300 soles. ¿Cuál es el tamaño de muestra
requerido?

a) 48

b) 53

c) 35

d) 55
5.- Deloitte Perú, proveedor de servicios de auditoría de estados financieros y de aseguramiento
de información financiera y no financiera. Un auditor desea estimar las utilidades de las
entidades financieras a quienes Deloitte Perú brinda servicio, tomó un marco muestral de 500
empresas financieras, con una desviación estándar de las utilidades de 900 soles. ¿Cuál es el
tamaño de muestra de entidades financieras, si el nivel de confianza es 95%, con un error de
200 soles?

a) 77

b) 67

c) 76

d) 57

6.- Considerando una población de 800 contadores públicos, se desea estimar con un error
máximo de estimación del 3%, la proporción de contadores públicos que se ha cambiado de
empresa en los últimos tres años. Debe usarse el nivel de confianza de 95%, p=0.14. ¿Cuántos
contadores públicos es necesario encuestar?

a) 331

b) 321

c) 333

d) 313

7.- El objetivo del siguiente estudio es estimar la proporción de empresas informales que se
dedican a la venta de productos usados. Se quiere un nivel de confianza de 95% y que la
proporción estimada no se aleje más de 7% de la proporción poblacional. En un estudio piloto
se encontró que 15 de las 20 empresas informales se dedican a la venta de productos usados.
P=15/20; e=0.07

a) 157

b) 147

c) 167

d) 174
8.- Un investigador desea estimar el tiempo de demora según tipo de Sistema Privado de
Pensiones (SPP), en atender a los afiliados. La población total de los afiliados está dividida en
entidades de pensiones: 152 empleados afiliados a PRIMA, 127 empleados afiliados a
HORIZONTE y 208 empleados afiliados a INTEGRA. La desviación estándar poblacional del
tiempo de demora de PRIMA es 2.1 horas, la desviación estándar poblacional del tiempo de
demora de HORIZONTE es 3.9 horas, la desviación estándar poblacional del tiempo de demora
de INTEGRA es 4.3 horas y el límite de error de 1 hora. Hallar el tamaño total de la muestra y las
muestras para cada estrato , tomando en cuenta que es una asignación proporcional,
respectivamente (n; n1:Prima; n2:Horizante; n3=Integra)

a) n= 48 ; n1= 15 ; n2 = 13 ; n3= 20

b) n= 84 ; n1= 51 ; n2= 31 ; n3= 30

c) n= 34 ; n1= 15 ; n2= 13 ; n3= 40

d) n= 43 ; n1= 51 ; n2= 31 ; n3= 50

9.- Un auditor quiere estimar el valor medio de las facturas pendientes de cobro de una empresa,
con un límite de error de estimación de $25. La población se divide en cuatro estratos, que
contienen 500, 400, 300 y 200 facturas, respectivamente. Basándose en la experiencia, se estima
que las desviaciones estándar de los valores de este estrato serán $150. $200, $300 y $400.
Hallar el tamaño total de la muestra y las muestras para cada estrato , tomando en cuenta que
es una asignación proporcional, respectivamente (n; n1:Estrato 1; n2:Estrato 2 ; n3=Estrato 3 ;
n4=Estrato 4)

a) n= 370 ; n1= 120 ; n2 = 98 ; n3= 76 ; n4= 54

b) n= 308 ; n1= 110 ; n2 = 88 ; n3= 66 ; n4= 44

c) n= 310 ; n1= 120 ; n2 = 98 ; n3= 67 ; n4= 45

d) n= 308 ; n1= 110 ; n2 = 78 ; n3= 56 ; n4= 44


10.- El objetivo del estudio es estimar la renta mensual media de los hogares de los distritos, con
un límite de error de estimación de $500. La siguiente tabla muestra información relevante:

Distrito Tamaño de la población Desviación estándar estimada ($)

SJL 1150 4000

Los olivos 2120 6000

VES 930 8000

Hallar el tamaño total de la muestra y las muestras para cada estrato , tomando en cuenta que
es una asignación proporcional, respectivamente (n; n1:SJL; n2:Los olivos ; n3=VES )

a) n= 516 ; n1= 141 ; n2 = 260 ; n3= 114


b) n= 520 ; n1= 141 ; n2 = 206 ; n3= 141
c) n= 561 ; n1= 114 ; n2 = 260 ; n3= 114
d) n= 516 ; n1= 141 ; n2 = 206 ; n3= 141
Ejercicios de la semana 6
1. Durante el 2003 los precios de la gasolina alcanzaron récord de precios altos en 16
estados de Estados Unidos (The Wall Street Journal, 7 de marzo de 2003). Dos de
los estados afectados fueron California y Florida. La American Automobile
Association encontró como precio medio muestral por galón 2.04 en California y
1.72 por galón en Florida. Use 40 como tamaño de la muestra de California y 35
como tamaño de la muestra de Florida. Suponga que estudios anteriores indican
que la desviación poblacional en California es 0.10 y en Florida 0.08. ¿Cuál es la
estimación por intervalo de 95% de confianza para la diferencia entre preciosa
medios poblacionales por galón en California y en Florida?

a) [0.28 , 0.36]
b) [0.58 , 0.63]
c) [0.38 , 0.45]
d) [0.48 , 0.53]

2. Se esperaba que el día de San Valentín el desembolso promedio fuera 100.89


dólares (USA Today, 13 de febrero de 2006). ¿Hay diferencia en las cantidades que
gastan los hombres y las mujeres? El gasto promedio en una muestra de 40 hombres
fue de 135.67 dólares y el gasto promedio en una muestra de 30 mujeres fue de
68.64 dólares. Por estudios anteriores se sabe que la desviación estándar
poblacional en el gasto de los hombres es de 35 dólares y en el gasto de las mujeres
es de 20 dólares. Elabore un intervalo de confianza de 99% para la diferencia entre
las dos medias poblacionales.

a) [49.96 , 48.20]
b) [49.96 , 84.10]
c) [69.69 , 84.20]
d) [59.69 , 48.10]

3. Se comparan las resistencias de dos clases de hilo. Se prueban 50 piezas de cada


clase de hilo en condiciones similares. La marca A tiene una resistencia a la tensión
promedio de 78.3 kilogramos, con una desviación estándar de 5.6 kilogramos; en
tanto que la marca B tiene una resistencia a la tensión promedio de 87.2 kilogramos
con una desviación estándar de 6.3 kilogramos. Construya un intervalo de confianza
del 95% para la diferencia de las medias de la población. 𝑡∝/2 = 1.99

a) [-11.2722 , -6.5278]
b) [-15.2712 , -3.5264]
c) [-13.2575 , -2.5465]
d) [-12.5475 , -4.4521]
4. Se obtiene una muestra aleatoria de 100 elementos de una población normal, que
tiene media 50 y desviación estándar 8. Luego se selecciona otra muestra aleatoria
de 40 elementos de una población normal, que tiene media 40 y desviación estándar
12. Encontrar la probabilidad de que la media de la primera muestra exceda a la de
la segunda en 8 o más.

a) 0.7540
b) 0.4685
c) 0.8340
d) 0.3542

5. Carlos cultiva tomates en dos campos en dos campos separados. Cuando los
tomates están listos para ser cosechados, le interesa saber si las alturas de las
plantas difieren entre los dos campos. Toma una muestra aleatoria de plantas de
cada campo y mide sus alturas. Este es un resumen de los resultados:

Campo A Campo B
Media 1.3 m 1.6 m
Desviación estándar 0.5 m 0.3 m
Número de plantas 22 24

∝= 0.05
Realice la prueba t para la diferencia de medias

a) 0.065
b) 0.052
c) 0.024
d) 0.011
6. En un hospital se realiza un estudio sobre la influencia del estrés en el peso de los
bebés al nacer. Se consideran dos grupos de mujeres embarazadas; aquellas que
viven en el campo y aquellas que viven en la ciudad, y se obtienen los siguientes
datos sobre el peso de sus hijos.

Muestra Peso medio de los Desviación típica


bebés
Campo 𝑛1 = 320 𝑥̅1 = 3.8 𝜎1 = 0.6
Ciudad 𝑛2 = 240 𝑥̅2 = 3.4 𝜎2 = 0.8

Calcule un intervalo de confianza, utilizando un intervalo de confianza para la diferencia


de medias con un nivel de confianza del 95%.

a) [0.356 , 0.630]
b) [0.165 , 0.452]
c) [0.279 , 0.520]
d) [0.452 , 0.642]

7. Se utilizaron dos máquinas para llenar botellas de plástico con detergente para
máquinas lavaplatos. Se sabe que las desviaciones estándar de volumen de llenado
son 𝜎1 = 0.10 onzas de líquido y 𝜎2 = 0.15 onzas de líquido para las dos máquinas
respectivamente. Se toman dos muestras aleatorias, 𝑛1 = 12 botellas de la
maquina 1 y 𝑛2 = 10 botellas de la máquina 2. Los volúmenes promedio de llenado
son 𝑥̅1 = 30.87 onzas de líquido y 𝑥̅2 = 30.68 onzas de líquido.

Asumiendo que ambas muestras provienen de distribuciones normales. Construya un


intervalo de confianza de nivel 90% para la diferencia entre las medias del volumen de
llenado.

a) [0.02021 , 0.341252]
b) [0.09837 , 0.281620]
c) [0.05236 , 0.425131]
d) [0.04523 , 0.564862]
8. De una muestra de 150 lámparas del fabricante A se obtuvo una vida media de 1400
hs y una desviación típica de 120 hs. Mientras que de una muestra de 100 lámparas
del fabricante B se obtuvo una vida media de 1200 hs, y una desviación típica de 80
hs.

Halla los limites de confianza del 95% para la diferencia de las vidas medias de las
poblaciones A y B.

a) [135.2057 , 254.78511]
b) [125.3251 , 234.4572]
c) [230.1252 , 442.4592]
d) [175.2077 , 224.7922]

9. Si piensa que la concentración del ingrediente activo de un detergente líquido para


ropa, es afectada por el tipo de catalizador utilizado en el proceso de fabricación. Se
realizan 10 observaciones con cada catalizador, y se obtienen los datos siguientes:

Catalizador 1: 57.9 ; 66.2 ; 65.4 ; 65.4 ; 65.2 ; 62.6; 67.6; 63.7; 67.2; 71.0
Catalizador 2: 66.4; 71.7; 70.3 ; 69.3; 64.8; 69.6; 68.6; 69.4; 65.3; 68.8

Encuentre un intervalo de confianza del 95% para la diferencia entre las medias de
las concentraciones activas para dos catalizadores. Asumir que ambas muestras
fueron extraídas de poblaciones normales con varianzas iguales.

a) [-4.5206 , -0.54125]
b) [-3.1251 , -0.12542]
c) [-5.8706 , -0.52935]
d) [-2.4512 , -0.15242]

10. Una muestra de 6 soldaduras de un tipo tenía promedio de prueba final de


resistencia de 83.2 ksi y desviación estándar de 5.2. Y una muestra de 10 soldaduras
de otro tipo tenía resistencia promedio de 71.3 ksi y desviación estándar de 3.1.
Supongamos que ambos conjuntos de soldaduras son muestras aleatorias de
poblaciones normales. Se desea encontrar un intervalo de confianza de 95% para la
diferencia entre las medias de las resistencias de los dos tipos de soldaduras.

a) [7.51 , 11.34]
b) [1.51 , 10.54]
c) [2.13 , 8.12]
d) [6.37 , 17.43]
Ejercicios de la semana 7
1.- La asamblea universitaria de una Institución Pública desea determinar la opinión de los
estudiantes y catedráticos en relación al calendario académico propuesto para el año
siguiente. Una muestra aleatoria de 100 estudiantes y 50 catedráticos dio los siguientes
resultados. Calcule el intervalo de confianza para un nivel de confianza de 95% .Y responda
¿Hay prueba de una diferencia en la actitud hacia el calendario académico propuesto entre los
dos grupos?

OPINIÓN ESTUDIANTES CATEDRÁTICOS


Favorecen al calendario 63 30
académico propuesto
Se supone al calendario 37 20

a) [-0.1354 , 0.1954] ; No

b) [-0.9413 , -0.5154] ; Si

c) [0.1354 , 0.1954] ; Si

d) [0.5413 , 0.5419] ; No

2.- Un fabricante que un nuevo producto de consumo popular prefiere más los jóvenes que los
adultos. Para comprobar tal afirmación, se toma una muestra aleatoria de 250 jóvenes y se
encuentra que 175 prefieren el nuevo producto y otra muestra aleatoria de 200 adultos donde
se encuentra que 120 prefieren el nuevo producto. Utilice un nivel de confianza del 95% y
calcule el intervalo de confianza.

a) [0.051254 , 0.198536]

b) [0.011474 , 0.188526]

c) [0.025465 , 0.198526]

d) [ 0.035456 , 0.186526]

3.- En octubre, 160 personas de una muestra aleatoria de tamaño 400 aprobaron la gestión de
un líder político. Dos meses más tarde, en diciembre, la mitad de otra muestra aleatoria de
tamaño 500, independiente de la anterior, rechazaba tal gestión. Utilice un nivel de confianza
del 99% y calcule el intervalo de confianza.

a) [-0.1854 , -0.0146]

b) [0.1945, 0.2964]

c) [-0.8154 , -0.0246]

d) [ 0.4145, 0.5146]
4. MARTINEZ RODRIGUEZ Y ASOCIADOS S.A.C, es una sociedad civil constituida en Lima, Perú,
consolidándose como una firma, como una importante imagen en el ámbito empresarial,
ofreciendo los servicios profesionales de auditoría y consultoría a empresas trasnacionales y
nacionales del sector Privado. La firma, plantea que hay mayor demanda de empresas
nacionales que reciben servicio de auditoría que de empresas transnacionales. En una reciente
encuesta se tomó una primera muestra de 120 empresas nacionales y se encontró que 60
empresas nacionales reciben servicio de auditoría. Se consideró una segunda muestra de 80
empresas transnacionales y se encontró que 50 empresas transnacionales reciben servicio de
auditoría. Utilice un nivel de confianza del 90% para la diferencia de proporciones y calcule el
intervalo de confianza.

a) [0.2051 , 0.2191]

b) [-0.3250 , -0.0419]

c) [-0.2081 , -0.0419]

d) [-0.2118 , 0.0519]

5. Se realiza una encuesta nacional urbano-rural de IPSOS Perú sobre la gestión de Pedro Pablo
Kuczynski (PPK). Presidente de la República del Perú. IPSOS, realizó una encuesta en julio del
2016, tomó una muestra de 1000 personas de las cuales 600 están de acuerdo con la gestión
de PPK y en agosto tomó una muestra de 1200 electores de las cuales 840 están de acuerdo
con la gestión de PPK. Calcule el intervalo de confianza ,para un nivel de confianza de 95% .Y
responda ¿La aprobación del presidente ha aumentado?

a) [-0.1399, 0.0610] ; Si

b) [ -0.1399 , 0.0610] ; No

c) [-0.1399 , -0.0601] ; No

d) [-0.1399 , -0.0601] ; Si

6.- Para comparar las actitudes de los jóvenes de dos naciones A y B, respecto del peligro de
una guerra nuclear, se tomó una muestra de 3370 estudiantes en A y una muestra de 2148
estudiantes en B. A cada estudiante se le preguntó si era posible una próxima guerra nuclear,
20% de los estudiantes en A y 29% de B contestaron afirmativamente. Hallar un intervalo de
confianza del 92% para la diferencia de las proporciones de los estudiantes de las dos naciones
que piensan afirmativamente. 𝑧0.04 = 1.75

a) [-0.111 , -0.096]
b) [-0.111 , -0.069]
c) [0.011 , 0.096]
d) [0.011 , 0.069]
7.- La SUNAT informó que existe incumplimiento (evasión y morosidad) en el sector de
recaudación por impuesto a la Renta (IR) de primera categoría (alquileres), concluyo que 6 de
cada 10 contribuyentes evaden el pago de este impuesto. Para ello el área de marketing realizó
una encuesta anotándose que, de 800 empleados públicos, 100 evaden impuestos de alquileres
y de 600 empleados privados, 120 evaden impuestos de alquileres. Al nivel de confianza del 98%

a) [-0.7954 , -0.6032]
b) [-0.7968 , -0.7032]
c) [0.1786 , 0.3270]
d) [0.1786 , 0.3270]

8.- Se considera cierto cambio en un proceso de fabricación de partes componentes. Se toman


muestras del procedimiento existente y del nuevo para determinar si este tiene como resultado
una mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos
y 80 de 2000 artículos del procedimiento nuevo también lo son, encuentre un intervalo de
confianza de 90% para la diferencia real en la fracción de defectuosos entre el proceso actual y
el nuevo.

a) [-0.0016 , 0.0216]

b) [-0.022 , 0.0205]

c) [-0.012 , 0.0143]

d) [-0.202 , 0.0212]
9.- La propuesta de un bono para la construcción de una escuela será enviada a los votantes en
la siguiente elección municipal. Una parte importante del dinero derivado de esta emisión de
bonos se empleará en construir escuelas en una zona de rápido desarrollo de la ciudad y lo
demás se usará par renovar y actualizar los edificios escolares del resto de esta. Para evaluar la
viabilidad de la propuesta de un bono, a una muestra aleatoria de 𝑛1 = 50 residentes de la zona
de rápido desarrollo y 𝑛2 = 100 de las otras partes de la ciudad, se les preguntó si piensan votar
por la propuesta, Los resultados se tabulan en la siguiente tabla.

Valores muestrales para opinión sobre propuesta de bono


Sección en desarrollo Resto de la ciudad
Tamaño muestral 50 100
Número a favor de 38 65
propuesta
Proporción a favor de 76 65
propuesta

Estime la diferencia en las proporciones verdaderas a favor de la propuesta de bono con un


99% de intervalo de confianza. 𝑧0.995 = 2.58

a) [-0.0885 , 0.3085]
b) [-0.0985 , 0.3085]
c) [-0.0785 , 0.3085]
d) [0.0885 , 0.3085]

10.- Se quiere poner en marcha un plan de incentivos al personal de una empresa. Por lo tanto,
se realizan dos muestras aleatorias, una de tamaño 16 personal de oficina y 22 del personal de
operarios(planta). Recogida la información se encontró que el número de personas a favor de
la propuesta de la directiva fue de 10 y 12 respectivamente. Establezca limites de confianza de
95% para estas diferencias.

a) [-0.235 , 0.395]

b) [-0.134 , 0.495]

c) [-0.285 , 0.539]

d) [-0.135 , 0.359]

También podría gustarte