Estad y Prob - 5a - 10 PDF
Estad y Prob - 5a - 10 PDF
Estad y Prob - 5a - 10 PDF
10 Inferencia estadística
Objetivos
En la unidad 9, se analizaron las bases para distribuciones muestrales, con las cuales se
realizan estimaciones de parámetros en estudio; las multivariables aleatorias; se definió
formalmente el muestreoaleatorio, y se estudiaron algunasdistribucionesmuestralesempleando
el teorema central del límite. El objetivo general de dichostemasesla construcción de lasbases
teóricas para la inferencia estadística.
En esta unidad se analizará el proceso de inferencia estadística, el cual se puede hacer
de tres maneras: por estimación puntual, intervalo de confianza o por prueba de hipótesis.
Los estimadores puntuales, como se verá, tienen gran importancia teórica en la infe-
rencia estadística, pero en la cuestión práctica no es apropiado llevarlosa cabo con base en
un solo punto; por consiguiente se harán estimacionesbasadasen intervalos.
La otra área de inferencia estadística que se analizará esla prueba dehipótesis. Esdecir,
se formula una suposición del parámetro y bajo condiciones determinadas se comprobará
si es válida o no.
En la unidad 1 se determinó que la estadística descriptiva trabaja con todos los
individuosdelapoblación o lamuestra. En estaunidad severáquelaestadísticainferencial
se basa en el estudio de muestras, a partir de las cuales se pretende inferir aspectos relevantes de
toda la población. En la unidad 9 se determinó que el método de seleccionar muestras
tiene gran importancia en el desarrollo de la estadística. Cómo se realiza la inferencia y
qué grado de confianza se puede tener en la muestra son aspectos fundamentales que se
analizarán en esta unidad.
1. Clásico.
2. Bayesiano.
8, 4, 9, 9, 6, 8, 2, 7, 3 y 6
Definición 10.1
Dada una población en donde es un parámetro, y ˆ su estadística correspondiente, se le llama
estimador puntual de a cualquier valor ˆ de ˆ.
Definición 10.2
El estadístico ˆ se llama estimador insesgado del parámetro si E( ˆ )= .
Ejemplo 1 Dadas X1, X2, . . ., X5 una muestra aleatoria de una población cuya distribución es
normal, con media y varianza 2, considerando los estadísticos
X1 X 2 X5 X1 X 2 X3 X4 X5
T1 X , T2 y T3
10 3
se comprueba cuáles son estimadores insesgados de .
Para verificar qué estimadores son insesgados, se emplea la definición y la propiedad
del valor esperado en variables independientes
E(a1X1 a2X2 anX n ) a1E(X1 ) a2E(X 2 ) anE(X n )
Para el estadístico T1
X1 X2 X3 X4 X5 1
E(T1 ) E(X ) E E X1 X 2 X 3 X 4 X5
5 5
1
E(X1) E(X 2 ) E(X 3 ) E(X 4 ) E(X 5 )
5
1 1
( ) (5 )
5 5
Se muestra que T1 es un estimador insesgado.
Para el estadístico T2
X1 X2 X3 X4 X5 1
E( T2 ) E E X1 X 2 X3 X4 X5
10 10
1 1 1
E( X1) E( X 2 ) E( X 3) E( X 4 ) E( X 5 ) (5 )
10 10 2
Se muestra que T2 es un estimador sesgado.
Para el estadístico T3
X1 X 2 X3 X4 X5 1
E( T3 ) E E X1 X 2 X 3 X4 X5
3 3
1 1 1
E( X1) E( X 2 ) E( X 3) E( X 4 ) E( X 5 ) ( ) (3 )
3 3 3
Por tanto, T3 también es un estimador insesgado de la media.
Definición 10.3
Dado un parámetro y un conjunto de estimadores insesgados de él, ˆ , ˆ , ,ˆ
1 2 m , se llama
de al de menor varianza.
288
Para el estadístico T1
X1 X 2 X3 X4 X5 1
V( T1) V V X1 X 2 X3 X4 X5
5 52
1 1 2 2 2 2 2
V( X1) V( X 2 ) V( X 3) V( X 4 ) V( X 5 ) ( )
25 25
1 2 1 2
(5 )
25 5
Para el estadístico T3
X1 X 2 X3 X4 X5 1
V( T3) V V X1 X2 X3 X4 X5
3 32
1 1
V( X1) V( X 2) V( X 3) ( 1)2 V( X 4 ) V( X 5 ) ( 2 2 2 2 2
)
9 9
1 2 5 2
(5 )
9 9
De los cálculos anteriores, resulta que el estadístico T1 es más eficiente que T3,
puesto que 1/ 5 5/ 9.
Entre los parámetros más comunes y sus estadísticos, existen los insesgados que se
emplean con mayor regularidad:
Ejercicio 1
P( ˆ i
ˆ ) 1
s
Definición 10.4
El intervalo anterior en el que se localiza el parámetro , ˆ ˆ
i s, se llama intervalo de
de (1 – )100%; mientras que la fracción 1– se le llama o grado
y los extremos ˆ yˆ, son los inferior y superior,
i s
respectivamente.
Por ejemplo, se tiene una muestra de 20 focos cuya duración promedio en horas
es x 750 y con base en este valor se estima que el parámetro puede encontrarse con
una probabilidad 1 – , establecida de antemano en el intervalo de confianza (740, 760),
es decir
P(740 760) 1
Establecidas las bases generales de los intervalos de confianza y utilizando el teorema del
límite central, losconceptossobre estimadorespuntuales ylasdistribuciones determinadas
en la unidad 9, se presentan métodos para el cálculo de intervalos de confianza. Uno de
estos métodos se refiere a la media, y se divide en tres casos:
x z x z
2
n 2
n
Ejemplo 3 Una máquina de refrescos está ajustada de tal manera que la cantidad de líquido
suministrado se distribuye en forma normal con desviación estándar de 0.15 dl. Se
calcula 95% de intervalo de confianza para la media de refrescosservidosde una muestra
de 36 vasos tomada al azar con un contenido promedio de 2.25 dl.
Se toman los datos: = 0.15 dl, el tamaño de la muestra es 36 con media muestral
de x 2.25 dl. Para calcular el intervalo de confianza del parámetro media se emplea la
fórmula anterior.
Primero se calcula el valor de z / 2, con 1 – = 0.95. De las tablasporcentuales para
la distribución normal estándar se tiene z / 2 = 1.96. Por tanto,
0.15 0.15
2.25 1.96 2.25 1.96
36 36
2.201 2.299
Es decir, con 95% de probabilidad se afirma que el parámetro media del líquido
suministrado por la máquina de refrescos se encuentra entre 2.201 y 2.299 dl.
Es decir, con 99% de probabilidad se afirma que el parámetro media del líquido
suministrado por la máquina de refrescos se encuentra entre 232.72 y 247.28 ml.
Dada x la media de una muestra de tamaño n (n 30) tomada al azar de una población
con distribución normal de la cual se conoce s2, y se desconoce 2, el intervalo de con-
fianza (1 – ) de 100% para está dado por
s s
x t x t
2
n 2
n
4.19 4.19
246.27 4.14 246.27 4.14
15 15
241.79 250.75
Ejercicio 2
13 19 14 12 21 14 17 20 17
Ejemplo 6 Se comparan dos tipos de rosca de tornillos para determinar su resistencia a la tensión. Se
prueban doce piezas de cada tipo de cuerda bajo condiciones similares, obteniéndose los
siguientes resultados (en kg)
Tipo
de rosca 1 2 3 4 5 6 7 8 9 10 11 12
1 68 70 72 69 71 72 70 69 75 69 70 71
2 75 73 73 68 68 67 69 75 74 68 73 74
5 10 5 10
(70.5 71.4) 1.645 1 2 (70.5 71.4) 1.645
12 12 12 12
2.74 1 2 0.94
2 2
2. Intervalo de confianza para 1
– 2
de poblacionescuando se desconocen 1 y 2
en muestrasgrandes.
Ejemplo 7 Retomando el ejemplo 6, se prueban 40 tornillosde cada tipo de cuerda bajo condiciones
similares y se obtienen los siguientes resultados (en kg).
1
– 2
(1.78, 3.62) indica que 1
– 2
0, es decir 1 2
1 1 1 1
( x1 x2 ) t (sp ) 1 2 ( x1 x2 ) t (sp )
n1 n2 n1 n2
2 2
295
esla estimación común de la desviación estándar poblacional y s12 y s22 son lasvarianzas
insesgadas respectivas de las muestras 1 y 2.
Ejemplo 8 Las pruebas de tracción en diez puntos de soldadura para un dispositivo semiconductor
produjeron los siguientes resultados en libras requeridas para romper la soldadura
15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5
donde t /2
es el valor de la distribución t-Student con
2
s12 s22
n1 n2
2 2
s12 1 s22 1
n1 n1 1 n2 n2 1
grados de libertad, el cual tiene un área de / 2, y s12 y s22 son las varianzas insesgadas
respectivas de las muestras.
De la fórmula anterior se puede estimar que el resultado del cálculo de los
gradosde libertad generalmente será una cantidad no entera, por lo que siempre sedebe
redondear al entero más próximo (no al siguiente), por ejemplo, si v = 14.3 14; v =
14.7 15; v = 14.5 15.
2 2
Ejemplo 9 Se retoman los datos del ejemplo 8, considerando que 1 2 y son ambas desco-
nocidas. Se supone normalidad; se calcula 90% de intervalo de confianza para 1 – 2; se
determina qué tipo de semiconductor sin recubrimiento (1) o con recubrimiento (2) tiene
más resistencia a la tracción.
Las medias y varianzas muestrales se calcularon anteriormente
n1 n2 10 8
2 2 2 2
14.99 15
s12 1 s22 1 7.50 1 2.68 1
n1 n1 1 n2 n2 1 10 10 1 8 8 1
2 2
donde se desconoce 1 y 2, el intervalo de confianza (1 – ) de 100% para
d
= 1 – 2 está dado por
sd sd
xd t d xd t
2
n 2
n
L 0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92
M 0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86
L 0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92
M 0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86
L–M 0.04 0.50 0.28 0.08 0.01 0.05 0.23 0.11 0.18 0.06
Ejercicio 3
Estudiante: 1 2 3 4 5 6 7 8 9 10
Prueba 1: 90 90 90 80 90 92 88 90 63 70
Prueba 2: 84 84 82 94 90 85 89 62 65 52
3.0 3.5 4.0 8.1 7.2 8.9 8.2 10.0 10.0 9.0
A otro grupo se le aplicó un examen de álgebra lineal con las siguientes calificaciones
2.0 3.0 3.7 8.0 5.0 4.0 3.0 8.0 9.0 10.0 7.0 7.0 6.0
Mujer 1 2 3 4 5 6 7
Peso anterior 58.5 60.3 61.7 69.0 64.0 62.6 56.7
Peso posterior 60.0 54.9 58.1 62.1 58.5 59.9 54.4
Cuando se trata de intervalos de confianza para la varianza, se consideran dos casos, uno
para las varianzas poblacionales y el otro para una razón entre varianzas.
2
1. Intervalo de confianza para de poblaciones normalesen muestraspequeñas.
Ejemplo 11 Un antropólogo midió el ancho (en centímetros) de una muestra tomada al azar de nueve
cráneos de miembros de cierta tribu, y obtuvo los siguientes resultados
13.3 14.2 13.5 16.7 11.1 13.1 13.0 12.2 13.0
2 2
2. Intervalo de confianza para 1 2 de poblacionesnormalesen muestraspequeñas.
2 2
Dadas s1 y s2 las varianzas de muestras aleatorias independientes de tamaños n1 y
n2 (n1 30 y n2 30), respectivamente, de poblaciones normales, el intervalo de
confianza (1 – ) de 100% para la razón de las varianzas 12 22 está dado por
s12 1 2
1 s12
f 2( 2, 1)
s22 f 2( 1, 2)
2
2 s22
2 2
Ejemplo 12 Retomando los datos del ejemplo 8 se hizo la suposición de que 1 2 y se calculó
un intervalo de confianza para la razón de varianzas y se determinó si fue válida la
suposición, con 90% de confianza.
Los resultados del conjunto 1 fueron
15.8 12.7 13.2 16.9 10.6 18.8 11.1 14.3 17.0 12.5
Al calcular las varianzas muestrales, del conjunto 1 se obtuvo s12 7.50, n1 = 10, y
del conjunto dos s22 2.68, n2 = 8.
Falta determinar usando las tablas porcentuales de la distribución F los valores
de f 2 ( 1, 2 ) y f 2 ( 2 , 1 ) con 90% de confianza ( = 0.10 es decir, / 2 = 0.05) y v1
= n1 – 1 = 10 – 1 = 9 y v2 = n2 – 1 = 8 – 1 = 7 grados de libertad. Se busca en las tablas
de la distribución F y se obtiene
f 2( 1, 2) f 0.05 (9, 7) 3.677 y f 2 ( 2, 1) f 0.05(7, 9) 3.293
2
7.50 1 1 7.50
2
3.293
2.68 3.677 2 2.68
2
1
0.76 2
9.22
2
Del intervalo de confianza para la razón entre varianzas se determina que el valor 1
está contenido en el intervalo. Por tanto, con 90% de confianza se justifica la suposición de
2 2
que 12 2
2 , ya que 1
2
2 1 (0.76, 9.22) y si se multiplican por 2 ambos miembros
2 2
de la igualdad se obtiene 1 2.
Ejercicio 4
L 0.99 0.90 0.32 0.70 0.43 0.67 0.65 0.61 0.44 0.92
M 0.95 0.40 0.60 0.62 0.44 0.62 0.42 0.72 0.26 0.86
301
Considera 99% de intervalo de confianza para razón entre varianzas de los rendi-
mientos de los catalizadores; supón que los datos están distribuidos normalmente.
3. El espesor de las paredes de 25 botellas de vidrio de dos litros fue medido por un
ingeniero de control de calidad. La media muestral fue de 4.02 mm y la desviación
estándar muestral de 0.09. Considera 95% de intervalo de confianza con respecto
de la varianza del espesor de las paredes de las botellas.
4. Se realizan cinco mediciones en un medidor de volumen en la bomba de una
estación de gasolina (10.5, 10.0, 9.90, 9.95 y 10.15), supón normalidad y calcula un
intervalo de confianza para la varianza con = 0.05.
ˆ yq
Si p ˆ 1 ˆp son las proporciones respectivas de éxitos y fracasos en una muestra
aleatoria de tamaño n (n 30), el intervalo de confianza (1 – ) de 100% para el
parámetro binomial p está dado por
ˆpq
ˆ ˆpq
ˆ
ˆp z p ˆp z
n n
2 2
donde z / 2 es el valor de la distribución normal estándar, el cual tiene un área de / 2.
Ejemplo 13 En una muestra aleatoria de cien posibles clientes, 70 prefieren determinado producto.
Se considera 95% de intervalo de confianza para la proporción de todos los posibles
clientes que prefieren tal producto.
Para el intervalo de confianza de la proporción primero se determina el valor de
ésta de personas que prefieren el producto
ˆp 70 30
0.70 y ˆq 0.30
100 100
En este caso se tiene 95% de confianza, por tanto, 1 – = 0.95, y usando las tablas
porcentuales de la distribución normal se tiene z / 2 = 1.96. Por último
Ejemplo 14 Una firma manufacturera de cigarros distribuye dos marcas. Si se encuentra que 56 de
200 fumadores prefieren la marca A y que 29 de 150 fumadores prefieren la marca B, se
considera 95% de intervalo de confianza para pA – pB; se determina si es válido suponer
que la población de fumadores prefiere la marca B, sobre la marca A.
Dada pA la probabilidad de que 56 de 200 fumadores prefieran la marca A, su
estadístico resulta
ˆpA 56
0.28
200
de tal forma que qˆ A 0.72 con n1 = 200. Asimismo la probabilidad de que 29 de 150
prefieran la marca B resulta
ˆpB 29
0.19
150
de tal formaque ˆqB 0.81 con n2 = 150. Por último parael intervalo de 95% de confianza,
de las tablas porcentuales para la distribución normal resultaque z / 2 = 1.96, empleando
la fórmula correspondiente para pA – pB
0.28 0.72 0.19 0.81 0.28 0.72 0.19 0.81
(0.28 0.19) 1.96 pA pB (0.28 0.19) 1.96
200 150 200 150
0.0018 pA pB 0.1782
Ejercicio 5
vida promedio de focos de cierta marca, se puede formular una hipótesis, la cual se debe
comprobar, es decir, buscar evidencias que ayuden a decidir si la hipótesis se acepta o
se rechaza.
Definición 10.5
Se llama hipótesis estadística
Definición 10.6
Se llama error tipo I cuando se rechaza la hipótesis nula, dado que ésta es cierta. Asimismo, se
llama error tipo II cuando no se rechaza la hipótesis nula, dado que es falsa.
Dadas las definiciones de los dos errores que van implícitos al aceptar o rechazar
una hipótesis nula, surge de nuevo un cuestionamiento.
304
Ejemplo 15 Se retoma el caso de la vida promedio de los focos y se consideran 49 focos de muestra y
las hipótesis H 0: 750, H1: 750, la evidencia de la muestra establece 760 h de vida
promedio, se calcula el nivel de significancia.
= probabilidad de cometer un error tipo I = probabilidad de rechazar H 0 siendo verdadera
Es decir
X 760 750
P(X 760) P P(Z 2.8) 0.0026
25
n 49
En tales condiciones, la probabilidad de cometer un error tipo I es pequeña; es
decir, el nivel de significancia es 0.26%.
Ejemplo 16 Se retoma el caso de la vida promedio de los focos y se calcula para = 765.
= probabilidad de cometer un error tipo II = probabilidad de aceptar H 0, siendo falsa
Es decir,
P(X 760 cuando 765)
X 760 765
P(X 760) P P(Z 1.4) 0.0808
25
n 49
La probabilidad de cometer un error tipo II es pequeña, es decir, 8.08% para el
caso en que la verdadera vida promedio de los focos sea igual a 765 horas.
305
Ejercicio 6
2. Supón que X es una variable aleatoria normal con varianza 100. Si se toma una
muestra al azar de tamaño 16 de X, comprueba la hipótesis H0: = 10 contra H1:
10. Si se determinó una media muestral de 12.5, calcula la probabilidad de error
de tipo II.
3. Una lavandería afirma que un nuevo quitamanchas es efectivo en no más de 70%
de los casos en que se utiliza. Para comprobar esta afirmación se aplica el producto
en doce manchas tomadas al azar. Si menos de once son eliminadas se acepta la
hipótesis nula de que p = 0.7; de otra forma se concluye p 0.7.
Ejemplo 17 1. Una máquina produce piezas metálicas de forma cilíndrica, se toma una muestra al
azar de piezas cuyos diámetros son 9.8, 9.5, 9.8, 11.5, 9.0, 10.4, 9.8, 10.1 y 11.2 mm.
Se supone que los diámetros tienen una distribución aproximadamente normal. Si el
fabricante afirma que el diámetro promedio es 10 mm, se determina respecto de esta
afirmación con 0.01 de nivel de significancia.
Se pide una prueba de hipótesis para la media, comprobando que ésta es igual
a 10 mm, en tal caso, de acuerdo con datos muestrales, la hipótesis alterna será el
opuesto, es decir, diferente de diez. Se siguen los pasos para una prueba de hipótesis.
a) H0: = 10
b) H1: 10
c) nivel de significancia = 0.01
d) estadístico de prueba, primero se identifica a cuál de lostrescasosanteriorescorres-
ponde, se indica que no se conoce sy que la muestra es pequeña; por tanto,
x 0
t
s n
e) para localizar la región de aceptación y rechazo del inciso b), se
determina que se trata de una prueba de dos colas, y del inciso d), que
el estadístico de prueba está basado en la distribución t-Student, por lo
que la región de rechazo está dada por
t –t /2
yt t /2
Región de rechazo, Región de rechazo,
cola izquierda cola derecha Con base en el inciso c), se tiene = 0.01, donde / 2 = 0.005. Por otro
lado, el tamaño de la muestra es n = 9, donde v = 9 – 1 = 8 grados de
libertad. Por tanto, de las tablas porcentuales de la distribución t-Student
resulta la región de rechazo
t –t 0.005 = –3.355 y t t0.005 = 3.355
307
2. Se toma una muestra al azar de 36 vasos suministrados por una máquina de refrescos
que sirve por vaso un contenido promedio de 21.9 dl, con desviación estándar de
1.42 dl. Se comprueba la hipótesis = 22.2 dl contra la hipótesis alterna 22.2 con
nivel de significancia 0.05.
a) H0: = 22.2
b) H1: 22.2
c) nivel de significancia = 0.05
d) estadístico de prueba; primero se identifica a cuál de los tres casos anteriores
corresponde, dado que no se conoce y la muestra es grande; por tanto
x 0
z
s n
e) para localizar la región de aceptación y rechazo del inciso b), se determina que se
trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está
basado en la distribución normal, por lo que la región de rechazo está dada por
z –z
Con base en el inciso c), se tiene = 0.05. Por tanto, de las tablas porcen-
tuales de la distribución normal la región de rechazo resulta
z –z = –1.6449
3. De acuerdo con las normas establecidas para un examen de aptitud mecánica, las
personas de 18 años deberían promediar 73.2 con desviación estándar de 8.6. Si de
una toma al azar 45 personas promedian 76.7, se comprueba la hipótesis de que la
media poblacional es mayor que 73.2. Se determina nivel de significancia de 2.5% y
desviación estándar poblacional de 8.6.
308
a) H0: = 73.2
b) H1: 73.2
c) nivel de significancia = 0.025
d) estadístico de prueba; primero se identifica a cuál de los tres casos corresponde,
siendo que se conoce ; por tanto,
x 0
z
n
e) para localizar la región de aceptación y rechazo del inciso b), se determina que se
trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está
basado en la distribución normal, por lo que la región de rechazo está dada por
z z.
Con base en el inciso c), se tiene que = 0.025. Por tanto, de las tablas
porcentuales de la distribución normal la región de rechazo resulta
z z0.025 = 1.96
Ejercicio 7
( x1 x2 ) d0
t
sp (1 n1) (1 n2 )
( x1 x2 ) d0
t
(s12 n1 ) (s22 n2 )
2
s12 s22
n1 n2
2 2
s12 1 s22 1
n1 n1 1 n2 n2 1
d d0
t
sd n
310
a) H0: 1 – 2 = 4
b) H1: 1 – 2 4
c) nivel de significancia = 0.10
d) estadístico de prueba; primero se identifica a cuál de los cinco casos anteriores
corresponde, dado que no se conoce la varianza poblacional y las muestras son
pequeñas, con varianzas poblacionales diferentes, se tiene
( x1 x2 ) d0
t
(s12 n1) (s22 n2 )
e) para localizar la región de aceptación y rechazo del inciso b), se determina que se
trata de una prueba de dos colas, y del inciso d), que el estadístico de prueba está
basado en la distribución t-Student, por lo que la región de rechazo está dada por
t –t /2
yt –t /2
Con base en el inciso c), se tiene que = 0.10, donde / 2 = 0.05. Los grados
de libertad se calculan mediante
2
s12 s22 1 3.24
2
n1 n2 12 10
2 2 2 2
13.4946 13
s12 1 s22 1 1 1 3.2
24 1
n1 n1 1 n2 n2 1 12 12 1 10 10 1
( x1 x2 ) d0 (16 11) 4
t 1.5668
(s12 n1 ) (s22 n2 ) (1 12) (3.24 10)
Tipo de rosca 1 2 3 4 5 6 7 8 9 10 11 12
1 78 76 80 79 78 80 82 81 79 83 80 82
2 83 80 82 83 81 80 79 80 82 78 79 81
a) H0: 1 – 2 = 0
b) H1: 1 – 2 0
c) nivel de significancia = 0.025
d) estadístico de prueba; primero se identifica a cuál de los cinco casos anteriores
corresponde, dado que no conoce las varianza poblacional pero se sabe que son
iguales y las muestras pequeñas; por tanto
( x1 x2 ) d0
t
sp (1 n1 ) (1 n2 )
e) para localizar la región de aceptación y rechazo del inciso b), se determina que se
trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está
basado en la distribución t-Student, por lo que la región de rechazo está dada por
t –t
Con base en el inciso c), se tiene que = 0.025. Los grados de libertad
se calculan mediante v = n1 + n2 – 2 = 12 + 12 – 2 = 22. Por tanto, de las tablas
porcentuales de la distribución t-Student con 22 grados de libertad, resulta la
región de rechazo
t –t0.025 = –2.074
312
a) H0: 1 – 2 = 3
b) H1: 1 – 2 3
c) nivel de significancia = 0.05.
d) estadístico de prueba: primero se identifica a cuál de los cinco casos anteriores
corresponde, dado que no se conoce la varianza poblacional y las muestras son
grandes, se tiene
( x1 x2 ) d0
z
s12 s22
n1 n2
e) para localizar la región de aceptación y rechazo del inciso b), se determina que se
trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está
basado en la distribución normal, por lo que la región de rechazo está dada por
z z
Con base en el inciso c), se tiene que = 0.05. Por tanto, de las tablas
porcentuales de la distribución normal resulta la región de rechazo
z z = z0.05 = 1.6449
313
Ejercicio 8
A B
Xi = 222 Yi = 285
Xi2= 5075.64 Yi2= 8292.78
Ejemplo 19 1. Se determina que una máquina de refrescos está fuera de control si la varianza de los
contenidos excede 1.15 dl. Se toma una muestra aleatoria de 25 refrescos con varianza
de 2.03 dl. Se calcula con 0.05 de nivel de significancia si la máquina está fuera de
control y se supone que los contenidos tienen una distribución normal.
En este ejercicio la prueba de hipótesis se refiere a una varianza, se comprueba
si ésta es mayor que 1.15 dl.
a) H0: 2 = 1.15
b) H1: 2 1.15
c) nivel de significancia = 0.05
315
d) estadístico de prueba; aquí sólo se tiene un caso para la varianza; por tanto
2 (n 1)s2
2
0
e) para localizar la región de aceptación y rechazo del inciso b), se determina que se
trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está
basado en la distribución ji por lo que la región de rechazo está dada por
2 2
área derecha. Con base en el inciso c), se tiene = 0.05. Por tanto, de las tablas
porcentuales de la distribución ji2 con v = n – 1 = 25 – 1 = 24 grados de libertad,
resulta la región de rechazo
2 2 2
0.05 36.415
2
Para calcular el estadístico , se tiene, de los datos del enunciado, s2 = 2.03
y n = 25.
2 (n 1)s2 (25 1) 2.03
2
42.365
0 1.15
Como dicho valor se encuentra en la región de rechazo, la hipótesis nula se
rechaza con un nivel de significancia de 0.05, por tanto, la máquina está fuera de
control.
Tipo de rosca 1 2 3 4 5 6 7 8 9 10 11 12
1 78 76 80 79 78 80 82 81 79 83 80 82
2 83 80 82 83 81 80 79 80 82 78 79 81
2
1
a) H 0 : 2
1
2
2
1
b) H1 : 2
1
2
c) nivel de significancia = 0.10
316
d) estadístico de prueba; aquí sólo se tiene un caso para la razón entre varianzas; por
tanto 2
s1
f
s22
e) para localizar la región de aceptación y rechazo del inciso b), se determina que se
trata de una prueba de dos colas, y del inciso d), que el estadístico de prueba está
basado en la distribución F por lo que la región de rechazo está dada por
1
f yf f 2( 1, 2)
f 2( 2, 1)
Con base en el inciso c), se tiene = 0.10, donde / 2 = 0.05. Por tanto, de
las tablas porcentuales de la distribución F con v1 = v2 = 11 grados de libertad,
resulta la región de rechazo
1 1
f 0.355 y f f0.05(11, 11) 2.818
f0.05(11, 11) 2.818
Ejercicio 9
1. Se conoce que la varianza de los puntajes de lectura para los estudiantes de sexto
año de primaria es 1.44. Se toman al azar 21 estudiantes de sexto año a los que se
les proporciona un curso especial de lectura, después del cual la varianza de los
puntajes de lectura es 1.05. Calcula si ésta es suficiente con nivel de significación de
0.05 para determinar si el curso especial la reduce.
2. Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de
piezas al azar cuyos diámetros son 9.8, 9.8, 9.8, 11.5, 9.0, 10.4, 10.0, 10.0, 11.0 y 12.0
mm. Supón que los diámetros tienen una distribución aproximadamente normal.
Si el fabricante de las máquinas indica que su máquina está desajustada cuando la
varianza de los diámetros de las piezas metálicas producidas excede 0.5 mm, calcula
con nivel de significancia de 0.01 si la máquina está desajustada.
3. Se sabe que el contenido de nicotina de una cierta marca de cigarrillos está
normalmente distribuida con una varianza de 1.3 mg. Comprueba la hipótesis
2
= 1.3 en contra de la alternativa 2 1.3 , si una muestra aleatoria de ocho
cigarrillos tiene desviación estándar de 1.8. Utiliza 0.05 de nivel de significancia.
317
Ejemplo 20 1. Una firma manufacturera de cigarros distribuye dos marcas. Si se determina que 56
de 200 fumadores prefieren la marca A y que 29 de 150 fumadores prefieren la marca
B, se calcula con nivel de significancia de 0.06 si la marca A aventaja en ventas a la B.
Esto se puede comprobar mediante una diferencia de proporciones.
a) H0 : pA pB 0
b) H1 : pA pB 0
c) nivel de significancia = 0.06
d) estadístico de prueba; aquí sólo se tiene un caso para la diferencia de proporciones;
por tanto
e) para localizar la región de aceptación y rechazo del inciso b), se determina que se
trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está
basado en la distribución Z, por lo que la región de rechazo está dada por
z z
ˆA xA 56 xB 29
p 0.28 y ˆpB 0.193
nA 200 nB 150
mientras que
ˆp xA xB 56 29 ˆ 1 0.243 0.757
ˆ 1 p
0.243 y q
nA nB 200 150
Por tanto,
2. Un canal televisivo asegura que la audiencia que mira cierto programa el sábado
por la noche es 40%. Se tomo al azar una muestra de cien televidentes, a quienes se
entrevistó, dando como resultado que 45 de ellos veían el programa. Con 2.5% de
nivel de significancia se comprueba si la afirmación es válida.
La prueba se trata de proporciones, donde se define una variable
X = “cantidad de personas que miran dicho programa los sábados por la noche”.
a) H0: p = 0.40
b) H1: p 0.40
c) nivel de significancia = 0.025
d) estadístico de prueba; aquí sólo se tiene un caso para las proporciones; por tanto,
x np0
z
np0q0
e) para localizar la región de aceptación y rechazo del inciso b), se determina que se
trata de una prueba de una cola, y del inciso d), que el estadístico de prueba está
basado en la distribución Z, por lo que la región de rechazo está dada por
z z
Con base en el inciso c), se tiene = 0.025. Por tanto, de las tablas
porcentuales de la distribución z, resulta la región de rechazo
z z0.025 = 1.96
Ejercicio 10
1. En un estudio para estimar la proporción de amas de casa que tienen una secadora
automática, se determina que 63 de cada 100 residentes urbanos y 59 de cada 125
residentes suburbanos la tienen. Calcula si la proporción de amas de casa urbanas
que tienen secadora exceden en más de 7% a la proporción de amas de casa
suburbanas que también tienen. Considera = 4%.
2. La industria cervecera está interesada en comparar dos marcas de cerveza (A y B),
puesto que se presume que la marca B es preferida sobre la marca A. De 200 personas
entrevistadas, 116 prefieren la marca B; y de 150 personas, 78 prefieren la marca A.
Determina la veracidad de la hipótesis de la industria. Considera = 10%.
3. Se realizó un estudio para determinar si másitalianosque estadounidensesprefieren
el vino espumoso blanco que el vino espumoso rosado en lasbodas. De una muestra
aleatoria de 300 italianos, 72 prefirieron el blanco; y de 400 estadounidenses, 70
también prefirieron el blanco. Calculasi másitalianosqueestadounidensesprefieren
el vino espumoso blanco en las bodas. Utiliza 5% de nivel de significancia.
4. Un fabricante de cierto producto afirma que más de 40% de los consumidores
prefiere su producto. Se entrevista a 60 personas al azar para verificar su afirmación.
Si 28 personas de las entrevistadas prefiere dicho producto, entonces se considera
válida la afirmación del fabricante, en caso contrario, se rechaza. Con un nivel de
significancia de 5% prueba la afirmación del fabricante.
Autoevaluación
1. Dadas X1, X2, X3, y X4 variables de una muestra aleatoria tomada de una población
distribuida en forma normal, de los siguientes estimadores indica cuál es un
estimador insesgado de la media .
ˆ X1 2X2 3X 3 4X 4
a) 1
4
ˆ X1 2X 2 X 3 X4
b) 2
4
c) ˆ X1 X 2 X 3 X 4
3
ˆ X1 2X2 3X 3 4X 4
d) 4
10
2. De una máquina que produce piezas metálicas de forma cilíndrica, se toma una
muestra al azar cuyos diámetros son 9.8, 10.5, 10.1, 9.9, 10.4, 10.6, 10.2, 10.8, 10.0,
320
10.7 y 9.8 mm. Supón que los diámetros tienen una distribución aproximadamente
normal, considera 95% de intervalo de confianza para el diámetro promedio de
todas las piezas de esta máquina.
a) (9.29, 11.29)
b) (8.46, 10.36)
c) (8.95, 11.06)
d) (10.05, 10.55)
3. Supón que la vida promedio de los focos tiene 30 h de desviación estándar de vida,
considerando una muestra de 50 focos y las hipótesis H0: = 750, H1: 750, con
la región de rechazo establecida para medias mayores a 760, calcula el nivel de
significancia.
a) 0.0091
b) 0.9919
c) 0.0182
d) 0.9818
4. El espesor de las paredes de 20 botellas de vidrio de dos litros fue medido por un
ingeniero de control de calidad. La media muestral fue 3.98 mm y la desviación
estándar muestral 0.09 mm. Considera 90% de intervalo de confianza respecto de
la varianza del espesor de las paredes de las botellas.
a) (0.08, 0.010)
b) (0.0051, 0.0152)
c) (0.008, 0.010)
d) (0.0152, 0.1520)
a) (0.245, 3.562)
b) (–2.476, 3.638)
c) (–1.7673, 1.89325)
d) (1.477, 4.604)
a) (0.018, 0.045)
b) (0.360, 0.890)
c) (0.036, 0.089)
d) (0.046, 0.094)
321
a) (6.799, 13.401)
b) (9.799, 10.401)
c) (8.799,12.401)
d) (8.946, 10.984)
Ejercicio 1
2. se comprueba que E( ˆ )
3.
a) se comprueba que E(X Y) 1 2
2 2
b) 1 2
V (X Y)
n1 n2
Ejercicio 2
1.
a) (15.03, 17.64)
b) (13.84, 18.82)
2. (3.98, 4.06)
3. (25.07, 27.73)
4. (9.80, 10.40)
5.
a) (9.40, 11.26)
b) (9.52, 11.14)
322
Ejercicio 3
1. (–1.50, 12.70)
2. (–0.55, 3.28)
3. (–9.35, 17.51)
4. (–4.96, 1.60)
5.
a) (–0.96, 8.08)
b) (–0.51, 7.62)
Ejercicio 4
1. (132.24, 1016.46)
2. (0.17, 7.16)
3. (0.0049, 0.0157)
4. (0.021, 0.485)
Ejercicio 5
1. (0.036, 0.089)
2. (0.036, 0.184)
3. (–0.177, 0.057)
Ejercicio 6
1.
a) 0.0384
b) 0.2776
2. 0.1587
3.
a) 0.085
b) 0.341
Ejercicio 7
Ejercicio 8
Ejercicio 9
2
1. 10.1273; los cursos disminuyen la varianza de los puntajes en la lectura
2
2. 29.76; sí, la máquina está desajustada
2
3. 7.45; la varianza es igual a 1.3
Ejercicio 10
Respuestas de la autoevaluación
1. d)
2. d)
3. a)
4. b)
5. c); dado que el 0 está en el intervalo, no hay diferencia entre los grupos
6. c)
7. b)
8. b)
Apéndice A
En las tablas, los valores de Z varían de centésima en centésima desde 0 hasta 3.99.
En la fila se ponen las décimas y en las columnas las centésimas.
Por tanto, el cálculo de probabilidades con base en esta función y las propiedades de
simetría y el complemento estudiadas en la subsección 8.3.2, se podrá efectuar de la siguiente
forma, para losdiferentescasosque puedan ocurrir, y que ya se vieron en la sección 8.3.3:
326
3. P( Z0 Z Z0 ) 1 2Fd(Z0 )
Fd(a) Fd(b), en caso de que a, b 0,
4. P(a Z b) Fd( b) Fd( a), en caso de que a, b 0,
Ejemplo Dada Z una variable aleatoria continua con distribución normal estándar, se calculan las
probabilidades indicadas en el ejemplo 4 de la sección 8.3.3:
Ejemplo Dada Z una variable aleatoria continua con distribución normal estándar, se calculan las
probabilidades indicadas en el ejemplo 4 de la sección 8.3.3:
Tabla t-Student
336
Bibliografía básica
Walpole, Ronald E., y Raymond H. Myers, Probabilidad y estadística, Pearson Educación, 1998.
Este texto es propicio para ampliar los conocimientos sobre estadística inferencial
(unidad 10) y modelos continuos y discretos (unidades 5 a 8).
Bibliografía complementaria
Devore, Jay L., Estadística matemática con aplicaciones, Thomson Editores, 1998.