P1 TAREA1 Carlos Cuxim Tuz

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 13

ACTIVIDAD 1

Inferencia Estadística

Integrantes: Naomy Abigail Amaya Medina, Carlos Enrique Cuxim Tuz, Jorge Roberto Pech
May, Abigail Ruiz Enríquez.

Instrucciones: Responde cada uno de los siguientes ejercicios.

1. Sea X 1 , … , X n una muestra aleatoria de una distribución Poisson( λ). Hallar:


a) La distribución de X 1 + X 2+ …+ X n .

Solución. Sea Y = X 1 + X 2 +…+ X n sabemos por los teoremas de la función generadora de


momentos que
n
n n
t ∑ λ ( et−1 ) t

mY ( t )=∏ mX ( t )=∏ e λ (e −1)=e


i
i=1
=e nλ (e −1) .
i =1 i=1

Pero notemos que esta última expresión corresponde a la función generadora de momentos
de una Poisson ( nλ ), de esta forma tenemos que X 1 + X 2+ …+ X n ∼ Poisson ( nλ ). (Ok!)

b) E ( X́ )
c) V ( X́ )

Solución. Por teoremas de la media muestral sabemos que si μ y σ 2 es la esperanza y


varianza de la distribución conjunta de X 1 , … , X n entonces E ( X́ ) =μ y V ( X́ ) =σ 2 /n. Ahora,
como X 1 , … , X n ∼ Poisson ( λ ) entonces sabemos que μ=σ 2=λ , de esta forma E ( X́ ) =λ y
V ( X́ ) =λ/n. (Ok!)

d) E ( 2 X́ )
e) V ( 2 X́ )

Solución. Por propiedades de la esperanza y varianza sabemos que

E ( 2 X́ )∧¿ 2 E ( X́ ) =2 λ ,

¿ V ( 2 X́ )∧¿ 4 V ( X́ )= .
n
(Ok!)
f) E ( 2 X́ +3 )
g) V ( 2 X́ +3 )

Solución. De manera análoga al caso anterior, por propiedades de la esperanza y varianza


tenemos que

E ( 2 X́ +3 ) ∧¿ 2 E ( X́ )+ 3=2 λ+3 ,

¿V ( 2 X́ +3 ) ∧¿ 4 V ( X́ )= .
n
(14 puntos)

2. Si X 1 , … , X n es una muestra aleatoria que se distribuye exp( λ).


a) ¿Cuál es la función de densidad conjunta de la muestra?

Solución. Como la función de densidad de la exponencial es

f ( x )= λ e−λx .
Entonces por definición de muestra aleatoria, la función de densidad conjunta está dada por
n
n n − λ ∑ xi
−λ x i n
f ( x 1 , … , x n ) =∏ f ( xi ) =∏ λ e =λ e i=1
.
i=1 i=1

(Ok!)

b) Hallar la distribución de X 1 + X 2+ …+ X n .

Solución. Sea Y = X 1 + X 2 +…+ X n entonces como las variables aleatorias X i son


independientes tenemos que la función generadora de momentos de Y está dada por
n n −1 −n
t t
mY ( t )=∏ mX ( t )=∏ 1−
i =1
i
i=1
( ) ( )
λ
=¿ 1−
λ
.¿

Sin embargo, lo anterior representa la función generadora de momentos de una distribución


gamma con parámetros n , λ , luego como la función generadora de momentos es
característica tenemos que X 1 + X 2+ …+ X n Gamma(n , λ). (Ok!)
n
1
c) Hallar la distribución de X́ = ∑ X i.
n i=1

n
Solución. Primeramente, por el inciso anterior nosotros sabemos que ∑ Xi Gamma(n , λ) y
i=1
por tanto su función generadora de momentos es
−n
t
( )
m ( t )= 1−
λ
.

Luego entonces, por teorema demostrado la función generadora de momentos de X́ está


dada por
−n
t t
m X́ ( t )=m ()(
n
= 1−
λn ) .

Además, como la función generadora de momentos es característica para una única


distribución, tenemos que X́ Gamma(n , λn). (Ok!)

(9 puntos)

3. Si una población tiene σ =2 y X́ es la media de una muestra de tamaño 100, hallar


los límites entre los que está X́ −μ con probabilidad 0.90. Resuélvase primero
usando la desigualdad de Chevyshev y luego usando el Teorema del Límite Central.
¿Por qué difieren los resultados?

Solución. Queremos hallar una t tal que P (|X́ −μ|≤ t ) =0.90. Es posible reescribir la igualdad
como
1−P (| X́−μ|≥ t )∧¿ 0.9
¿ ⇒ P (| X́−μ|≥ t ) ∧¿ 0.1 .
Pero, por la desigualdad de Chevyshev, también sabemos que
0.04
P (|X́ −μ|≥ t ) ≤ .
t2
Sustituyendo, obtenemos que
0.04
0.1∧≤
t2
2
¿ t ∧≤ 0.4 .
Aplicando raíz cuadrada a ambos lados de la desigualdad,
10
|t|≤ √ .
5
Al ser t un número real, t ≤|t |≤
√ 10 , por lo que concluimos que
5
√ 10 =0.90 .
(
P | X́−μ|≤
5 )
1
Por el teorema 1, X́ N μ , ( 25), para hallar t tal que P (|X́ −μ|≤ t ) =0.90, vamos a usar el

TLC.
P (|X́ −μ|≤ t ) ∧¿ P (−t ≤ X́−μ ≤ t )
¿∧¿ P (−5 t ≤ Z ≤ 5 t )
¿∧¿ Φ ( 5 t ) −Φ (−5 t )
¿∧¿ 2 Φ ( 5t )−1=0.90 ,
⇒ 2 Φ ( 5 t ) ∧¿ 1.9
¿ Φ ( 5 t )∧¿ 0.95 .

Usando la tabla normal,


5t∧¿ 1.65
¿ t∧¿ 0.33 .
Notemos que hemos obtenido distintos valores de t , esto se debe a que la desigualdad de
Chebyshev nos da una cota para el valor que estamos buscando, mientras que el TLC
aproxima dicho valor. (Ok!) (6 puntos)

4. Sea X 1 , X 2 , … , X 5 una muestra aleatoria de tamaño 5 de una población normal con


media 0 y varianza 1. Supongamos que X 6 es otra variable aleatoria que registrará
una sexta observación de la población, independientemente de las de la muestra.
5
2 2 2
¿Cuál es la distribución de 2(5 X́ + X 6)/ U donde U = ∑ ( X i − X́ ) ? Justifica tu
i=1
respuesta.

Solución. En primer lugar, veamos que la v.a. se puede reescribir como sigue
2 2 2
2 ( 5 X́ 2+ X 26 )
∧¿
[
2 ( √ 5 ) ( X́−0 ) + ( X 6−0 ) ]
U 5
2
∑ ( X i− X́ )
i=1
x
2 2
X −0

¿=
2
[( X́ −0
1/ √5
5
)(
+ 6
1 )]
2
∑ ( X i − X́ )
i=1
x
2 2
X́−0 X −0
( 1/ √ 5
+ 6 )(
1 )
2
¿= 5
.
2
∑ ( X i− X́ )
i=1
4
Ahora, tengamos en cuenta lo siguiente:
2
1 X́−0
 ( ) (
X́ ∼ N 0 ,
5

1/ √ 5)∼ χ 21 .

2
X −0
X ∼ N ( 0,1 ) → (
1 )
6 2
 6 ∼χ . 1

 De los dos puntos anteriores, tenemos que

X́−0
2
X −0 2
V= ( )(
1 / √5
+ 6
1 )
∼ χ 22 .

 Por otro lado, cada X i , 1≤ i≤ 5 tiene distribución normal estándar, por tanto

5
2
U =∑ ( X i − X́ ) ∼ χ 24 .
i=1

V /m 2 2
Finalmente, dado que la expresión tiene la forma Y = , donde V ∼ χ m y U ∼ χ n, entonces
U /n
la distribución es Y ∼ F 2,4 . (Ok. 6 Puntos)

5. Sea Y 1 , … ,Y 5 una muestra aleatoria de tamaño 5 de una población normal con media 0
5
1
y varianza 1 y sea Ý = ∑ Y i. Sea Y 6 otra observación independiente de la misma
5 i=1
población.
i. ¿Cuál es la distribución de
5
2
a) W = ∑ Yi
i=1

Solución. Como Y i N (0 , 1) para cada i y son independientes, entonces tenemos por teorema
anterior (¿Cuál teorema?) que

W χ 25 .

Se distribuye como una Ji-cuadrada con 5 grados de libertad. (Ok!)

5
2
b) U = ∑ ( Y i−Ý )
i=1

Solución. Como las Y i se distribuyen normales estándar y son independientes, entonces por
teorema anterior (¿??) se tiene que U se distribuye como Ji-cuadrada con 4 grados libertad,
2
esto es U χ 4 . (Ok!

5
2
c) ∑ ( Y i−Ý ) +Y 26?
i=1

5
2
Solución. Por el inciso b) tenemos que ∑ ( Y i−Ý ) χ 24 , además como Y 6 es una normal
i=1
2
estándar independiente tenemos que Y 6 χ 21, luego por teorema demostrado (Ok!)
5
2
∑ ( Y i−Ý ) +Y 26 χ 24 + χ 21= χ 25 .
i=1

ii) ¿Cuál es la distribución de

a)
√5 Y 6
√W
Solución. Primeramente, notemos que la expresión anterior la podemos reescribir como

√5 Y 6 Y 6
= .
√W W
√ 5
2
Además de los incisos anteriores Y 6 N (0,1) y W χ 5, luego por definición

√5 Y 6
t .
√W 5
Tiene distribución t de student con 5 grados de libertad. (Ok!)

2Y 6
b) ,
√U

Solución. Similarmente al inciso anterior tenemos que la expresión anterior la podemos


reescribir como

2Y 6 Y6
= .
√U U
√ 4
2
De donde Y 6 N (0,1) y W χ 4 , luego por el mismo argumento

2Y 6
t .
√U 4
Tiene una distribución t de student con 4 grados de libertad. (Ok!)

2(5 Ý 2+Y 26)


c) ?
U

2 2 2
Solución. Primeramente, recordemos que Y 6 χ 1 y U χ 4 , además sabemos que Ý N 0 , ( 51 )
,

entonces √ 5 Ý N ( 0 , 1 )de este modo la expresión anterior la podemos rescribir como

2
( √ 5 Ý ) + Y 26 χ 21+ χ 21 χ 22
2 2
2 ( 5 Ý +Y ) 6 2 2 2
= .
U U χ 24 χ 24
4 4 4
Que por definición implica que la variable aleatoria se distribuye F 2,4. (Ok!)

(18 puntos)

6. Suponga que X́ 1 y X́ 2 son las medias muestrales de dos muestras de tamaño n ,


provenientes de una población con varianza σ 2. Determina el valor de n tal que la
probabilidad de que | X́ 1− X́ 2|> σ sea 0.01.

Solución. Primeramente definamos a la variable aleatoria Y = X́ 1− X́ 2, entonces para una n lo


suficientemente grande, por el teorema del límite central tenemos que X́ 1 , X́ 2 se distribuyen

σ 2 , luego por
normalmente, además por ser medias muéstrales toman los parámetros N μ ,
( )
n
propiedades de la variables independientes distribuidas normalmente tenemos que

2σ2 √n Y N ( 0,1 ) .
(
Y N 0,
n
→)σ √2

Ahora por lo anterior tenemos que

n √ nY n
P (| X́ 1− X́ 2|> σ )=P (|Y |>σ )=1−P (|Y |≤ σ ) =1−P (−σ ≤ Y ≤ σ )=1−P −(√ ≤
2 σ √2

2√)
.

Luego como nos interesa que la probabilidad sea 0.01, tenemos que n es un número que
debe cumplir que

1−P −( √ n2 ≤ Z ≤ √ n2 )=0.01 .
Que equivalentemente es lo mismo que

P− ( √ n2 ≤ Z ≤ √ n2 )∧¿ 0.99
n 0.99
¿ 0.5+ P ( 0≤ Z ≤ )
√2 ∧¿ 0.5+
2
n n
¿ P ( Z ≤ )=Φ ( )∧¿ 0.995.
√2 √2
Usando una tabla de distribución acumulada de la normal estándar tenemos que
Φ ( 2.58 ) ≈ 0.995, de esta forma tenemos que
n
√ 2
≈ 2.58 ⟹ n≈ 13.31

De donde obtenemos que n=14 como queríamos hallar. (Ok, si hubieran usado Chebyshev
habrían obtenido n>200 ) (6 puntos)

7. Sea X 1 , … , X n una muestra aleatoria de una distribución N (0,1). Definamos


k n
1 1 1
X́ k = ∑ X i y X́ n−k = ∑ X i. ¿Cuál es la distribución de ¿?
n i=1 n−k i=k+1 2

Solución. Por el teorema de suma de variables con distribución normal tenemos que

k k k
1
X́ k =∑ X i ∼ N ( ∑ 1k ( 0 ) , ∑ k12 ( 1 ) =N 0 , 1k .
) ( )
i=1 k i=1 i=1

De manera análoga tenemos que

n n−k n−k n−k


1 1 1 1 1
X́ n−k = ∑
i=k+1 n−k
X i =∑
i=1 n−k
X i+k ∼ N
( ∑ n−k
i=1
(0 ), ∑
i=1 ( n−k )
2
) (
( 1 ) =N 0 ,
n−k).

De esta forma, usando el mismo teorema tenemos que

1 1 1 1 1 1 1 2n−k
2 k n−k (
( X́ + X́ ) ∼ N 2 ⋅0+ 2 ⋅0 , 2 ⋅ n + 2 ⋅ n−k =N 0 ,
2 2 4 n ( n−k )
.
) ( )
1 n
(Error, el resultado debe ser
( )
( X́ + X́ ) N 0 , 4 k ( n−k ) ) (7.5 puntos)
2 k n−k

8. Sean X 1 , X 2 , X 3 variables aleatorias independientes con distribución normal


N ( 2i , 3i ) . Sea Y = X 1−2 X 2−3 X 3.
i) Hallar la función de densidad de Y .

Solución. Sabemos que X 1 ∼ N (2 , 3 ) , X 2 ∼ N ( 4,6 ) y X 3 ∼ N ( 6,9 ). Por el teorema para v.a. X i


2
independientes y cumplen que X i ∼ N ( μi , σ i ), podemos proceder de la siguiente forma

Y = X 1−2 X 2−3 X 3 ∼ N [ 2+ (−2 ) ( 4 )+ (−3 ) (6 ) ,3+ (2 )2 ( 6 ) + ( 3 )2 ( 9 ) ]


De modo que Y ∼ N (−24 , 108 ) y haciendo uso de la tabla de distribuciones, la función de
densidad de Y esta dada por (Ok!)
2
− ( y+24 )
1 216
f ( y )= e .
√216 π

ii) Hallar P ( Y ←25.96 ) .

Y + 24
Solución. Estandarizando Y tenemos que ∼ N ( 0,1 ) , así
6 √3

P ( Y ←25.96 )=P ( Y6+24 ←


1.96
√3 6 √ 3 ) =P ( Z ≤−
1.96
6 √3 )
.

−1.96
Ya que ≈−0.1886 , usando la tabla normal hallamos que
√ 108
P ( Y ←25.96 ) ≈ P ( Z ≤−0.1886 ) ≈ 0.42858 .

(Ok! 6 puntos)

9. Un guardabosque que estudia los efectos de la fertilización en ciertos bosques de


pino en el Sureste, se interesa en estimar el área promedio de la base de los pinos: Al
estudiar las áreas de la base de árboles similares durante muchos años, descubrió
que estas mediciones (en pulgadas cuadradas) tiene una distribución normal con una
desviación estándar de aproximadamente 4 pulgadas cuadradas. Si el
guardabosques selecciona una muestra de n=9 árboles, encuentra la probabilidad de
que la media muestral se desvíe a lo más en 2 pulgadas cuadradas de la media de la
población.

Solución. Por los teoremas ya demostrados, sabemos que la media muestral X́ 9 tiene una

distribución N ( μ ,16 /9 ), de esta forma tenemos que ( X́ 9−μ ) /(4 /3)∼ N (0,1), de este modo

−2 X́ 9−μ 2 3
P (| X́ 9−μ|≤ 2 )=P ( ≤ ≤
4 /3 4 /3 4 /3 ) (
=P
−3
2
≤Z≤ .
2 )
Usando una tabla de distribución acumulada de la normal estándar sabemos entonces que

P (| X́ 9−μ|≤ 2 )=Φ ( 1.5 )−Φ (−1.5 ) ≈ 0.9332−0.0668 ≈ 0.8664 .


De esta forma, la probabilidad de que la media muestral se desvíe de la media de la población
en a lo más 2 pulgadas es de aproximadamente 0.866 3. (Ok! 6 puntos)

10. Los amperímetros producidos por una compañía se venden en el mercado con la
especificación de que la desviación estándar de las lecturas no es mayor que 0.2
amp. Se utilizó uno de estos amperímetros para efectuar 10 lecturas independientes
en un circuito de prueba con corriente constante. Si la varianza de estas 10
mediciones es 0.065 y es razonable suponer que las lecturas tienen una distribución
normal ¿indican los resultados que el amperímetro que se utilizó no satisface las
especificaciones del mercado? [Sugerencia: encuentra la probabilidad aproximada de
que la varianza de la muestra exceda 0.065, si la varianza real de la población es 0.4].

Solución. Se nos pide hallar P ( S 2 ≥ 0.065 ) . Procedemos de la siguiente manera:

P ( S 2 ≥ 0.065 ) ∧¿ P ( ( n−1 ) S 2 ≥ ( 10−1 )( 0.065 ) )


x
2
( n−1 ) S ( 10−1 )( 0.065 )
¿=P
( σ2

( 0.2 )2 )
x
( n−1 ) S2
¿=P ( σ2
≥ 14.625 . )
( n−1 ) S 2 2
Si hacemos U = 2
, entonces U ∼ χ n−1. Por lo tanto, usando la tabla χ 2 obtenemos:
σ
P ( χ 2 ≥ 14.625 ) =0.1 con 9 grados de libertad. (Es mayor que 0.1, si usan software verán que
es 0.1018) (6 puntos)

11. La resistencia a la tensión para cierto tipo de alambre se distribuye normalmente con
una media desconocida μ y una varianza desconocida σ 2. Se seleccionaron al azar
seis segmentos i , donde i=1 , 2, … , 6 : La media de la población μ y la varianza σ 2 se

2 σ 2 , puede ser estimada por


pueden estimar por Ý y S2, respectivamente. Ya que σ Y =
n
S2 2S
, encuentra la probabilidad aproximada de que Ý esté a lo más a de la
n √n
verdadera media poblacional μ.
2S
Solución. Se nos pide hallar P |Ý −μ|≤( √n )
. Como no conocemos el valor de σ Ý , pero

2 S2 , tenemos que
sabemos que σ Ý ≈
n

2S 2S

( )

P √ n ≤ |Ý −μ| ≤ √ n =P (−2 ≤T ≤ 2 ) ,
S S S
√n √n √n
donde T ∼t 5. De la tabla t vemos que el valor mas cercano a 2 resulta ser 2.015, de esta
forma

P (−2.015 ≤T ≤ 2.015 )=0.9.

2S
Luego, la probabilidad aproximada de que Ý esté a lo más a de la verdadera media
√n
poblacional μ, es del 90%. (Ok! 7 puntos)

12. Como un control de la abundancia relativa de cierta especie de pez en dos lagos se
hacen n=50 observaciones con respecto a los resultados de la captura mediante el
uso de trampas para cada lago. Para cada observación el experimentador solamente
anota si está o no la especie deseada. La experiencia previa ha mostrado que esta
especie aparecerá en las trampas del lago A en aproximadamente 10% de las veces,
mientras que en las trampas del lago B aproximadamente 20% de las veces. Utilizar
estos resultados para aproximar la probabilidad de que la diferencia entre las
proporciones de las muestras difiera a lo más en 0.1 de la diferencia de las
proporciones reales.

Solución. Definimos lo siguiente:

1. p A =0.1 la proporción de peces en el lago A.


2. pB =0.2 la proporción de peces en el lago B.
3. X́ A : La media muestral de peces en el lago A.
4. X́ B: La media muestral de peces en el lago B.
5. X = X́ A − X́ B

Tenemos que la distribución de cada X́ es aproximadamente normal, es decir,


σ 2A σ 2B
(
X́ A ∼ N μ A ,
50 ) (
, X́ b ∼ N μ B ,
50 )
.

Sin embargo, cada una de las X i , 1≤ i≤ 50 que componen X́ A y X́ B tienen distribución


Bernoulli. Entonces

μ A = p A =0.1 , σ 2A= p A ( 1− p A )=0.1 ⋅0.9=0.09

μ B= pB =0.2 , σ 2B = pB ( 1−p B ) =0.2⋅ 0.8=0.16 .

por tanto X́ A ∼ N ( 0.1 , 0.0018 ) , X́ B ∼ ( 0.2 ,0.0032 ) . Por otro lado, X también tiene distribución
normal pues es la suma de dos v.a.i. con distribución normal; de manera que podemos
calcular la media y la varianza de X como sigue:

μ X =0.1−0.2=−0.1 , σ 2=0.0018+0.0032=0.005 .

Así X ∼ N (−0.1 , 0.005 ). Finalmente, se nos pide hallar P ( ¿ X− ( 0.1−0.2 )∨≤0.1 ) , entonces

X−(−0.1 ) 0.1
P (|X −(−0.1 )|≤ 0.1 )∧¿ P ( √−0.1
0.005

√ 0.005 √ 0.005 )

x
¿=P (−1.4142≤ Z ≤1.4142 )
x
¿=1−2 P ( Z >1.4142 ) .

De la tabla de distribución normal tenemos P ( Z >1.4142 )=0.0793 y concluimos que


P (|X −(−0.1 )|≤ 0.1 )=0.8414, es decir, 84.14% de probabilidad.

La respuesta es correcta pero el procedimiento debe ser más claro. Usen notación de
proporciones. La idea es la siguiente:

E ( ^p1 )= p 1, E ( ^p2 )= p 2, E ( ^p1− ^p2 ) =p 1− p2

p1 q1 p2 q2 p1 q1 p2 q2 p 1 q 1 + p 2 q 2
V ( ^p1 )= , V ( ^p2 )= , V ( ^p1− ^p2 )= + = ya que n1 =n2
n1 n2 n1 n2 n

Usen esto y el hecho de que n>30 para hallar P [|( ^p − ^p ) −( p − p )|≤ 0.1 ]
1 2 1 2

(8 puntos)

CALIFICACIÓN: 100

También podría gustarte