03 Pres 03

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 30

INFERENCIA ESTADÍSTICA

FRANCISCO VALENZUELA ROJAS


Segundo Semestre 2023
Presentación 03: Pruebas de hipótesis estadísticas
Correo electrónico: [email protected]

FRANCISCO VALENZUELA ROJAS 0


Prueba (Dócima) de Hipótesis estadística

Es un proceso mediante el cual se trata de comprobar si una afirmación sobre


alguna propiedad de la población puede sostenerse con la información que
entrega la muestra.

Es entendida como un método estadístico de toma de decisiones, es un


procedimiento que permite decidir si una proposición acerca de una característica
de la población puede mantenerse o ser rechazada.

Ejemplos:

1. La media de la edad de los estudiantes universitarios chilenos es a lo más 25


años.

2. El valor del parámetro λ en una distribución exponencial es λ=0,8

3. La distribución de los puntajes PSU 2012 en Chile es normal

4. Etc.

FRANCISCO VALENZUELA ROJAS 1


HIPÓTESIS NULA Y ALTERNATIVA

Hipótesis nula (H0): Es la hipótesis que se somete a prueba. Se llama nula porque
H0 representa la hipótesis que se mantiene, a no ser que los datos muestrales
indiquen su falsedad, y debe entenderse en el sentido de que es neutra.

Frecuentemente se utiliza en su interpretación la frase “no hay diferencia”.


Una hipótesis nula debe contener una proposición con los símbolos =, <=, >= (es
decir, debe contener la igualdad, sea estricta o no).
Hipótesis alternativa (H1): Es la aseveración contraria a la hipótesis nula. También
se le llama hipótesis del investigador (puesto que es la hipótesis que el investigador
desea verificar).

Una dócima de hipótesis, o test de hipótesis es una partición del espacio muestral
en dos regiones: una llamada REGIÓN CRÍTICA de H0 (R.C.)o de RECHAZO, y una
REGIÓN DE ACEPTACIÓN de H0 (R.A.). Se considera

α = nivel de significancia = tamaño de la región crítica.


(también se reporta en forma porcentual)

FRANCISCO VALENZUELA ROJAS 2


Matemáticamente:

Ω = 𝑅𝐶 ∪ 𝑅𝐴, 𝑅𝐶 ∩ 𝑅𝐴 = 𝜙

RC y RA son las regiones


críticas (rechazo) y
aceptación, respectivamente.
Ω es el conjunto de
todas las muestras
posibles, resumidas en
un estadístico (por
ejemplo, la media Se debe determinar un valor del estadístico que
muestral) delimite a las dos regiones (a este valor le llama-
remos valor crítico).

FRANCISCO VALENZUELA ROJAS 3


TIPOS DE ERRORES

Deseamos que la decisión con respecto a H0 sea la correcta, pero a veces


no lo será. Existen dos tipos de decisiones incorrectas:

Decisión Estado real de H0


con Verdadera Falsa
respecto a
H0
Rechazar Decisión incorrecta Decisión correcta
H0 (Error tipo 1) 1-β=P(rechazar H0|H0 falsa)
α=P(rechazar H0|H0 verdadera) Potencia del test
Nivel de significancia

No Decisión correcta Decisión incorrecta


rechazar 1 - α=P(no rechazar H0|H0 (Error tipo II)
H0 verdadera) β=P(no rechazar H0|H0 falsa)

FRANCISCO VALENZUELA ROJAS 4


DÓCIMA PARA LA MEDIA μ DE UNA D. NORMAL (σ2 CONOCIDA)

Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋𝑖 ~𝑁 𝜇, 𝜎 2

X − 0
Estadístico de prueba bajo H0: Z = ~ N (0,1) (µ0=media bajo H0)
 n

Hipótesis Hipótesis Hipótesis


H0: µ=µ0 H0: µ≥µ0 H0: µ≤µ0
H1: µ≠µ0 H1: µ<µ0 H1: µ>µ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑍/ 𝑍 > 𝑧1−𝛼Τ2 𝑅𝐶 = 𝑍/𝑍 < −𝑧1−𝛼 𝑅𝐶 = 𝑍/𝑍 > 𝑧1−𝛼

ത 0
𝑋−𝜇
En los tres casos, se rechaza H0 si 𝑍𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = σ ϵ 𝑅. 𝐶.
𝑛
FRANCISCO VALENZUELA ROJAS 5
Ejemplo 1: La variable coeficiente intelectual (CI), se distribuye en la
población chilena de manera normal, con media 100 y desviación estándar
15. Un investigador educacional está interesado en probar que las personas
que hablan más de un idioma tienen un CI superior a la media, aunque
igualmente distribuido. Se tomó una muestra aleatoria de n=25 personas, que
hablan más de un idioma, y se obtuvo un promedio muestral de 102. Con esta
información, ¿se sostiene la idea del investigador, con una significancia del 5%?

Solución: Siendo X = coeficiente intelectual de los chilenos

Supuesto: 𝑋~𝑁 𝜇, 𝜎 2 , nivel de significancia = α = 0,05


0 𝐻 : 𝜇 ≤ 100
1. Hipótesis: ቊ𝐻 : 𝜇 > 100 R.C.
1

2. Región Crítica: 𝑅𝐶 = 𝑍/𝑍 > 𝑧0,95 = 1,645 0,95

3.Valor observado del Estadístico 1,645

de prueba, bajo H0: 4. Decisión: No se rechaza H0


102 − 100 5. Conclusión: No hay evidencia suficiente
𝑍𝑜𝑏𝑠 = ≈ 0,6667 ∉ 𝑅. 𝐶.
15Τ 25 para pensar que las personas que hablan
más de un idioma tienen mayor C.I.
FRANCISCO VALENZUELA ROJAS 6
DÓCIMA PARA LA MEDIA μ DE UNA D. NORMAL (σ2 DESCONOCIDA)

Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋𝑖 ~𝑁 𝜇, 𝜎 2


X − 0
Estadístico de prueba bajo H0: T = ~ t(n −1) (µ0=media bajo H0)
S n
Hipótesis Hipótesis Hipótesis
H0: µ=µ0 H0: µ≥µ0 H0: µ≤µ0
H1: µ≠µ0 H1: µ<µ0 H1: µ>µ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑇/ 𝑇 > 𝒕𝟏−𝜶Τ𝟐;𝒏−𝟏 𝑅𝐶 = 𝑇/𝑇 < −𝒕𝟏−𝜶;𝒏−𝟏 𝑅𝐶 = 𝑇/𝑇 > 𝒕𝟏−𝜶;𝒏−𝟏

ത 0
𝑋−𝜇
En los tres casos, se rechaza H0 si 𝑇𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = S ϵ 𝑅. 𝐶.
𝑛
FRANCISCO VALENZUELA ROJAS 7
Ejemplo 2: Un fabricante de pólvora ha encontrado una nueva mezcla, que es
capaz de producir una velocidad de salida media del proyectil de 3.000 (pies/seg.)
Se elige una muestra aleatoria de tamaño 15, y se mide la velocidad de salida cuando
se disparan los proyectiles, en (pie/seg.), resultando:
3005 2995 2925 3005 2935 2935 2935 2965 2905 2945 2964 2948 2930 3003 2951
Con esta información, y suponiendo normalidad en la distribución de las velocidades,
¿existe evidencia suficiente para indicar que la velocidad media difiere de 3.000
(pies/seg.), con un 5% de significación?
Solución: Si X = velocidad de salida del proyectil (pie/seg.)
De la muestra dada, se tiene: 𝑋 = 2.956,4 𝑆 = 32,1221 𝛼 = 0,05 ⇒ 1 − 𝛼 = 0,95
𝐻0 : 𝜇 = 3.000 3.Valor observado del
1. Planteamiento de hipótesis: ቊ
𝐻1 : 𝜇 ≠ 3.000 Estadístico de prueba,
bajo H0:
2. Región Crítica: 𝑅𝐶 = 𝑇/ 𝑇 > 𝑡0,975;14 = 2,145 2.956,4 − 3.000
𝑇= ≈ −5,257 ∈ 𝑅. 𝐶.
32,1221Τ 15

4. Decisión: Se rechaza H0
0,95 5. Conclusión: Hay evidencia para pensar
que la velocidad media difiere de 3.000
(pie/seg.), con una significancia del 5%.
−2,145 2,145

6. Valor p = 𝑃 𝑇 > 𝑇𝑜𝑏𝑠 = 2 ∙ 0,0001 = 0,0002

FRANCISCO VALENZUELA ROJAS 8


DÓCIMA PARA LA VARIANZA σ2 , EN UNA DISTRIBUCIÓN NORMAL

Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋𝑖 ~𝑁 𝜇, 𝜎 2


𝑛 − 1 𝑆2
2
𝜒 = ~𝜒 2𝑛−1
Estadístico de prueba bajo H0: 𝜎02 (𝜎02 = varianza bajo H0 )

Hipótesis Hipótesis Hipótesis


𝐻0 : 𝜎 2 = 𝜎02 𝐻0 : 𝜎 2 ≥ 𝜎02 𝐻0 : 𝜎 2 ≤ 𝜎02
𝐻1 : 𝜎 2 ≠ 𝜎02 𝐻1 : 𝜎 2 < 𝜎02 𝐻1 : 𝜎 2 > 𝜎02

Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝜒 2 /𝜒 2 < 𝜒𝛼2 Τ2;𝑛−1 ∨ 2


2
𝑅𝐶 = 𝜒 2 /𝜒 2 > 𝜒1−𝛼;𝑛−1
𝑅𝐶 = 2 𝑅𝐶 = 𝜒 2 /𝜒 2 < 𝜒𝛼;𝑛−1
𝜒 2 > 𝜒1−𝛼 Τ2;𝑛−1

2
En los tres casos, se rechaza H0 si 𝜒𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = 𝑛 − 1 𝑆 2 /𝜎02 ∈ 𝑅. 𝐶.

FRANCISCO VALENZUELA ROJAS 9


Ejemplo 3: Una compañía fabrica partes de un automóvil, cuyos diámetros debieran
tener una varianza no mayor a 0,0002 pulgadas2. Un investigador piensa que la
varianza es superior a dicho valor estipulado.

Se toma una muestra aleatoria de 10 partes, las cuales arrojan una varianza muestral
de 0,0004. Con un nivel de significancia de 5%, ¿qué conclusión puede obtenerse?.
Suponga normalidad en la distribución de los diámetros.

Solución: Siendo X = diámetros de las partes del automóvil , 𝑋𝑖 ~𝑁 𝜇, 𝜎 2


𝑆 2 = 0,0004 , 𝛼 = 0,05

𝐻0 : 𝜎 2 ≤ 0,0002 R.C.
1. Planteamiento de hipótesis: ൝
𝐻1 : 𝜎 2 > 0,0002

2. Región Crítica: 2
𝑅𝐶 = 𝜒 2 /𝜒 2 > 𝜒0,95;9 = 16,919 1-α
3.Valor observado del 𝜒 20,95;9 = 16,919

Estadístico de prueba, 4. Decisión: Se rechaza H0


bajo H0: 5. Conclusión: Hay evidencia para pensar que
la varianza de los diámetros es mayor a 0,0002
2
9 ⋅ 0,0004 pulgadas2, con un 5% de significancia.
𝜒𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = = 18 ∈ 𝑅. 𝐶.
0,0002 6.Valor p = 2
𝑃 𝜒 2 > 𝜒𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = 0,0352
FRANCISCO VALENZUELA ROJAS 10
DÓCIMA PARA EL PARÁMETRO DE PROPORCIÓN p (D. BINOMIAL)
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋𝑖 ~𝐵𝑖𝑛 1, 𝑝
pˆ − p 0
~ N (0,1)
𝑋 n° de éxitos
Estadístico de prueba Z = 𝑝Ƹ = =
bajo H0: p0 (1 − p0 ) C . L
T . 𝑛 𝑛
n 𝑝0 = proporción bajo H0

Hipótesis Hipótesis Hipótesis


H0: p=p0 H0: p≥p0 H0: p≤p0
H1: p≠p0 H1: p<p0 H1: p>p0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑍/ 𝑍 > 𝑧1−𝛼Τ2 𝑅𝐶 = 𝑍/𝑍 < −𝑧1−𝛼 𝑅𝐶 = 𝑍/𝑍 > 𝑧1−𝛼

En los tres casos, se rechaza H0 si 𝑍𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = (𝑝ො − 𝑝0 )Τ 𝑝0 (1 − 𝑝0 )Τ𝑛 ∈ 𝑅. 𝐶.


FRANCISCO VALENZUELA ROJAS 11
Ejemplo 4: Se sabe que aproximadamente uno de cada 10 fumadores prefieren la
marca LL. Después de una campaña publicitaria se encuestó a 200 fumadores, para
determinar la efectividad de la campaña. La encuesta mostró que 26 fumadores
preferían la marca LL.
¿Muestran estos datos evidencia suficiente que indique un aumento en la aceptación
de la marca? Utilice un nivel de significancia α=0,05
Solución: Siendo X = número de fumadores que prefieren la marca LL,
en la muestra de tamaño 200.
26 1 9
𝑝Ƹ =
200
. Suponiendo válida H0, se tiene que 𝑝0 = ⇒ 1 − 𝑝0 =
10 10
𝐻 : 𝑝 ≤ 1Τ10
1. Planteamiento de hipótesis: ቊ 0
𝐻1 : 𝑝 > 1Τ10
R.C.
2. Región Crítica: 𝑅. 𝐶. = 𝑍/𝑍 > 𝑧0,95 = 1,645 ≡
0,95

3.Valor observado del


𝑧0,95 = 1,645

Estadístico de prueba, 4. Decisión: No se rechaza H0


bajo H0: 5. Conclusión: Los datos NO muestran
evidencia suficiente que indique un
26Τ200 − 1Τ10 aumento de aceptación de la marca, a un
𝑍𝑜𝑏𝑠 = ≈ 1,4142 ∉ 𝑅. 𝐶.
1Τ10 9Τ10 5% de significancia.
200 6.Valor p = 𝑃 𝑍 > 𝑍𝑜𝑏𝑠 = 0,0787
FRANCISCO VALENZUELA ROJAS 12
DÓCIMAS PARA DOS POBLACIONES NORMALES INDEPENDIENTES
Diferencia de medias, varianzas conocidas
2
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋𝑖 ~𝑁 𝜇𝑋 , 𝜎𝑋
(Y1, Y2,…,Ym) muestra aleatoria de tamaño m, 𝑌𝑖 ~𝑁 𝜇𝑌 , 𝜎𝑌2

Estadístico de prueba bajo H0: Z =


(X − Y )− 0
~ N (0,1)
 2
X n + 2
Y m
𝛿0 = diferencia de medias, bajo H0

Hipótesis Hipótesis Hipótesis


H0: µX-µY=δ0 H0: µX-µY≥δ0 H0: µX-µY≤δ0
H1: µX-µY≠δ0 H1: µX-µY<δ0 H1: µX-µY>δ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑍/ 𝑍 > 𝑧1−𝛼Τ2 𝑅𝐶 = 𝑍/𝑍 < −𝑧1−𝛼 𝑅𝐶 = 𝑍/𝑍 > 𝑧1−𝛼


ത 𝑌ത −𝛿0
𝑋−
En los tres casos, se rechaza H0 si 𝑍𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 =
2 Τ𝑛+𝜎 2 Τ𝑚
ϵ 𝑅. 𝐶.
𝜎𝑋 𝑌

FRANCISCO VALENZUELA ROJAS 13


Ejemplo 5: Un investigador educacional plantea que las mujeres tienen un
desempeño medio mejor que los hombres, en el área de lengua castellana y comuni-
cación, en la Prueba de Selección universitaria (PSU). Se sabe que las desviaciones
estándar poblacionales de los puntajes PSU 2012 de hombres y mujeres son, respecti-
vamente, 100 y 97 puntos. Se toman dos muestras aleatorias de cada género, arro-
jando los siguientes resultados:
Género Media Muestral n
(puntajes)
Hombres 504 25
Mujeres 506 30

Considerando α=0,01, y suponiendo normalidad, ¿Qué se puede concluir?


Solución: 𝐻0 : 𝜇𝐻 ≥ 𝜇𝑀 ≡ 𝜇𝐻 − 𝜇𝑀 ≥ 0

1. Planteamiento de hipótesis: 𝐻1 : 𝜇𝐻 < 𝜇𝑀 ≡ 𝜇𝐻 − 𝜇𝑀 < 0

2. Región Crítica: 𝑅𝐶 = 𝑍/𝑍 < −𝑧0,99 ≈ −2,33 4. Decisión: No se rechaza H0


3.Valor observado del 5. Conclusión: La evidencia es insufi-
Estadístico de prueba, ciente para pensar que las mujeres
bajo H0: rinden, en promedio, mejor que los
hombres en lenguaje, con una signifi-
504 − 506 − 0 cancia de α=0,01
𝑍= ≈ −0,075 ∉ 𝑅. 𝐶.
1002 Τ25 + 972 Τ30 FRANCISCO VALENZUELA ROJAS 14
Diferencia de medias, varianzas desconocidas e iguales
2
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋𝑖 ~𝑁 𝜇𝑋 , 𝜎
(Y1, Y2,…,Ym) muestra aleatoria de tamaño m, 𝑌𝑖 ~𝑁 𝜇𝑌 , 𝜎 2
(
Estadístico de prueba bajo T = X − Y − 0 ~ t ) 𝑛 − 1 𝑆𝑋2 + 𝑚 − 1 𝑆𝑌2
(n + m− 2 ) , 𝑆𝑝 =
H0: S p 1 n +1 m 𝑛+𝑚−2

(Sp, estimador combinado de la desviación Estándar) 𝛿0 = diferencia de medias, bajo H0


Hipótesis Hipótesis Hipótesis
H0: µX-µY=δ0 H0: µX-µY≥δ0 H0: µX-µY≤δ0
H1: µX-µY≠δ0 H1: µX-µY<δ0 H1: µX-µY>δ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑇/ 𝑇 > 𝑡1−𝛼Τ2;𝑛+𝑚−2 𝑅𝐶 = 𝑇/𝑇 < −𝑡1−𝛼;𝑛+𝑚−2 𝑅𝐶 = 𝑇/𝑇 > 𝑡1−𝛼;𝑛+𝑚−2

ത 𝑌ത −𝛿0
𝑋−
En los tres casos, se rechaza H0 si 𝑇𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = ϵ 𝑅. 𝐶.
𝑆𝑝 1Τ𝑛+1Τ𝑚
FRANCISCO VALENZUELA ROJAS 15
Ejemplo 6: Se toman muestras aleatorias de las golillas producidas por dos
máquinas, en un día determinado, y se miden los diámetros, obteniéndose:
Máquina 𝑋 𝑆 𝑛
A 2,33 cm 0,24 cm 21
B 2,61 cm 0,30 cm 21
Docime la hipótesis de que los diámetros de las golillas producidas por ambas
máquinas son iguales, para α=0,05, suponiendo que la distribución de los diámetros
de ambas máquinas son normales y con varianzas iguales, con m.a. independientes.
Solución: Siendo XA = diámetros de golillas, máquina A
XB = diámetros de golillas, máquina B
𝐻0 : 𝜇𝐴 − 𝜇𝐵 = 0 ≡ 𝜇𝐴 = 𝜇𝐵 ;𝛼 = 0,05
1. Planteamiento de hipótesis: 𝐻1 : 𝜇𝐴 − 𝜇𝐵 ≠ 0 ≡ 𝜇𝐴 ≠ 𝜇𝐵 ;𝑆𝑝 =
20 ⋅ 0,242 + 0,302
≈ 0,2717
40

2. Región Crítica: 𝑅. 𝐶. = 𝑇/ 𝑇 > 𝑡0,975;40 = 2,021 ≡

3.Valor observado del 0,95


Estadístico de prueba, bajo H0: 𝑡 40
−2,021 2,021
2,33 − 2,61 − 0
𝑇𝑜𝑏𝑠 = ≈ −3,339 ∈ 𝑅. 𝐶.
0,2717 ⋅ 1Τ21 + 1Τ21 5. Conclusión: Hay evidencia para
suponer que los diámetros medios
difieren entre ambas máquinas, α=0,05
4. Decisión: Se rechaza H0.
FRANCISCO VALENZUELA ROJAS 16
Diferencia de medias, varianzas desconocidas y diferentes
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋𝑖 ~𝑁 𝜇𝑋 , 𝜎𝑋2
(Y1, Y2,…,Ym) muestra aleatoria de tamaño m, 𝑌𝑖 ~𝑁 𝜇𝑌 , 𝜎𝑌2

Estadístico de prueba T =
(
X − Y − 0 ) ~ t( ) 𝜈=
𝑆𝑋2 Τ𝑛 + 𝑆𝑌2 Τ𝑚 2
𝑆𝑋2 Τ𝑛 2 Τ 𝑛 − 1 + 𝑆𝑌2 Τ𝑚 2 Τ 𝑚 − 1
bajo H0: S X n + SY m
2 2

𝛿0 = diferencia de medias, bajo H0

Hipótesis Hipótesis Hipótesis


H0: µX-µY=δ0 H0: µX-µY≥δ0 H0: µX-µY≤δ0
H1: µX-µY≠δ0 H1: µX-µY<δ0 H1: µX-µY>δ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑇/ 𝑇 > 𝑡1−𝛼Τ2;𝑣 𝑅𝐶 = 𝑇/𝑇 < −𝑡1−𝛼;𝑣 𝑅𝐶 = 𝑇/𝑇 > 𝑡1−𝛼;𝑣

ത 𝑌ത −𝛿0
𝑋−
En los tres casos, se rechaza H0 si 𝑇𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = 2 Τ𝑛+𝑆 2 Τ𝑚
ϵ 𝑅. 𝐶.
𝑆𝑋 𝑌

FRANCISCO VALENZUELA ROJAS 17


DÓCIMA PARA RAZÓN DE VARIANZAS
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋𝑖 ~𝑁 𝜇𝑋 , 𝜎𝑋2
(Y1, Y2,…,Ym) muestra aleatoria de tamaño m, 𝑌𝑖 ~𝑁 𝜇𝑌 , 𝜎𝑌2
𝑆𝑋2
Estadístico de prueba bajo H0: 𝐹 = 2 ~𝐹 𝑛−1,𝑚−1
𝑆𝑌

Hipótesis Hipótesis Hipótesis


𝐻0 : 𝜎𝑋2 = 𝜎𝑌2 ≡ 𝜎𝑋2 Τ𝜎𝑌2 = 1 𝐻0 : 𝜎𝑋2 ≥ 𝜎𝑌2 ≡ 𝜎𝑋2 Τ𝜎𝑌2 ≥ 1 𝐻0 : 𝜎𝑋2 ≤ 𝜎𝑌2 ≡ 𝜎𝑋2 Τ𝜎𝑌2 ≤ 1
𝐻1 : 𝜎𝑋2 ≠ 𝜎𝑌2 ≡ 𝜎𝑋2 Τ𝜎𝑌2 ≠ 1 𝐻1 : 𝜎𝑋2 < 𝜎𝑌2 ≡ 𝜎𝑋2 Τ𝜎𝑌2 < 1 𝐻1 : 𝜎𝑋2 > 𝜎𝑌2 ≡ 𝜎𝑋2 Τ𝜎𝑌2 > 1

Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝐹/𝐹 < 𝐹𝛼Τ2;𝑛−1;𝑚−1 ∨


𝑅𝐶 =
𝐹 > 𝐹1−𝛼Τ2;𝑛−1;𝑚−1 𝑅𝐶 = 𝐹/𝐹 < 𝐹𝛼;𝑛−1;𝑚−1 𝑅𝐶 = 𝐹/𝐹 > 𝐹1−𝛼;𝑛−1;𝑚−1

𝑆𝑋2
En los tres casos, se rechaza H0 si 𝐹𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = 2 ∈ 𝑅. 𝐶.
𝑆𝑌

FRANCISCO VALENZUELA ROJAS 18


Ejemplo 7: Un distribuidor mayorista de lápices plumones está considerando dos
marcas (A y B), que tienen el mismo precio. Los fabricantes de la marca B afirman
que sus lápices duran más, debido a un sistema especial de esparcimiento de la tinta
que hace que se requiera menor cantidad para un mismo trazo.

El comerciante decide tomar una muestra aleatoria de 10 lápices marca A y 15 lápices


marca B, y probar la longitud de un trazo continuado de cada uno de ellos, hasta que
se agote la tinta. Con un nivel de significación 0,05, ¿cuál debería ser la decisión
del comerciante, si los resultados obtenidos son los siguientes?

Media muestral, longitud marca A 𝑋 = 34,33 m

Media muestral, longitud marca B 𝑌 = 34,87 m

Varianza muestral, longitud marca A


𝑆𝑋2 = 0,0428 m2

Varianza muestral, longitud marca B 𝑆𝑌2 = 0,1820 m2

FRANCISCO VALENZUELA ROJAS 19


Solución: Es claro que en este caso, se procede a realizar el test de diferencia
de medias, pero el inconveniente inicial es saber si se puede o no suponer
igualdad de varianzas, por lo tanto, antes de aplicar la dócima de diferencia
de medias, se procede a realizar la dócima de razón de varianzas:

1. Planteamiento de hipótesis: 𝐻 : 𝜎 2 = 𝜎𝑌2 ≡ 𝜎𝑋2 Τ𝜎𝑌2 = 1


൝ 0 𝑋2
𝐻1 : 𝜎𝑋 ≠ 𝜎𝑌2 ≡ 𝜎𝑋2 Τ𝜎𝑌2 ≠ 1

2. Región Crítica:
1 1
𝑅𝐶 = 𝐹/𝐹 < 𝑓0,025;9;14 = = = 0.2633 ∨ 𝐹 > 𝑓0,975;9;14 = 3.2093
𝑓0,975;14;9 3.7976

0.95
𝐹 9,14
0.2633 3.2093
3. Valor observado del 0,0428
Estadístico de prueba, bajo H0: 𝐹𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = ≈ 𝟎, 𝟐𝟑𝟓𝟐 ∈ 𝑅. 𝐶.
0,1820
4. Decisión: Se rechaza H0.
5. Conclusión: Hay evidencia para suponer que las varianzas de las
longitudes para las marcas A y B son diferentes, con una significancia del 5%.
FRANCISCO VALENZUELA ROJAS 20
Al saber que podemos suponer varianzas desconocidas y diferentes, procedemos
a aplicar la correspondiente dócima. Para este caso, el número de grados de
libertad de la distribución T serán (ver página 17):

0,0428Τ10 + 0,1820Τ15 2
𝑔. 𝑙. = 𝜈 = = 21,46434. . . = 21
0,0428Τ10 2 Τ9 + 0,1820Τ15 2 Τ14

Note que si hubiésemos supuesto varianzas iguales, v = 10 + 15 – 2 = 23 g.l.

𝐻0 : 𝜇𝐴 − 𝜇𝐵 ≥ 0 ≡ 𝜇𝐴 ≥ 𝜇𝐵 ;𝛼 = 0,05
1. Planteamiento de hipótesis: ቊ
𝐻1 : 𝜇𝐴 − 𝜇𝐵 < 0 ≡ 𝜇𝐴 < 𝜇𝐵

2. Región Crítica:

𝑅𝐶 = 𝑇/𝑇 < −𝑡0,95;21 = −1,7207 0,95


𝑡(21)
3.Valor del Estadístico de −1,7207
prueba bajo H0: 4. Decisión: Se rechaza H0
5. Conclusión: Hay evidencia para pensar
34,33 − 34,87 − 0 que los lápices de la marca B duran más
𝑇= = −4,215 ∈ 𝑅. 𝐶. en promedio, que los de la marca A, α=0,05
0,0428Τ10 + 0,1820Τ15
FRANCISCO VALENZUELA ROJAS 21
MUESTRAS PAREADAS
Supuestos: (X1, Y1),(X2,Y2),…,(Xn,,Yn), n pares., donde 𝐸 𝑋𝑖 = 𝜇𝑖 𝐸 𝑌𝑖 = 𝜇𝑖 + 𝜇𝐷
𝑛 2
σ𝑛𝑖=1 𝐷𝑖 − 𝐷
𝐷𝑖 = 𝑌𝑖 − 𝑋𝑖 ~𝑁 𝜇𝐷 , 𝜎𝐷2 𝐷 = ෍ 𝐷𝑖 ൗ𝑛 𝑆𝐷 =
𝑛−1
D − 0
𝑖=1

Estadístico de prueba bajo H0: T = ~ t(n−1) 𝛿0 = diferencia de medias, bajo H0


SD n
Hipótesis Hipótesis Hipótesis
H0: µD=δ0 H0: µD≥δ0 H0: µD≤δ0
H1: µD≠δ0 H1: µD<δ0 H1: µD>δ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑅𝐶 = 𝑇/ 𝑇 > 𝑡1−𝛼Τ2;𝑛−1 𝑅𝐶 = 𝑇/𝑇 < −𝑡1−𝛼;𝑛−1 𝑅𝐶 = 𝑇/𝑇 > 𝑡1−𝛼;𝑛−1


En los tres casos, se rechaza H0 si 𝑇𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = 𝐷−𝛿0 ϵ 𝑅. 𝐶.
𝑆 Τ 𝑛
𝐷

FRANCISCO VALENZUELA ROJAS 22


Ejemplo 8: Los siguientes datos fueron recabados en un experimento diseñado
para verificar si existe una diferencia sistemática en los pesos obtenidos con dos
balanzas diferentes:
Muestra Peso (en gramos)
Balanza 1 Balanza II
1 11,23 11,27
2 14,36 14,41
3 8,33 8,35
4 10,50 10,52
5 23,42 23,41
6 9,15 9,17
7 13,47 13,52
8 6,47 6,46
9 12,40 12,45
10 19,38 19,35

Con un nivel de significancia α=0,05, pruebe si la diferencia de las medias en los


pesos obtenidos con las dos balanzas es significativa.
FRANCISCO VALENZUELA ROJAS 23
Solución: Si X = pesos balanza 1 (gramos), Y = pesos balanza 2 (gramos)
Note que los valores de X e y están emparejados, por lo cual trataremos este
caso como muestras pareadas. Calculando los valores necesarios:
10

𝐷 = ෍ 𝐷𝑖 ൘10 = 0,02 α=0,05


Muestra Peso en gramos Di 𝑖=1

Balanza Balanza (Yi - Xi) 2


σ10
𝑖=1 𝐷𝑖 − 𝐷
1 II 𝑆𝐷 =
9
≈ 0,0287

1 11,23 11,27 1. Planteamiento de hipótesis:


0,04
𝐻0 : 𝜇𝐷 = 0
2 14,36 14,41 0,05 𝐻1 : 𝜇𝐷 ≠ 0

3 8,33 8,35 0,02 2. Región Crítica:


𝑅𝐶 = 𝑇/ 𝑇 > 𝑡0,975;9 = 2,262
4 10,50 10,52 0,02
5 23,42 23,41 3. Valor observado del
-0,01 Estadístico de prueba, bajo H0:
6 9,15 9,17 0,02 0,02 − 0
𝑇𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = ≈ 2,2037 ∉ 𝑅. 𝐶.
7 13,47 13,52 0,05 0,0287Τ 10

8 6,47 6,46 -0,01 4. Decisión: No se rechaza H0.


9 12,40 12,45 0,05 5. Conclusión: Con α=0,05, la evidencia
es insuficiente para pensar que hay
10 19,38 19,35 -0,03 diferencia significativa entre los
pesos que miden ambas balanzas.
FRANCISCO VALENZUELA ROJAS 24
DÓCIMA PARA DIFERENCIA DE PROPORCIONES
Supuesto: (X1, X2,…,Xn) muestra aleatoria de tamaño n, 𝑋𝑖 ~𝐵𝑖𝑛 1, 𝑝𝑋
(Y1, Y2,…,Ym) muestra aleatoria de tamaño m, 𝑌𝑖 ~𝐵𝑖𝑛 1, 𝑝𝑌
𝑝Ƹ − 𝑝Ƹ 𝑌 − 𝛿0
Estadístico de prueba bajo H0: 𝑍 = 𝑋 𝛿0 = 𝑝𝑋 − 𝑝𝑌
𝑁º 𝑑𝑒 É𝑥𝑖𝑡𝑜𝑠 𝑒𝑛 𝑌 𝑝Ƹ𝑋 𝑞ො𝑋 𝑝Ƹ 𝑌 𝑞ො𝑌 𝛿0 = diferencia de proporciones, bajo H0
𝑛 + 𝑚
𝑁º 𝑑𝑒 É𝑥𝑖𝑡𝑜𝑠 𝑒𝑛 𝑋
𝑝Ƹ𝑋 = 𝑝Ƹ 𝑌 =
𝑛 𝑚
𝑞ො𝑋 = 1 − 𝑝Ƹ𝑋 𝑞ො𝑌 = 1 − 𝑝Ƹ𝑌

Hipótesis Hipótesis Hipótesis


H0: pX-pY=δ0 H0: pX-pY≥δ0 H0: pX-pY≤δ0
H1: pX-pY≠δ0 H1: pX-pY<δ0 H1: pX-pY>δ0
Región de Rechazo de H0 Región de Rechazo de H0 Región de Rechazo de H0

1-α 1-α 1-α

𝑍 < −𝑧1−𝛼Τ2 𝑜 𝑅𝐶 = 𝑍 < −𝑧1−𝛼 𝑅𝐶 = 𝑍 > 𝑧1−𝛼


𝑅𝐶 =
𝑍 > 𝑧1−𝛼Τ2
𝑝Ƹ 𝑋 −𝑝Ƹ 𝑌 −𝛿0
En los tres casos, se rechaza H0 si 𝑍𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜 = ෝ 𝑋𝑞
𝑝 ෝ𝑋 𝑝
ෝ 𝑞ෝ
ϵ 𝑅. 𝐶.
+ 𝑌 𝑌
𝑛 𝑚

FRANCISCO VALENZUELA ROJAS 25


En el caso en que 𝛿0 = pX – pY = 0, se tiene que px = py = p, y por tanto,
qx = qY = q, quedando la expresión original

𝑝Ƹ𝑋 − 𝑝Ƹ 𝑌 − 𝛿0 𝑝Ƹ𝑋 − 𝑝Ƹ 𝑌
𝑍= =
𝑝Ƹ𝑋 𝑞ො𝑋 𝑝Ƹ 𝑌 𝑞ො𝑌 1 1
𝑝Ƹ 𝑞ො 𝑛 + 𝑚
𝑛 + 𝑚

Donde
É𝑥𝑖𝑡𝑜𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑋 + É𝑥𝑖𝑡𝑜𝑠 𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑌
𝑝Ƹ =
𝑛+𝑚

O equivalentemente:
𝑛 ∙ 𝑝Ƹ𝑋 + 𝑚 ∙ 𝑝Ƹ 𝑌
𝑝Ƹ =
𝑛+𝑚

Con:
𝑞ො = 1 − 𝑝Ƹ

FRANCISCO VALENZUELA ROJAS 26


Ejemplo 9: Se organizará una votación entre los residentes de una comuna A
y la comuna contigua (B), para determinar si se aprueba una propuesta para la
construcción de una planta química. Como el lugar en el que se propone
construirla está dentro de los límites de ambas comunas, muchos votantes de
la comuna B consideran que la propuesta será aprobada, debido a la gran
proporción de votantes que está a favor de que se construya.

Se realiza una encuesta para determinar si hay una diferencia significativa en la


proporción de votantes de la comuna A y los votantes de la comuna B que
favorecen la propuesta. Si 120 de 200 votantes de la comuna A favorecen la
propuesta, y 240 de 500 residentes de la comuna B también lo hacen, ¿estaría
usted de acuerdo en que la proporción de votantes de la comuna A que
favorecen la propuesta supera a la proporción de votantes que favorecen la
propuesta, de la comuna B? Utilice un nivel de significancia 𝛼=0,05

FRANCISCO VALENZUELA ROJAS 27


Solución: Planteando las hipótesis: 𝐻0 : 𝑝𝐴 ≤ 𝑝𝐵 ≡ 𝑝𝐴 − 𝑝𝐵 ≤ 0
𝐻1 : 𝑝𝐴 > 𝑝𝐵 ≡ 𝑝𝐴 − 𝑝𝐵 > 0
𝛿0 = 0 (diferencia hipotética de proporciones, suponiendo H0 válida)

120 240 É𝑥𝑖𝑡𝑜𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝐴 + É𝑥𝑖𝑡𝑜𝑠 𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝐵


𝑝Ƹ𝐴 = 𝑝Ƹ 𝐵 = 𝑝Ƹ =
200 500 𝑛+𝑚
80 260 120 + 240 360 360 340
𝑞ො𝐴 = 𝑞ො𝐵 = 𝑝Ƹ = = 𝑞ො = 1 − =
200 500 200 + 500 700 700 700

120 240
200 − 500
Calculando 𝑍𝑜𝑏𝑠 = ≈ 2,869720216
360 340 1 1
∙ +
700 700 200 500

𝑅𝑒𝑔𝑖ó𝑛 𝑑𝑒 𝑅𝑒𝑐ℎ𝑎𝑧𝑜 𝑑𝑒 𝐻0 = 𝑍 > 𝑧1−0,05 = 𝑧0,95 = 1,645

Decisión: Z obs = 2,8697... pertenece a la región de rechazo de H0, se rechaza H0


Conclusión: Con un nivel de significancia 𝛼 = 0,05 , hay evidencia para suponer que
la proporción de votantes de la comuna A que favorecen la propuesta de construcción
De la planta química, es superior a la proporción de votantes a favor en la comuna B
FRANCISCO VALENZUELA ROJAS 28
VALOR P EN UN TEST DE HIPÓTESIS
Se define el valor p de una prueba de hipótesis a la menor probabilidad que se
tiene, para el cual la hipótesis nula puede ser rechazada. Es una forma ampliamente
usada, especialmente por software de análisis de datos, para reportar una dócima y
decidir si se rechaza o no la hipótesis nula.

En la práctica: 𝑉𝑎𝑙𝑜𝑟 𝑝 > 𝛼 ⇒ No se rechaza H0


𝑉𝑎𝑙𝑜𝑟 𝑝 < 𝛼 ⇒ Se rechaza H0

Ejemplo: Para la dócima anterior, 𝑇𝑜𝑏𝑠 ≈ 2,2037 ∉ 𝑅. 𝐶.

H0

2,2037
0,95

t(9)
−2,262 2,262

De acuerdo a esta región crítica:


𝑉𝑎𝑙𝑜𝑟 𝑝 = 𝑃 𝑇 > 2,2037 = 2𝑃 𝑇 > 2,2037 ≈ 0,06 > 𝛼 = 0,05 ⇒ No se rechaza H0
(probabilidad calculada con Excel) FRANCISCO VALENZUELA ROJAS 29

También podría gustarte