Semana 11 - Prueba de Hipótesis I

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 43

Facultad de Economía

Semana N° 11:
Prueba de hipótesis

Asignatura: Estadística inferencial aplicada


Mg. Carmen Valdivia Arenas

Semestre Académico 2020-2


¿Qué es una hipótesis?
 En la practica nos vemos obligados con frecuencia a tomar decisiones
relativas a una población sobre la base de información proveniente de
muestras. Tales decisiones se llaman decisiones estadísticas.

 Una hipótesis es una creencia sobre la población, principalmente para


los parámetros: Media, Varianza y Proporción

 La hipótesis es una afirmación o conjetura referida bien a la forma o tipo


de distribución de probabilidad de la población o referida al valor o
valores de uno o mas parámetros de la distribución de la distribución
conocida su forma.

2
 En las aplicaciones básicas, se asume dada la forma de la
distribución de la población. En este caso, las hipótesis
estadísticas consisten en suponer que los parámetros que
definen a la población, toman determinados valores
numéricos.

 Ejemplos:
 La longitud media de determinados tipo de objetvos es de 10 cm.
 La proporción de objetvos defectuosos producidos por cierto proceso
nunca es superior al 8%
 La varianza de la longitud de cierto tipo de objetos es 0.25 cm2.

3
Hipótesis simple y compuesta
 Hipótesis simple: cualquier hipótesis estadística que especifica
completamente la distribución de la población, es decir, especifica la
forma de la distribución y el valor de sus parámetros.

 Hipótesis compuesta: cualquier hipótesis que no especifique


completamente la distribución de la población.

 Ejemplo:
 Hipótesis simple: El ingreso mensual promedio de los empleados de cierta ciudad es
µ=S/.2500, suponiendo que los ingresos mensuales se distribuyen en forma normal con
desviación estándar conocida δ=300
 Hipótesis compuesta: Los ingresos mensuales se distribuyen en forma normal con
desviación estándar conocida de δ=300 y el ingreso promedio mensual es µ ≠ S/.2500 ó µ >
S/.2500 ó µ < S/.2500 . No especifica en realidad la media.

4
Hipótesis nula y alternativa
 Hipótesis nula: Es la hipótesis que es aceptada provisionalmente como
verdadera y cuya validez será sometida a comprobación experimental.
Los resultados nos permitirán seguir aceptándola como verdadera o, nos
indicará que debemos rechazarla como tal.
 Se denota por H0.
 Toda hipótesis nula va acompañada de otra hipótesis llamada alternativa.

 Hipótesis alternativa: Es la suposición contraria a la hipótesis nula y es


aceptada en caso que la hipótesis nula sea rechazada. Se denota por H1.

 La hipótesis nula siempre debe contener el signo igual porque es la


hipótesis que se debe probar y es necesario que incluya un valor
especifico del parámetro.

5
Ejemplo: Si la µ0 es un valor del parámetro
desconocido µ de una población cuya distribución se
supone conocida, entonces son hipótesis nulas y
alternativas las siguiente afirmaciones:

 H0: µ = µ0 y H 1 : µ ≠ µ0

 H0: µ ≤ µ0 y H1: µ < µ0

 H0: µ ≥ µ0 y H1: µ > µ0

6
 Hipótesis nula Ho  Hip. Alternativa H1
 La que contrastamos  Niega a H0 (y creemos que es ‘mejor’).

 Los datos pueden refutarla  Los datos pueden mostrar evidencia a


favor

 No debería ser aceptada sin una gran


 No debería ser rechazada sin una evidencia a favor.
buena razón.

H 0 : p  50% , , 

 H1 : p  50%  , , 

7
Prueba de una hipótesis estadística
 Para tomar decisiones estadísticas se requieren de las dos hipótesis:
nula y alternativa referidas a un parámetro.
 La prueba de una hipótesis estadística es un proceso que nos conduce a
tomar la decisión de aceptar o rechazar la hipótesis nula H0 en
contraposición de la hipótesis alternativa H1con base en los resultados de
una muestra aleatoria seleccionada de la población en estudio.
 La hipótesis nula H0 es la primera que se debe plantear y debe ser
establecida de manera que especifique un valor del parámetro en
estudio.

 La aceptación de la hipótesis nula significa que los datos de la muestra


no proporcionan evidencia suficiente para refutarla. El rechazo significa
que los datos de la muestra proporcionan evidencia suficiente de que la
hipótesis nula es falsa.

8
Tipos de pruebas de hipótesis
El tipo de prueba depende básicamente de la hipótesis
alternativa.

 Prueba de una cola: toda prueba donde la alternativa H1 es


unilateral. Ejemplos:
 H0: µ = µ0 y H1: µ < µ0

 H0: µ = µ0 y H1: µ > µ0

 Prueba de dos colas: cuando la alternativa H1 es bilateral.


Ejemplo:
 H0: µ = µ0 y H1: µ ≠ µ0
9
 Problema: ¿El sueldo promedio es S/.2500 para
Lima?

 Solución:

 Traducir a lenguaje estadístico: µ = S/.2500

 Establecer su opuesto: µ ≠ S/.2500

 Seleccionar la hipótesis nula µ = S/.2500

10
Errores de tipo I y de tipo II
 Al tomar la decisión de aceptar o rechazar la hipótesis nula
H0 con base en los resultados obtenidos de una muestra
aleatoria seleccionada de la población en estudio; hay cuatro
posibles situaciones que determinan si la decisión tomada es
correcta o incorrecta.

Decisión H0 verdadera H0 falsa


Rechazar H0 Error tipo I Decisión correcta
Probabilidad: α Probabilidad: 1-β
Aceptar H0 Decisión correcta Error tipo II
Probabilidad: 1-α Probabilidad: β

11
  

12
Riesgos al tomar decisiones
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito

Los datos pueden refutarla

La que se acepta si las pruebas


 H0: Hipótesis nula no indican lo contrario
 Es inocente
Rechazarla por error tiene graves
consecuencias

 H1: Hipótesis alternativa No debería ser aceptada sin una gran


 Es culpable evidencia a favor.

Rechazarla por error tiene


consecuencias consideradas menos
graves que la anterior

13
Tipos de error al tomar una decisión

Realidad
Inocente Culpable

veredicto Inocente OK Error


Menos grave

Culpable Error OK
Muy grave

14
Riesgos al contrastar hipótesis
Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal

 H0: Hipótesis nula No especulativa


 (Ej.2) El nuevo tratamiento no tiene
efecto
 (Ej.3) No hay nada que destacar

 H1: Hipótesis alternativa


Especulativa
 (Ej.2) El nuevo tratamiento es útil
 (Ej. 3) Hay una situación anormal

15
Tipos de error al contrastar hipótesis
Realidad
H0 cierta H0 Falsa
No Rechazo H0
Correcto Error de tipo II
El tratamiento no tiene El tratamiento si tiene efecto pero no
efecto y así se decide. lo percibimos.

Probabilidad β

Rechazo H0 Error de tipo I Correcto


El tratamiento no tiene El tratamiento tiene efecto y el
Acepto H1 efecto pero se decide experimento lo confirma.
que sí.
Probabilidad α

16
Región critica y regla de decisión
La regla de decisión implica la división de la distribución muestral del
estadístico a probar en dos partes mutuamente excluyentes: la región
de rechazo o región critica (R.C) de Ho, y la región de aceptación
(R.A.) o no rechazo de Ho. Esta división depende de la hipótesis
alternativa H1, del nivel de significancia α y de la distribución muestral
de la estadística.
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa

Bilateral H1: m¹70

Unilateral Unilateral

H1: m<70 H1: m>70


Tomar en cuenta……..

 Las hipótesis no se plantean después de observar los datos.

 En ciencia, las hipótesis nula y alternativa no tienen el mismo papel:

 H0 : Hipótesis científicamente más simple.


 H1 : El peso de la prueba recae en ella.

 α debe ser pequeño

 Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I

 No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo
II

 Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de


equivocarnos.

19
Procedimiento de la prueba de hipótesis
En primer lugar se debe formular el problema estadístico, determinar la
variable en estudio y el método estadístico adecuado para la solución del
problema. Luego:

 Formular la hipótesis nula y la hipótesis alternativa adecuada.


 Especificar el tamaño α del nivel de significación.
 Seleccionar la estadística apropiada a usar en la prueba.
 Establecer la regla de decisión, determinando la región critica de la prueba.
 Calcular el valor del estadístico de la prueba a partir de los datos de la
muestra.
 Tomar la decisión de rechazar la hipótesis Ho si el valor del estadístico de la
prueba está en la región crítica. En caso contrario, no rechazar Ho.
Tomar en cuenta que los contrastes pueden hacerse a una cola o a dos colas.
En el primer caso se considera los valores mayores, menores, mayores o
iguales y menores o iguales. En el segundo caso se consideran los intervalos o
rangos entre dos valores.
Prueba de hipótesis con
muestras grandes

Pruebas unilaterales
Valores Z a considerar en las pruebas
de hipótesis tanto a una cola como a
dos colas de acuerdo al nivel de
significancia.

Valores críticos de z
Nivel de significancia α 0,10 0,05 0,01 0,005 0,002
-2,28 -1,645 -2,33 -2,58 -2,88
Pruebas unilaterales
2,28 1,645 2,33 2,58 2,88
-1,645 -1,96 -2,58 -2,81 -3,08
Pruebas bilaterales
1,645 1,96 2,58 2,81 3,08
Prueba unilateral de cola a la derecha
 Si se prueba Ho: μ=μo contra H1: μ > μo, dado el nivel de significación α, en la
distribución de Zc=(X-μo)/(/√n) que es N(0,1), se determina el valor z1-α

 Es decir: P[Zc>z1-α/H: μ=μo verdadera]=α

Región de aceptación Región Crítica

 Entonces, la región crítica o de rechazo de Ho en el rango de variación de Z es:


R.C. = [Zc>z1-α]
 La región de aceptación de Ho es el intervalo: R.A.= [Zc≤z 1-α]
 Regla de decisión: Se rechazará Ho si Zc ϵ R.C. Se aceptará en caso contrario.
Ejercicio
Las tensiones de ruptura de los cables fabricados por una empresa
tienen media de 1800 libras y una desviación típica de 100 libras. Se
desea comprobar si un nuevo proceso de fabricación aumenta dicha
tensión media. Para ello se toma una muestra de 50 cables y se
encuentra que su tensión media de ruptura es de 1850 libras. ¿Se
puede afirmar que se ha mejorado la tensión media con el nuevo
proceso al nivel de significancia del 1%?
Solución:

Sea x la variable aleatoria que denota la mejora de la tensión media de


cables como producto de un nuevo proceso, suponiendo que la
distribución de X es normal.
1. Plantear la hipótesis: Ho:μ=1800 contra H1:μ> 1800
2. Nivel de significación: α = 1%
  

25
  

1%
3,54

2,33
Prueba unilateral de cola a la izquierda
 Si se prueba Ho: μ=μo contra H1: μ < μo, dado el nivel de significación α, en la
distribución de Zc=(X-μo)/(/√n) que es normal N(0,1), se determina el valor z1-α.

 Es decir: P[Zc<-z1-α/H: μ=μo verdadera]=α

 Entonces, la región crítica o de rechazo de Ho en el rango de variación de Z es:


R.C. = [Zc< -z1-α]
 La región de aceptación de Ho es el intervalo: R.A.= [Zc≥-z1-α]
 Regla de decisión: Se rechazará Ho si Zc ϵ R.C. Se aceptará en caso contrario.
Ejercicio
 Un comprador de ladrillos cree que la calidad de los mismos esta
disminuyendo. De experiencias anteriores, la resistencia media al
desmoronamiento de tales ladrillos es de 200 kilos. Con una
desviación típica de 10 kg. Una muestra de 100 ladrillos arroja una
media de 195 kg. Probar la hipótesis: la calidad media no ha
cambiado frente a la calidad media ha disminuido.
Solución:
Sea x la variable aleatoria que denota la calidad de los ladrillos de la
empresa suponiendo que distribución de X es normal.
1. Plantear la hipótesis: Ho:μ=200 contra H1:μ˂200
2. Nivel de significación: α = 5%
  

-1,64
  

-5

-1,645
Prueba de hipótesis para
pequeñas muestras

Uso de estadístico t de
student
  
Prueba bilateral o de dos colas
 Si se prueba Ho: μ=μo contra Hi: μ≠μo dado el nivel de significancia α, en la
distribución de tc=(X᷉-μo)/(S/√n) con n-1 grados de libertad, se determinan
los valores críticos ±t1-α/2,n-1 tales que la probabilidad de rechazar Ho cuando
se supone verdadera sea:
p[tc< -t1-α/2,n-1 ]=α/2 ó p[tc> t1-α/2,n-1 ]=α/2

 Entonces la región crítica o de rechazo de Ho en el rango de variación de t


es:
R.C=[tc< -t1-α/2,n-1 ] ó [tc> t1-α/2,n-1 ]
 Regla de decisión: Se rechazará Ho con riesgo α si tc ϵ R.C. y no se
rechazará en caso contrario.
R.C.
Ejercicio

  
   3.25

0.26

10
0.26

0.26

-3,25 3,25
Prueba unilateral o cola a la derecha
 Si se prueba Ho: μ=μo contra Hi: μ>μo dado el nivel de significancia α, en la
distribución de tc=(X᷉-μo)/(S/√n) con n-1 grados de libertad, se determinan
los valores críticos ±t1-α/2,n-1 tales que la probabilidad de rechazar Ho cuando
se supone verdadera sea:
p[tc>t1-α,n-1/Ho: μ=μo verdadera]=α

 Entonces la región crítica o de rechazo de Ho en el rango de variación de t


es:
R.C.=[tc > t1-α,n-1 ]

 Regla de decisión: Se rechazará Ho con riesgo α si tc ϵ R.C. y no se


rechazará en caso contrario. R.C.
Ejercicio

  
   1.833

0.26

0.26

0.26
R.C.

1.833
2,821
Prueba unilateral o cola a la izquierda
 Si se prueba Ho: μ=μo contra Hi: μ<μo dado el nivel de significancia α, en la
distribución de tc=(X᷉-μo)/(S/√n) con n-1 grados de libertad, se determinan los valores
críticos ±t1-α/2,n-1 tales que la probabilidad de rechazar Ho cuando se supone
verdadera sea:
p[tc < - t1-α,n-1/Ho: μ=μo verdadera]=α

 Entonces la región crítica o de rechazo de Ho en el rango de variación de t es:


R.C.=[tc <- t1-α,n-1 ]

 Regla de decisión: Se rechazará Ho con riesgo α si tc ϵ R.C. y no se rechazará en


caso contrario.

R.C.
Ejercicio

  

4,25 3,75 4,05 3,8 3,5


4,00 3,75 2,50 6,10 2,50
2,50 3,4 3,2 2,8 5,0
  

R.C.
-1,289

-1,76
Ejercicios

 Una compañía produce un cable de acero que tiene una resistencia media a la ruptura de 300 kg. Este
desea implementar un nuevo proceso de producción pero lo hará si estadísticamente se comprueba
que el cable producido con el nuevo proceso tiene una resistencia media a la ruptura igual o mayor
que 300 kg. Para esto se escoge una muestra aleatoria de 25 cables producidos con el nuevo proceso
resultando una media de resistencia a la ruptura de 296.25 kg. Y una desviación estándar de 15 kg.
¿debería esta compañía adoptar el nuevo proceso, si está dispuesto a asumir un error tipo I de 5%?

 Una empresa que se dedica a hacer encuestas se queja de que un agente realiza en promedio 53
encuestas por semana. Se ha introducido una forma más moderna de realizar las encuestas y la
empresa quiere evaluar su efectividad. Se tiene una muestra aleatoria de 15 agentes y los resultados
son: media =56,4 y desviación estándar de 3,73 encuestas. Con el nivel de significancia al 5%, puede
concluirse que la cantidad media de entrevistas realizadas  por los agentes es superior a 53 por
semana?.

 El control de calidad una fábrica de pilas y baterías sospecha que hubo defectos en la producción de
un modelo de batería para teléfonos móviles, bajando su tiempo de duración. Hasta ahora el tiempo
de duración en conversación seguía una distribución normal con media 300 minutos y desviación
típica 30 minutos. Sin embargo, en la inspección del último lote producido, antes de enviarlo al
mercado, se obtuvo que de una muestra de 60 baterías el tiempo medio de duración en conversación
fue de 290 minutos. Suponiendo que ese tiempo sigue siendo Normal con la misma desviación típica.
¿Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de significación del
2%?
Gracias por su atención!!

También podría gustarte