Prueba de Hipotesis
Prueba de Hipotesis
Prueba de Hipotesis
1
ÍNDICE
2
MÓDULO III
3
Ejemplo:
Un mayor gasto en publicidad provoca un incremento en los votos obtenidos por un partido
político. En este caso, del planteamiento del problema, se desprende de manera directa
que hay dos variables: gasto en publicidad y votos obtenidos. Ambas pueden ser
cuantificadas y por lo tanto es posible hacer inferencias estadísticas que permitan probar la
relación mencionada.
Hipótesis Alterna e Hipótesis nula.
En una investigación la hipótesis alterna se denota por Ha, es un enunciado sobre la
población a investigar, y la hipótesis nula se denota por H0, es la negación de la hipótesis
alterna.
Ejemplo
La experiencia ha demostrado que el porcentaje de alumnos aprobados usando un cierto
método de enseñanza es del 75%. Se anticipa que si se usa un nuevo método de
enseñanza, el porcentaje de aprobados será mayor que cuando se usa el método
tradicional.
En este caso la Hipótesis alterna y la hipótesis nula serían:
Ha : Existe evidencia sustancial de que el nuevo método de enseñanza es mejor que el
método tradicional.
H0 : No existe evidencia sustancial de que el nuevo método de enseñanza sea mejor que
el método tradicional.
Prueba de hipótesis.
Una prueba de hipótesis es una prueba estadística que se utiliza para determinar si existe
suficiente evidencia en una muestra de datos para inferir que cierta condición es válida
para toda la población.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis
nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará. Por lo
general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La
hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero.
En base a los datos de la muestra, la prueba determina si se debe rechazar la hipótesis
nula. Para tomar la decisión se utiliza un valor p. Si el valor p es menor que o igual al nivel
de significancia, que es un punto de corte que usted define, entonces puede rechazar la
hipótesis nula.
Un error común de percepción es que las pruebas estadísticas de hipótesis están
diseñadas para seleccionar la más probable de dos hipótesis. En realidad, una prueba
4
mantendrá la validez de la hipótesis nula hasta que haya suficiente evidencia (datos) en
favor de la hipótesis alternativa.
Para probar una hipótesis se siguen los siguientes pasos:
a) Paso 1.- Planteamiento de hipótesis.
H0: Hipótesis Nula
H1: Hipótesis Alternativa
Paso 5: Conclusión
5
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula
con la igualdad
Ejemplo
H0 : θ = 200
Ha : θ ≠ 200
Región crítica
H0 : θ ≤ 200
Ha : θ > 200
6
1.3 Nivel de significancia.
Es la probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota
mediante la letra griega α, también es denominada como nivel de riesgo, este término es
más adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad
es verdadera. Este nivel está bajo el control de la persona que realiza la prueba.
Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación
indicará la probabilidad de no aceptarla, es decir, estén fuera de área de aceptación. El
nivel de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es
verdadera en la población.
1.4 Error tipo I.
En una prueba de hipótesis para la toma de decisiones se haya sujeta a los datos
recolectados a través de un experimento o de una muestra aleatoria, por lo que es posible
cometer dos tipos de errores que pueden llevar a una pérdida sustancialmente diferente,
estos errores son:
• Error tipo 1: Rechazar una hipótesis verdadera.
• Error tipo 2: No rechazar una hipótesis falsa.
7
El tamaño de estos dos tipos de error se define como la probabilidad de que cada uno
de ellos ocurra; al término α (alfa) se le llama nivel de significancia de la prueba,
generalmente se le asignan los valores 0.10, 0.05 ó 0.01 y se determina al inicio de la
investigación; a β (beta) se le denomina potencia de la prueba. Nótese que debido a la
relación existente entre las hipótesis, los dos tipos de error se hayan relacionados, al
controlar el tipo 1 automáticamente se controla el otro, para un tamaño de muestra
dado.
En la práctica se busca trabajar con errores pequeños del tipo 1, es decir, se puede
tomar como el error más serio rechazar Ho cuando es verdadera, que no rechazarla
cuando es falsa. En el peor de los casos se queda uno con H0, porque como ya se
mencionó no incluirá nuevos riesgos o cambio alguno. Esto último debe tomarse con
ciertas reservas dependiendo del problema en particular que se esté trabajando.
En estadística, la probabilidad de cometer el error tipo I se llama nivel de significancia
o nivel de significación.
8
Para la varianza conocida
σ=40 horas
n = 30
_
X=788 horas
Nivel de Significancia=0.04
9
Recordemos que n = 30 por ello se trabaja con Z crítico.
Zona de
aceptación
Zona de Zona de
Rechazo Rechazo
z=-1.75 z=1.75
z=-1.64
10
2
Para Varianzas poblacionales desconocidas pero no homogéneas (σ 1 distinta de
σ2 2)
11
1.
2.
3.
4.
x 1 85 s1 4 n 1 12
x 2 81 s 2 5 n 2 10
µ =2
Tcal = X2 - x1 - µ0 =
Sp 1 + 1
n1 n2
Calculamos primero Sp
( 11 )( 16 ) ( 9 )( 25 )
sp = 4,478
12 10 - 2
( 85 81 ) 2
t = 1,04
4 . 478 (1 / 12 ) (1 / 10 )
P = P(T>1.04)
Decisión: No rechazar H₀.
12
III. DÓCIMAS DE HIPÓTESIS EN VARIABLES CUALITATIVAS. DÓCIMAS PARA
LA PROPORCIÓN POBLACIONAL. DÓCIMAS PARA LA DIFERENCIA DE
PROPORCIONES.
3.1 Docimas de hipótesis en variables cualitativas.
Es el valor determinado a partir de la información muestral, que se utiliza para determinar
si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso
utilizaremos los estadísticos z y t. La elección de uno de estos depende de la cantidad de
muestras que se toman, si las muestras son de la prueba son iguales a 30 o más se utiliza
el estadístico z, en caso contrario se utiliza el estadístico t.
13
H0: π ≤ 0,15 H1: π >0,15
45
. 15
p 200
z 2 . 97
(1 ) . 15 (1 . 15 )
n 200
14
Paso 5.-Conclusión: En este caso se especifica la hipótesis estadística que no ha
sido rechazada indicando el nivel de significancia teórico considerado (α)
Ventajas:
El procedimiento es relativamente fácil de entender y de aplicar.
Su uso es apropiado para muestras de tamaño mayor o igual que 25.
No se afectan significativamente en presencia de observaciones atípicas o
outliers. Si uno o más de los supuestos distribucionales en una prueba
paramétrica no se cumplen, la correspondiente prueba no paramétrica es más
eficiente.
Tienen un gran campo de aplicación.
15
Desventajas:
Serán menos eficientes que el procedimiento paramétrico correspondiente
cuando se pueden aplicar ambos métodos. Es decir, si se puede utilizar una
prueba paramétrica y se usa una no paramétrica, entonces hay una pérdida
de información. Son menos eficientes si las muestras son menores que 25.
Ejemplo 4
Estamos interesados en estudiar la fiabilidad de cierto componente informático con relación
al distribuidor que nos lo suministra. Para realizar esto, tomamos una muestra de 100
componentes de cada uno de los 3 distribuidores que nos sirven el producto comprobando
16
el número de defectuosos en cada lote. La siguiente tabla muestra el número de
defectuosos en para cada uno de los distribuidores.
Las frecuencias esperadas bajo homogeneidad son las representadas entre paréntesis.
El estadístico del contraste será:
Este valor del estadístico Ji-cuadrado es mayor que el valor para el nivel de significación
del 5%, por lo tanto debemos concluir que no existe homogeneidad y por lo tanto que hay
diferencias entre los tres distribuidores. X 2 0.05 (2) = 5.99
17
Ejemplo 5
Se desea estudiar hasta qué punto existe relación entre el tiempo de residencia de
inmigrantes en nuestro país y su percepción de integración. Se dispone de una muestra
pequeña de 230 inmigrantes a los que se les evaluó en ambas variables obteniéndose la
siguiente tabla de frecuencias observadas. ¿Confirman estos datos la hipótesis planteada
con un nivel de confianza del 95%?
f i. f .
Calculando la frecuencia esperada: j
e ij
n
( f ij e ij )
2
2
Calculando el Chi cuadrado: exp
i j e ij
exp 80 , 69
2
18
Calculemos el valor de la tabla Chi-cuadrado
Tenemos
exp 80 , 69
2
1 ; 0 , 05 3 , 84
2 2
g . l .;
Por tanto
exp 1 ; 0 , 01
2 2
19
20