Expo
Expo
Expo
CURSO: ESTADISTICA
SEMESTRE: III
PRESENTADO POR:
INDICE
MISIÓN-----------------------------------------------------------------------------------------------------I
VISIÓN-----------------------------------------------------------------------------------------------------I
PRESENTACION---------------------------------------------------------------------------------------II
AGRADECIMIENTO---------------------------------------------------------------------------------IV
DEDICATORIA-----------------------------------------------------------------------------------------V
III
PRESENTACION
Andina del Cusco. El presente trabajo tiene como objetivo general desarrollo del tema de
PRUEBA DE HIPOTESIS se refiere a la magnitud fija en que los términos de una secuencia
Este trabajo de investigación pongo a su disposición para que se sirva en analizar y apoyo para
mejorarlo.
IV
V
DEDICATORIA
important
6
PRUEBA DE HIPÓTESIS
Introducción
Una prueba de hipótesis es un procedimiento, con el que se busca tomar una decisión
evidencia muestral.
Supongamos que un amigo nuestro afirma que en cada partido de fútbol que juega, mete
tres o cuatro goles. Impresionados con su excelente performance, vamos a verlo jugar cinco
partidos seguidos. Pero ocurre que en esos cinco partidos no mete ningún gol. ¿No
sospecharíamos que tal vez nos mintió? ¿No es muy incompatible «lo observado» con su
afirmación inicial de que mete tres o cuatro goles por partido? Este mini-ejemplo muestra la
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis nula
hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La hipótesis
alternativa es el enunciado que se desea poder concluir que es verdadero de acuerdo con la
Con base en los datos de muestra, la prueba determina si se puede rechazar la hipótesis nula.
Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor que el nivel de
Un error común de percepción es que las pruebas estadísticas de hipótesis están diseñadas para
seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar una prueba de hipótesis,
7
establecemos la hipótesis nula como lo que queremos desaprobar. Puesto que establecemos el
nivel de significancia para que sea pequeño antes del análisis (por lo general, un valor de 0.05
tenemos prueba estadística de que la hipótesis nula sea verdadera. Esto se debe a que no
pequeña.
siguiente:
Por eso muchas veces se compara un proceso de prueba de hipótesis con un juicio: hay que
recoger evidencias para analizar si la hipótesis de base (la inocencia del acusado en el caso
Entender muy bien que es una prueba de hipótesis implica comprender muchos conceptos
relaciones entre ellos. Pero la idea general de que es una prueba de hipótesis no es difícil de
entender. De hecho, es muy intuitiva. Vamos a ver un ejemplo que en forma natural expresa
SITUACIÓN
La variable
La variable que nos interesa observar es XX: peso en gramos de un paquete de galletitas de
la fábrica.
500: μ=500μ=500
500: μ<500μ<500
Cómo se trata de una discusión acerca del valor de un parámetro, no es fácil decidir cuál
afirmación es correcta. Habría que medir todos los paquetes de la producción para conocer
9
la verdadera esperanza de XX. En general esto es inviable. Para no tener que medir el peso
media muestral.
Supongamos que se toma una muestra aleatoria de 100 paquetes, y se mide el peso
X1,X2,X3…,X100X1,X2,X3…,X100
Entonces vamos a calcular la media muestral del peso de los 100 paquetes, para contrastarla
hipótesis nula.
afirmación inicial
obtuvo un valor muy por debajo de 500 gramos. Podríamos rechazar la afirmación del
afirmación inicial
hipótesis inicial… y entonces concluir que no hay evidencia contraria a esa hipótesis.
poblacional de 500 o no? Este caso resulta más dilemático y no permite decidir tan
fácilmente. Se presenta el problema de decidir que es «cerca» y que es «lejos» de 500. Más
adelante vamos a ver cómo se decide un punto de corte o punto crítico que permite definir
una zona «cercana» (zona de no rechazo) y una zona «lejana» (zona de rechazo).
11
Definición intuitiva
estadísticas contrapuestas (una nula y una alternativa), tomamos información muestral para
El problema que tiene este abordaje es que no queda bien definido que sería que ¯XX¯ esté
«cerca» o «lejos» de 500 gramos. Para el caso A y B elegimos valores que «a ojo» parecen
muy por debajo (421,3) o muy cercanos (499,8) a 500. Pero tenemos que poder tener un
criterio objetivo con el que tomar la decisión sobre si la evidencia muestral es contraría o
técnica. Pero la idea básica de que es una prueba de hipótesis, es la que comentamos en este
ejemplo.
Para resolver el problema técnico, va a ser necesario tener bien claros los siguientes
conceptos.
Para entender bien que es una prueba de hipótesis hay que tener bien claros (entre otros) los
estadístico de prueba.
12
Una variable es una característica de interés, que tienen los individuos de una población.
¿QUÉ ES UN PARÁMETRO?
probabilidad de éxito pp.
observaciones muestrales) que toma «valores cercanos» al verdadero valore del parámetro.
Esta es la definición más difícil de esta serie. Por eso vamos a dar muchos ejemplos.
De distribución conocida
14
Vamos a ver algunos ejemplos de estadísticos de prueba que nos van a interesar más
adelante.
EJEMPLO 1
conocemos σσ entonces:
¯X–μσ√ n ∼N(0,1)X¯–μσn∼N(0,1)
No nos interesa hacerlo acá para no distraer la atención. Pero la fundamentación tiene que
ver con:
2. La esperanza de ¯XX¯ es μμ.
3. La varianza de ¯XX¯ es σ2/nσ2/n
EJEMPLO 2
con SS entonces:
¯X–μS√ n ∼tn–1X¯–μSn∼tn–1
estimador ¯XX¯.
Observación: no demostramos por qué es esa la distribución. Hay que aceptarlo así :).
EJEMPLO 3
¯X–μS√ n ≈N(0,1)X¯–μSn≈N(0,1)
parámetro μμ con su estimador ¯XX¯.
EJEMPLO 4
de XX, con n>30n>30 entonces:
Es un estadístico de prueba. Porque es una variable aleatoria, con distribución conocida (en
Observación: no demostramos por qué es esa la distribución. Tiene que ver con el teorema
EJEMPLO 5
entonces:
S2(n–1)σ2∼χ2n–1S2(n–1)σ2∼χn–12
17
Observación: no demostramos por qué es esa la distribución. Hay que aceptarlo así :). Una
tabla que resume las condiciones que deben darse, el parámetros de interés y un estadístico
aleatoria.
18
paramétrica.
estadísticas.
Afirmación 1: «La molécula de agua está compuesta por dos átomos de hidrógeno y
un átomo de oxígeno».
de ¯x=45,32x¯=45,32 gramos»
La afirmación 1 predica sobre la composición de una molécula. Será una afirmación… pero
La afirmación 2 predica sobre la forma que tiene la distribución de una variable aleatoria.
Está diciendo algo acerca de una variable aleatoria. Así que podemos decir que es una
es un parámetro, sino que es una variable aleatoria. No es una hipótesis estadística porque
no afirma nada ni sobre el tipo de distribución (binomial, normal, etc…) ni sobre sus
parámetros.
EL ENUNCIADO
de 500500 gramos. Pero el contenido real es una variable aleatoria con distribución normal.
Para esto se toma una muestra de tamaño 100, y se obtiene una media muestral
de 497,3497,3 gramos.
LA VARIABLE
La variable sobre la que vamos a trabajar es XX: peso real de un paquete de galletitas de
conoce σ=5σ=5.
que todo queda igual. Hay otra hipótesis que es la hipótesis de cambio. Siempre en esta
H0:μ=500H0:μ=500
Las hipótesis son complementarias. La nula tiene el símbolo de igualdad siempre. Entonces
H1:μ<500H1:μ<500
Uno querría tomar la decisión correcta. Rechazar la hipótesis nula, cuando esta es falsa, es
una decisión correcta posible. No rechazar la hipótesis nula, cuando esta es verdadera es
Pero cuando se toma una decisión basada en información muestral, se pueden cometer
cometiendo un error. Este error se conoce cómo el error de tipo 1. Si la hipótesis nula fuera
falsa, y no la rechazamos estaríamos cometiendo otro error. Este otro error se conoce cómo
el error de tipo 2.
α=P(errortipo1)=P(RHo|H0esV)α=P(errortipo1)=P(RHo|H0esV)
22
1–α=P(NoRHo|H0esV)1–α=P(NoRHo|H0esV)
β=P(errortipo2)=P(NoRH0|H0esF)β=P(errortipo2)=P(NoRH0|H0esF)
se representa cómo:
1–β=Potenciadeltest=P(RH0|H0esF)1–β=Potenciadeltest=P(RH0|H0esF)
El error de tipo 1 se considera un error grave, que se quiere evitar. Hay necesidad de
α=⎧⎪⎨⎪⎩0,010,050,10α={0,010,050,10
ESTADÍSTICO DE PRUEBA
que:
¯X–μσ√ n ∼N(0,1)X¯–μσn∼N(0,1)
Este es un estadístico de prueba que nos puede servir para realizar la prueba de hipótesis
sobre μμ.
entonces rechazaremos la hipótesis nula (porque significa que ¯XX¯ está muy por debajo
de μμ).
Entonces ¿cómo se decide si se rechaza o no a la hipótesis nula? Los valores que puede
tomar el estadístico de prueba de dividen en dos zonas: «la zona de rechazo» y la «zona de
Rechazaremos H0H0 si:
NIVEL DE SIGNIFICACIÓN
igual al área bajo la curva del estadístico de prueba y sobre la región de rechazo.
25
estadístico de prueba, cuál va a ser el valor crítico que define la zona de rechazo.
zCzC debe ser aquel valor de la variable normal estándar que acumula un área de 0,05 a su
Φ(zC)=0,05⇒zc=–1,64Φ(zC)=0,05⇒zc=–1,64
Regla de decisión:
a –1,64–1,64.
1,64–1,64.
eprueba,obs=497,3–5000,5=–5,4eprueba,obs=497,3–5000,5=–5,4
Obtener la conclusión
En general la conclusión tiene dos versiones: una breve, y otra más detallada.
26
Cómo el valor observado del estadístico de prueba -5,4, cae en la zona de rechazo (–∞,–
Esta conclusión está muy bien, pero no refiere a la situación general del problema concreto.
LA CONCLUSIÓN DETALLADA
Por ejemplo en este caso podríamos escribir una conclusión detallada así:
Con un nivel de significación de 0,050,05 se rechaza la hipótesis nula, que afirma que la
alternativa, que afirma que la media del peso de los paquetes de galletitas es inferior
a 500500 gramos. Habría que re-calibrar la máquina que rellena los paquetes para que la
{Primero:rechazoonoH0Luego:expresarlaentérminosdelproblema{Primero:rechazoonoH
0Luego:expresarlaentérminosdelproblema
Otros problemas de prueba de hipótesis pueden ser muy diferentes. Otras variables, otros
estadísticos de prueba, hipótesis diferentes… etc. Pero en todos los problemas de prueba de
Final
Este texto pretende ser una introducción al tema. Hay mucho que no
Referencias
http://ftp.medprev.uma.es/libro/html.htm
http://www.hrc.es/bioest/M_docente.html
http://ocw.jhsph.edu/Topics.cfm
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1199583/?
tool=pubmed
Zar, Jerrold H.- Biostatistical Analysis.- 4rd ed.- Prentice Hall, Inc