Guia - 11 Estadistica de Prueba de Hipotesis
Guia - 11 Estadistica de Prueba de Hipotesis
Guia - 11 Estadistica de Prueba de Hipotesis
Los nmeros generados estn resumidos en la tabla siguiente: Intervalo* 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 N generados 114 100 99 98 111 104 106 95 92 81 1000
* intervalos semiabiertos ( , ]
Aceptara usted la hiptesis que este generador est trabajando como debe; esto es, podemos pensar que los nmeros generados constituyen una muestra aleatoria de una distribucin uniforme en (0,1)
Chi cuadrado N Intervalo* generados 0 menor o igual a 0 0.0 0.1 114 0.1 0.2 100 0.2 0.3 99 0.3 0.4 98 0.4 0.5 111 0.5 0.6 104 0.6 0.7 106 0.7 0.8 95 0.8 0.9 92 0.9 1.0 81 mayor que 1 0 * intervalos semiabiertos1000 ( , ] fi 0 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0 1
2 n * fi (FO - FE) /FE
FO: frecuencias observadas (en este caso nmero de generad FE: frecuencias esperadas (en este caso n * fi ) chi cuadrado calculado es 8,24 grados de libertad g.l.= g.l.= con regin crtica: Se rechaza Ho si: Regin crtica
0 100 100 100 100 100 100 100 100 100 100 0
0 1.96 0.00 0.01 0.04 1.21 0.16 0.36 0.25 0.64 3.61 0 8.24
X: nmeros generados Ho X ~ U(0,1) H1 X no se distribuye U(0,1) Bajo el supuesto de que Ho es verdadera Ei = n fi f(x)=1 / (b-a)= 1 P(0 < x 0,1)= integral de 0 a 0,1 dx = 0,1 como es una distribucin uniforme 0,1 se mantiene constante y por lo tanto n * fi tambin
Supuestos Todas las frecuencias esperadas son >5
Buscando en la tabla X2 de 0,95 con 2 g.l. se obtiene: 16,92 es el valor crtico. La regin crtica son todos los valores mayores o iguales a l. Conclusin estadstica Respuesta al problema
con valor p valor p = P( X2 9 > 8,24) valor p = 1- P( X2 9 < 8,24) valor p = 1-0,41 valor p = 0,59 > 0,05 (nivel de significancia) Conclusin estadstica
Chi cuadrado calculado NO pertenece a la por lo tanto NO se rechaza la hiptesis nu Respuesta al problema Los nmeros aleatorios generados constit distribucin uniforme (0,1)
chi cuadrado calculado es mayor que chi cuadrado de 1 menos alpha con k menos p menos 1 grado de libertad.
obs el 0,41 se obtiene interpolando con los val para chi cuadrado con 9 grados de liberta 4.17 8.24 4.68 14,68 - 4,17 8,24- 4,17 0.1 X 0.9 =
cando en la tabla X2 de 0,95 con 2 g.l. se obtiene: 16.92 2 es el valor crtico. La regin crtica son todos los valores
Chi cuadrado calculado NO pertenece a la regin crtica por lo tanto NO se rechaza la hiptesis nula Los nmeros aleatorios generados constituyen una m.a. de distribucin uniforme (0,1)
Chi cuadrado calculado NO pertenece a la regin crtica por lo tanto NO se rechaza la hiptesis nula Los nmeros aleatorios generados constituyen una m.a. de distribucin uniforme (0,1) el 0,41 se obtiene interpolando con los valores de la tabla para chi cuadrado con 9 grados de libertad
Una muestra de 200 adultos de ms de 60 aos. Se clasific de acuerdo a su educacin y al nmero de hijos de cada uno de ellos.
Educacin Primaria Secundaria Universitaria 0 a 1 14 19 12 Nmero de Hijos 2a3 37 42 17 ms de 3 32 17 10
Se puede decir que el nmero de hijos es independiente del nivel de educacin de los padres? Use alpha 0,05 y enuncie claramente sus hiptesis.
grados de libertad Nmero de Hijos Educacin Primaria Secundaria Universitaria Totales 0 a 1 14 19 12 45 2 a 3 ms de 3 Totales 37 42 17 96 32 17 10 59 83 78 39 200 Se rechaza Ho si:
Regin crtica
Frecuencias Esperadas Nmero de Hijos Educacin 0 a 1 2 a 3 ms de 3 Primaria 18.7 39.8 24.5 Secundaria 17.6 37.4 23.0 Universitaria 8.8 18.7 11.5 Supuestos X n de hijos Y nivel educacional de los padres Ho eX es INDEPENDIENTE de Y H1 X es DEPENDIENTE Y Estadstico de prueba: Todas las frecuencias esperadas son >5
Respueta al problema
7.46
columnas-1)(N filas-1)
con valor p valor p = P( X2 4 > 7,46) valor p = 1- P( X2 4 < 7,46) valor p = 1- ? valor p = ? > 0,05 (nivel de significancia)
Conclusin estadstica las conclusiones son las mismas obtendas p Respuesta al problema regin crtica
obs el ? se obtiene interpolando con los valores para chi cuadrado con 9 grados de libertad 1.064 7.46 7.78 7,78 - 1,064 7,46- 1,064 0.1 X 0.9 =
n de hijos es INDEPENDIENTEdel nivel de educacin de los padres as variables n de hijos y niv educ de los padres no estn asociadas.
e obtiene interpolando con los valores de la tabla hi cuadrado con 9 grados de libertad
Una muestra aleatoria de 90 adultos se clasifica de acuerdo al sexo de los individuos y el nmero de horas que ven televisin durante una semana. hombre 12 27 mujer 29 19
Utilice un nivel de significacin 0.01 y pruebe la hiptesis de que el tiempo utilizado para ver TV es independiente del sexo.
hombre 12 27
39
mujer 29 19
48
Totales 41 46 87
7.59
grados de libertad
Se rechaza Ho si:
hombre
18.4 20.6
mujer
22.6 25.4 Regin crtica
Ho H1
Estadstico de prueba:
Respueta al problema
con valor p valor p = P( X2 1 > 7,59) valor p = 1- P( X2 1 < 7,59) valor p = 1- ? valor p = ? < 0,01 (nivel de significancia) Conclusin estadstica las conclusiones son las mismas obtendas para la
columnas-1)(N filas-1)
obs el ? se obtiene interpolando con los valores de la para chi cuadrado con 9 grados de libertad 6.63 7.59 7.88 7,88 - 6,63 7,59- 6,63 0.99 X 0.995 = 0,995 - 0,99 X - 0,99
n de horas semanales que ve TV DEPENDIENTE del gnero n de horas semanales que ve TV est asociado al gnero
Luego de dos aos de trabajar en una estacin donde pesan camiones, Juan Jos piensa que el peso por camin en toneladas normal con media siete toneladas. Con el objeto de probar su suposicin, reuni los soguientes datos registrando el peso de ca en la estacin y los tabul de la siguiente manera:
a) JJ aplic una prueba de bondad de ajuste a estos datos. A qu conclusin llegar sobre la distribucin de los pesos de los Use un nivel de significancia de 0,10 b) Determine un intervalo de confianza del 95% para el peso promedio de estos camiones? Peso del Camin 4 6 6 8 8 9 ms de 9 Frecuencia observada 20 14 18 8
que el peso por camin en toneladas sigue una distribucin ntes datos registrando el peso de cada camin que entra
Frecuencia Peso del 2 marca observada marca *frec Camin < 4 6 8 > 4 6 8 9 9 5 7 8.5 11 0 20 14 18 8 60 500.0 686.0 1300.5 968.0
Z -1.02 -0.34 0.34 0.68 0.68 0.1528 0.3664 0.6336 0.7527 0.7527
*los valores no calzan igual que en las tablas porque los valores de Z aqu estn con todos decimales para estimar la varianza se puede utilizar una de estas dos expresiones
la segunda es ms fcil al realizar clculos a mano. como debemios obtener una estimacin del parmetro supondremos, slo para este efecto, que tiene amplitud 2 como los dos primeros y por lo tanto la marca de clase es 11
con valor p X: peso de un camin, en toneladas Ho X ~ N( 7 , sigma2 ) H1 X no se distribuye N( 7 , sigma2 ) chi cuadrado calculado es 33,1 Conclusin estadstica grados de libertad N clases-N parmetros a estimar-1 g.l.= k-p-1 g.l.= 5 - 1 - 1 = 3 Respuesta al problema valor p = P( X2 3 > 33,11)
valor p = 1- P( X2 3 < 33,11) valor p = 1-0,99999 valor p =0,0000001 < 0,1 (nivel de significancia
chi cuadrado calculado es mayor que chi cuadrado de 1 menos alpha con k menos p menos 1 grado de libertad. 6.25
Buscando en la tabla X2 de 0,90 con 3 g.l. se obtiene: que es el valor crtico. La regin crtica son todos los valores mayores o iguales a l. Conclusin estadstica
Chi cuadrado calculado pertenece a la regin crtica por lo tanto se rechaza la hiptesis nula Respuesta al problema el peso de los camiones en toneladas no sigue una distribucin distribucin normal con media 7
p = P( X2 3 > 33,11) p = 1- P( X2 3 < 33,11) p =0,0000001 < 0,1 (nivel de significancia) Chi cuadrado calculado pertenece a la regin crtica por lo tanto se rechaza la hiptesis nula el peso de los camiones en toneladas no sigue una distribucin distribucin normal con media 7
Un estudio que se realiz con 84 personas referente a la revelacin entre la cantidad de violencia vista en la TV y la edad del te produjo los siguientes resultados: a) indican los datos que ver violencia en la TV depende de la edad del telvidente? Use alpha 0,05 b) Aceptara usted que la edad de las personas constituyen una m.a. de una poblacin normal? (edad mxima 80 aos), alpha
Edad Grado de Violencia en la TV poca mucha 16 - 34 8 18 35 - 54 12 15 55 ms 21 7
grados de libertad Edad Grado de Violencia en la TV poca mucha Totales 16 - 34 8 18 26 35 - 54 12 15 27 55 ms 21 7 28 Totales 41 40 81 Se rechaza Ho si:
Regin crtica Frecuencias Esperadas Grado de Edad Violencia en la 16 - 34 35 - 54 TV Primaria 13.2 13.7 Secundaria 12.8 13.3 Supuestos
55 ms 14.2 13.8
Buscando en la tabla X2 de 0,95 con 2 g.l. se obtiene: 9,49 es el valor crtico. La regin crtica son todos los valores mayores o iguales a l. Conclusin estadstica
Respueta al problema
Estadstico de prueba:
11.2
columnas-1)(N filas-1)
La tabla de frecuencia siguiente refleja datos de las ventas diarias durante 200 das, con alpha 0,05, parecen seguir las ventas a) con parmetros media = 120 das y desviacion estndar = 20? b) con ambos parmetros desconocidos.
Ventas 20 60 80 100 120 140 160 180 60 80 100 120 140 160 180 200
Frecuencia 7 22 46 42 42 18 11 12
Ventas menos 20 20 60 60 80 80 100 100 120 120 140 140 160 160 180 180 200 mas 200
marca*frec 0 280 1540 4140 4620 5460 2700 1870 2280 0 22890 114.5 promedio
(Xi-Xbarra)2*frec 0 38799.6175 43467.655 27498.915 831.705 10155.705 22748.445 33943.8275 68493.63 0 245939.5 1235.9 varianza
Z -2.69 -1.55 -0.98 -0.41 0.16 0.73 1.30 1.86 2.43 2.43
0.0036 0.0607 0.1636 0.3405 0.5627 0.7663 0.9025 0.9689 0.9925 0.9925
Ho Las ventas se distribuyen normal con media 114.5 y varianza 1235.9 H1 Las ventas no se distribuyen normal con media 114.5 y varianza 1235.9 G LIBERTAD= 8-2-1=5 VALOR CRITICO= 11.05 Como chi cuadrado calculado (14.51) es mayor que el valor critico,(11.05), se rechaza la hipotesis nula de normalidad con media 114.5, varianza 1235.9 Ho Las ventas se distribuyen normal con media 120 y desviacin estndar 20 H1 Las ventas no se distribuyen normal con media 120 y desviacin estndar 20 Ventas menos 20 20 60 60 80 80 100 100 120 120 140 140 160 160 180 180 200 mas 200 marca F.O. 20 0 40 7 70 22 90 46 110 42 130 42 150 18 170 11 190 12 0 200 Z -5.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00 4.00 pi F.E. n*pi 0.00000 0.00 0.00135 0.27 0.02140 4.28 0.13591 27.18 0.34134 68.27 0.34134 68.27 0.13591 27.18 0.02140 4.28 0.00132 0.26 0.0000 0.01 1.0000 200
0.0000 0.0013 0.0228 0.1587 0.5000 0.8413 0.9772 0.9987 1.0000 1.0000
G LIBERTAD= 4-1=3 VALOR CRITICO= 7.815 Como chi cuadrado calculado (83.36) es mayor que el valor critico,(7.815), se rechaza la hipotesis nula de normalidad con media 114.5, varianza 1235.9
pi F.E. n*pi 0.00361 0.72 0.05710 11.42 0.10285 20.57 0.17697 35.39 0.22220 44.44 0.20360 40.72 0.13614 27.23 0.06642 13.28 0.02364 4.73 0.0075 1.50 0.9889 197.7830
F.O. 7 22 46 42 42 18 11 12 200
F.E. 12.14 20.6 35.4 44.4 40.7 27.2 13.3 6.2 200
(FO - FE)2/FE 2.177 0.099 3.179 0.134 0.040 3.127 0.393 5.361 14.51
Todas las frecuencias esperadas deben ser >5, como no ocurre con todas se fusionan categoras
F.O.
F.E.
(FO - FE)2/FE
75 42 42 41
200
199
83.36
Se condujo una encuesta aleatoria entre los ciudadanos en edad de votar para determinar si exista alguna relacin entre la afiliacin partidista y la opinin respecto al control de armas. Se obtuvo la informacin de la siguiente tabla para alpha 0,01 existe alguna relacin para creer que existe una dependencia entre la opinin y la afiliacin partidista?
Partido democracia republicano Independientes a favor 38 30 32 en contra 29 42 59 sin decisin 7 7 4
si exista alguna relacin entre la siguiente tabla para alpha 0,01 n partidista?
a favor 38 30 32 100
en contra 29 42 59 130
sin decisin 7 7 4 18
Totales 74 79 95 248
grados de libertad
Frecuencias Esperadas a favor en contra 29.8 38.8 31.9 41.4 38.3 49.8 100 130
Totales 74 79 95 248
Buscando en la tabla X2 de 0,95 con 4 g.l. se ob 9,49 es el valor crtico. La regin crtica son todo mayores o iguales a l. Conclusin estadstica
X Partido Y :Opinin Ho: X es INDEPENDIENTE de Y H1: X es DEPENDIENTE Y Chi cuadrado calculado 9.55
Respueta al problema
con valor p
(N columnas-1)(N filas-1) (3-1)*(3-1) 4
valor p = P( X2 4 > 9,55) valor p = 1- P( X2 4 < 9,55) valor p = 1- ? valor p = ? > 0,05 (nivel de significancia) Conclusin estadstica Respuesta al problema
obs
9.49
tabla X2 de 0,95 con 4 g.l. se obtiene: crtico. La regin crtica son todos los valores
Chi cuadrado calculado Pertenece a la regin crtica por lo tanto se rechaza la hiptesis nula La opinin es DEPENDIENTE del partido
,05 (nivel de significancia) las conclusiones son las mismas obtendas para la regin crtica
el ? se obtiene interpolando con los valores de la tabla para chi cuadrado con 4 grados de libertad 9.49 9.55 11.14 11,14-9,49 9,55-9,49 0.95 X 0.975 = 0,975-0,95 X - 0,95
La tabla siguiente presenta la informacin de 34 aos respecto al nmero de accidentes laborales que ocurren por ao en una ind
N de accidentes en un ao frecuencia
0 2
1 7
2 3
3 4
4 2
5 6
6 5
7 1
8 Total 4
34
a) pruebe que estos datos provienen de una poblacin Poisson. Use alpha 0,01 b) Suponiendo que estos valores corresponden a los valores observados de una variable Poisson () b1) estime la probabilidad de que ocurra a lo sumo 1 accidnete al ao b2) Construya un intervalo de confianza del 90% para
variable Poisson ()
Ho el n de accidentes laborales se distribuye poisson (mu) H1 el n de accidentes laborales no se distribuye poisson (mu) mu gorro 3.882352941
X 0 1 2 3 4 5 6 7 8 TOTAL
F.O. 2 7 3 4 2 6 5 1 4 34
frec 0 7 6 12 8 30 30 7 32 132
X 0 1 2 3 4 5 6 7 >=8 TOTAL
Obs 2 7 3 4 2 6 5 1 4 34
p(x) 0.0206 0.0800 0.1553 0.2009 0.1950 0.1514 0.0980 0.0543 0.0444 1.0
Esp supuestos 0.70 2.72 5.28 6.83 6.63 5.15 3.33 1.85 1.51 34.0
<=2 3 4 5 >=6
12 4 2 6 10
34
como no ocurre con todas se fusionan categoras Despus de colapsar quedaron 5 categoras Por lo tanto los grados de libertad son (5-1-1) porque adems se estim un parmetro X2 3 , 0.99 =11.34 Como 7.4389 < X2 3 , 0.99 = 11.34 X2 C = NO se rechaza la hiptesis nula El nmero de accidentes laborales que ocurren por ao en una industria no se ditribuyen poisson (mu)
p(x)
Esp
(Oi - Ei)2/Ei
1.0000
34.0
Se llevaron registros del intervalo entre fallas sucesivas del sistema de acondicionamiento de aire en un avin a reaccin Boein si el sistema de acondicionamiento tiene una tasa constante de falla, entonces los intervalos entre fallas sucesivas deben tener distribucin exponencial. Los intervalos observados, en horas, entre fallas sucesivas, son las siguientes. 23 246 71 261 21 11 87 42 14 7 20 11 120 5 16 14 12 90 62 120 1 47 11 16 225 3 52 71 14 95
F.OBS 1 3 5 7 11 11 11 12 14 14 14 16 16 20 21 23 42 47 52 62 71 71 87 90 95 120 120 225 246 261 0 44 88 132 176 220 44 88 132 176 220 264 17 6 4 0 0 3 30
F.ESP 22 374 0.5055 15.1656 66 396 0.2500 7.4991 110 440 0.1264 3.7909 154 0 0.0639 1.9164 198 0 0.0323 0.9688 242 0.0167 0.5007 1210 0.9947 29.8414
Fobs 17 6 7
29.8414
0.526
Promedio=64,5 lambda gorro = 1/64,5 =0,016 Ho: Los tiempos entre fallas se distribuyen exponencial con parametro 0.016 H1: Los tiempos entre fallas no se distribuyen exponencial con parametro 0.016 chi cuadrado calculado es ,526 grados de libertad g.l.= 3-1-1 g.l.= 1 con regin crtica: Se rechaza Ho si: chi cuadrado calculado es mayor que chi cuadrado de 1 menos alpha con k menos p menos 1 grado de libertad. Buscando en la tabla X2 de 0,95 con 1 g.l. se obtiene:3,84 que es el valor crtico. La regin crtica son todos los valores mayores o iguales a l. Conclusin estadstica cuadrado calculado no pertenece a la regin crtica Chi por lo tanto no se rechaza la hiptesis nula Los Respuesta al problema tiempos entre fallas se distribuyen exponencial con parametro 0.016
con valor p valor p = P( X2 1 > 0,526) valor p = 1- P( X2 1 < 0,526 ) valor p >0.1 Los tiempos Respuesta al problemaentre fallas se distribuyen exponencial con parametro 0.016
Se trata de una distribucin continua y por lo tanto hay que construir intervalos porque las probabilidades no se pueden calcular para valores puntuales entonces calculando el nmero de intervalos (5,5) y la amplitud con la frmula 1+3,22 log(n) )procedimiento del primer apunte)