Estadistica-Estimacion de Parametros y Prueba de Hipotesis

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 28

SEGUNDA UNIDAD:- ESTIMACIN DE PARMETROS Y PRUEBA DE HIPTESIS INTRODUCCIN La inferencia estadstica comprende dos partes principales, a saber: la estimacin

de parmetros y la prueba o docimasia de hiptesis. La inferencia estadstica est basada en el supuesto de que tomaremos muchas muestras, todas con igual probabilidad de ser seleccionadas; y a travs de una muestra obtenida sabremos algo acerca de la poblacin, mediante el clculo de estimadores. Estos mtodos se basan en la aplicacin de tcnicas de muestreo, para lo cual se requiere de un buen diseo, adems de la aplicacin de mtodos aleatorios de seleccin, siendo las probabilidades iguales para cada elemento de la poblacin. Estimacin de Parmetros:Es un mtodo inferencial. Se basa en el estudio de una muestra que representa adecuadamente a la poblacin. Producto de dicho estudio obtenemos una medida que se denomina estimador; mediante la inferencia o induccin de este valor obtenemos la medida poblacional esperada denominada parmetro. Se realiza esta inferencia obteniendo en cada caso el margen de error que corresponda. Prueba de Hiptesis:Denominada tambin prueba de significacin, tiene como objetivo principal evaluar suposiciones o afirmaciones acerca de los valores estadsticos de la poblacin, denominados parmetros. La palabra docimar significa probar, cuando se hace indispensable tomar una decisin sobre la validez de la representacin de una poblacin, con base en los resultados obtenidos a travs de una muestra, se dicen que se toman decisiones estadsticas. Para tomar una decisin es necesario, ante todo plantear posibilidades acerca de la caracterstica o caractersticas a estudiar en una poblacin determinada. La suposicin puede ser cierta o falsa. Estas suposiciones se llaman hiptesis estadsticas. Hiptesis Estadstica:Es un supuesto acerca de un parmetro o de algn valor estadstico de una poblacin. Con esta definicin encontramos que no todas las hiptesis son hiptesis estadsticas. Se debe tomar con referencia a un parmetro, ya sea una media aritmtica, una proporcin (porcentaje) o varianza para que sea hiptesis estadstica. Una hiptesis estadstica tambin puede considerarse, como la afirmacin de una caracterstica ideal de una poblacin sobre la cual hay inseguridad en el momento de formularla y que, a la vez, es expresada de tal forma que puede ser realizada.

Tipo de error:En la decisin de aceptar o rechazar una hiptesis pueden cometerse dos tipos de error: a) b) Error tipo II.- Aceptar la hiptesis cuando ha debido rechazarse. Error tipo I.- Rechazar la hiptesis cuando ha debido aceptarse.

Existe por lo tanto, dos posibles decisiones: aceptar o rechazar la hiptesis la que, a la vez, puede ser cierta o falsa. Tipos de error
Verdadera decisin correcta Falsa error de tipo II

ACEPTAR
desicones

RECHAZAR

error de tipo I

decisin correcta

Si se acepta una hiptesis verdadera la decisin es correcta. Si se acepta una hiptesis falsa, cometemos error de tipo II. Si rechazamos una hiptesis verdadera, encontramos error de tipo I. Si rechazamos una hiptesis falsa, la decisin es correcta.

El ejemplo ms indicado y ms utilizado para comprender mejor lo enunciado en forma precedente es el siguiente: supongamos que se detiene a una persona por robo y se le enva al juez quien podr declararlo inocente o culpable. Al juez se le presentan los pro y contra y, con base en toda la informacin, decide dejarlo libre o condenarlo. El juez, no sabr si hubo error en su decisin, solo lo podr saber la persona que ha sido juzgada.
Persona Juzgada Inocente Culpable decisin correcta error de tipo II

del juez Libre

Hiptesis nula y alternativa:Corresponde a un enunciado acerca del valor estadstico poblacional (parmetro).

desicones

Condenado

error de tipo I

decisin correcta

La hiptesis se debe formular en forma correcta o lgica y debe ser enunciada antes de obtener los datos muestrales. Hay dos tipos de hiptesis que se deben formular: la hiptesis nula, simbolizada por H 0 y la hiptesis alternativa por H a La hiptesis nula, es aquella por medio de la cual se hace una afirmacin sobre un parmetro, que se va a constatar con el resultado muestral. La hiptesis alternativa, es toda aquella hiptesis que defiere de la hiptesis nula, es decir, ofrece una alternativa, afirmando que la hiptesis nula es falsa. Cuando el fabricante dice que su producto tiene una duracin de 6000 horas, se le considera como hiptesis nula, pues es lo que se quiere probar. H 0 : = 6000hrs. Las hiptesis alternativas prodian ser: a. El fabricante ha exagerado la duracin de su producto. H a : < 6000hrs. (prueba unilateral izquierda) b. El producto tiene una duracin superior al sealado por el fabricante. H a : > 6000 hrs. (prueba unilateral derecha) c. La duracin del producto no es la sealada por el fabricante. H a : 6000hrs. (Prueba bilateral) La prueba unilateral y bilateral:La prueba de hiptesis unilateral, es aquella en la cual la zona de rechazo o zona crtica est completamente comprendida en uno de los extremos de la distribucin. H a : < a, regin crtica ubicada al lado izquierdo. H a : >a, regin crtica ubicada al lado derecho. H a : A, regin crtica ubicada al lado izquierda y derecha de la distribucin Nivel de significacin y puntos crticos:Se entiende por nivel de significacin, la mxima probabilidad que se especifique, con el fin de hacer mnimo el primer tipo de error. Generalmente esta probabilidad se fija antes de escoger la muestra. El nivel de significacin se simboliza por alfa ( ), siendo generalmente del 1%, 5%, o 10%, pero se puede usar cualquier nivel. Existe la costumbre de trabajar con el nivel de 0.05 o sea del 5%, especialmente cuando el enunciado del problema no lo brinda. Cuando se trabaja con un nivel del 5%, el resultado es significativo, y si se emplea 1% el resultado es altamente significativo, y si es del 10%, se considera poco significativo.

El valor del nivel de significacin corresponde a un rea bajo la curva de probabilidad o normal, denominado regin crtica o zona de rechazo. Procedimientos a seguir en las pruebas de hiptesis: 1. Formular la hiptesis nula y la alternativa. 2. Seleccionar el nivel de significacin. 3. Elegir la estadstica de prueba, entre las caractersticas existentes en la poblacin y muestra. 4. Definir las regiones de aceptacin y de rechazo.

5. Calcular el valor de la estadstica de prueba. 6. Calcular los valores experimental y tabular. 7. Decidir la aceptacin o rechazo de H 0 8. Toma de decisiones.

ESTIMACIN DE PARMETROS Ecuacin general para estimar parmetros : k / 2 Donde:

= Parmetro = Estimador k / 2 = Valor crtico que corresponde a la distribucin con la cual trabajamos. = Error estndar del estimador ( = / n )
: d d = margen de error d d < < +d Li < < Ls P ( d < < + d )= .

Interpretacin: la probabilidad de que el parmetro ( ) en estudio asuma valores de ( d ) a ( + d ) es de de probabilidad.

Interpretacin equivalente: - Al de probabilidad, el parmetro en estudio ( ), asume valores de ( d ) a ( + d ).

Objetivo: en base a variables en estudio estimar un parmetro determinado o probar una hiptesis en referencia a un determinado comportamiento paramtrico. Estimacin Promedio Poblacional:Aplicacin:- Dada la informacin referida a pedidos por da a una empresa xyz de un determinado artculo, durante el segundo semestre del ao 2006 en la ciudad de Tumbes. Se trabajar con una muestra aleatoria de 34 das se pide estimar el promedio poblacional de pedidos por da confiabilidad del 95%. xi = pedidospordia xi = 120, 130, 115, 136, 121, 151, 90, 132, 123, 107, 104, 128, 92, 86, 105, 96, 100, 88, 103, 71, 104, 102, 100, 86, 96, 93, 125, 128, 76, 97, 90, 122, 126. Solucin: N = 180 das. La ecuacin: : x k / 2 / n N n / n 1

= promedio poblacional. = promedio muestral = desviacin poblacional = tamao poblacional = tamao muestral k / 2 = valor crtico que corresponde a la confiabilidad con la que se trabaja. = s = desviacin muestral Siendo n= 34 > 30, usamos la distribucin normal,

x N n

: x Z / 2

s n

N n N 1

En base a la muestra calcular x y s. x = 106.85 , s = 18.83

Se evala el tamao muestral y si se conoce o no la varianza poblacional. Entonces: n = 34 > 30 y 2 no es conocida. Siendo n > 30, k / 2 = Z / 2 (sigue la normal) Se pide realizar la estimacin para 0.95 =

0.95 = = 0.4750 . Para 0.4750 en la tabla normal, Z / 2 = 1.96 2 2


Datos:
x = 106.85 ,

s = 18.83, n = 34

z = 1.96

N = 180,

106.85 (1.96) 106.85 5.72 106.85 5.72, 101.13

18.83 34

180 34 180 1

106.85 + 5.72 112.57

P ( 101.13 < < 112.57 ) = 0.95 Al 0.95 de confiabilidad la empresa xyz espera ser demandada por un promedio poblacional diario, de 101 a 113 artculos, durante el ltimo semestre del ao 2006. Aplicacin de prueba de hiptesis Prueba de hiptesis promedio poblacional Hiptesis cientfica:- La empresa xyz de la ciudad de Tumbes, durante el ltimo semestre del ao 2006, despach en promedio 98 artculos por da, Puede dudarse de lo sustentado por la compaa? Trabajor para 0.90 =

Procedimiento: Para evaluar la hiptesis si es verdadera o falsa. esta evaluacin se realizar en base a la muestra que corresponde a las ventas realizadas en 34 das (datos precedentes)

Solucin: 1. Planteamiento de hiptesis H 0 = 98 H a = > 98 2. Nivel de significacin: = 0.10 3. Estadstica de prueba Condiciones de la N y n N = 180, n = 34 y 2 = ? Usamos la normal (Z) 4. Regiones de aceptacin y rechazo de = 0.10 H a : > Z Para 0.4000 RA/ H 0 = RR/ H 0 = 5. Clculos
x = 106.85

H0 RA/ H 0 0 RR/ H 0 z = 1.28

z = 1.28 0 z < 1.28 z 1.28 Z= x z/ n

s = 18.83

Zc =

106.85 98 = 2.74 18.83 / 34

= 98
n = 34

Z c = 2.74

6. Z tabla vs Z c 1.645 < 2.74 2.74 e RR / H 0 7. Rechazamos H 0 aceptamos H a significa, el promedio diario en pedidos demandado la empresa xyz, ciudad de Tumbes, semestre seguido 2006, es superior a 98. 8. la empresa xyz debe estar preparando para brindar la mejor respuesta al mundo. ESTIMACIN PROPORCIONAL POBLACIONAL Se elige una muestra de la produccin fitoplanctnica en un estanque, durante el mes de mayo de 1999 (fertilizada con nutrilake y superfosfato triple de fsforo SPT) estime la proporcin de das cuya produccin de clorofila oscila de 12500 a 37250. Para 98 = . La informacin es la siguiente: n = 24; N = 50 15000, 37500, 50000, 37250, 25000, 12500, 37250, 37500, 25000, 43750, 37500, 25000, 6250, 12500, 15000, 43750, 32500, 25000, 10000, 43750, 37500, 25000, 12500, 6250. Calculamos la proporcin muestral: p = la caracterstica en estudio. p= 16 = 0.67 24 N n N 1 x= n de das cuya produccin de clorofila oscila de 12500 a 37250. P: p z / 2 P = p = 0.67 Q= 1- p = 1 0.67 = 0.33 Z / 2 x donde x = n de elementos que cumplen con n

0.98 = = 0.7900 2 2
(0.67)(0.33) 50 24 24 50 1

Tabla normal = z = 2.33

P: 0.67 2.33 0.67 0.16 0.67 0.16

0.67 + 0.16

0.51

0.83

P ( 0.51 < p < 0.83 ) = 0.98 Al 0.98 de confiabilidad, la proporcin de das cuya produccin de clorofila oscila de 12500 - 37250 oscila de 0.51 - 0.83 PRUEBA DE HIPOTESIS PROPORCION Hiptesis Cientfica:- la proporcin de das cuya produccin de clorofila oscila de 600 25000 es igual a 0.50 Hiptesis Estadstica:Solucin: H 0 P = 0.50

trabajar para: 0.98 =

1. H 0 P = 0.50 H 0 P 0.50 2. = 0.05 RR/ H 0 3. Z= pP PQ n z / 2 = 2.33 0 RA/ H 0 4. H 1 : = 0.05 Z 0.9800 = 0.9800 = 0.4900 2 Para 0.4900 Normal = Z / 2 = 2.33 = RA/ H 0 : -2.33 <z < 2.33 RR/ H 0 : z 2.33 z 2.33 5. En base a la informacin de la muestra anterior p= x n dediascuyaproduccionoscilade600 2500 = 24das n 13 = 0.5417 24 z / 2 = 2.33 RR/ H 0

p=

Zc =

p P 0.5417 05000 = 0.41 PQ = (0.50)(0.50) n 24

6. Z tabla vs Z c 2.33 >0.41 7. Se acepta H 0

Z c e RA/ H 0

8. la proporcin de das cuya produccin de clorofila oscila de 6000 25000 es igual a 0.50. ESTIMACION Y PRUEBA DE HIPOTESIS DE UN PROMEDIO POBLACIONAL CUANDO n <30 y 2 DESCONOCIDA La empresa Elctrica Pizza estaba considerada la distribucin a nivel Nacional de su producto que ha tenido xito a nivel local, y para ello recab datos de venta proforma. Las ventas mensuales promedio (en miles de dlares) de sus 20 de 60 distribuidores actuales. En base a esta informacin y para un = 0.99. a) Estime el promedio poblacional. b) Pruebe la hiptesis estadstica referida a que el promedio poblacional es: 5.8 ; < 7 . Ambos para 0.95 = Ventas por distribuidor: 5.8, 3.8, 7.7, 3.7, 5.0, 4.5, 6.5, 5.8, 6.6, 7.5, 8.5, 3.4, 6.8, 7.5, 5.8, 5.2, 9.8, 8.0, 8.7, 6.4. x = 6.35 , n = 20, s = 1.7656 N= 60, varianza poblacional = 2 , desconocida

Si n = 20 < 30 y 2 = ? , se usa, la distribucin t de student N n N 1

: x t( / 2, n 1)
t( / 2, n 1) = t 0.01, 20 1
( 2

s 3
)

= t( 0.005 ,19 ) = 2.861 (tabla t, Pg. 18)

10

: 6.35 (2.861) 1.7656 60 20 60 1 20


6.35 0.93 6.35 0.93 5.42 , , 6.35 + 0.93 7.28

P ( 5.42 < < 7.28) = 0.99 La posibilidad de que el promedio de ventas por distribuidor en la empresa Electric Pizza asuma valores de 5.42 7.28, es de 0.99. Prueba de hiptesis para 5.8 , 0.95 = 1 H 0 : = 5.8 H a : 5.8 2 = 0.05 3 n = 20 < 30 y 2 desconocido, usamos t RA/ H 0 RR/ H 0 t t( / 2, n 1) -2.093
21

4 = 0.05 Ha :

RR/ H 0

t( / 2, n 1) 2.093

t( / 2, n 1) = t( 0.05, 20 1) = t( 0.025 ,19 ) = 2.093 (tabla t de student Pg. 18) tc = x 6.35 5.8 = = 1.39 x / n 1.7656 / 20

5 6

ttabla vs tc tc E RA/ H 0

2.093 > 1.39 7 8 Aceptamos H 0

El promedio de ventas por distribuidor es de 5800 dlares

11

Prueba de hiptesis para < 70 , 0.95 = 1 H 0 : = 7.0 H a > 7.0 2 = 0.05 3 n = 20 < 30 y 2 desconocido, usamos t 4 = 0.05 RA/ H 0 RR/ H 0 t t ( / 2,n 1) -2.093 t( / 2, n 1) = t( 0.05, 20 1) = 1.729 (tabla t de student Pg. 18)
21

RR/ H 0

t( / 2, n 1) 2.093

5 tc =

x 6.35 7.0 = = 1.65 s / n 1.7656 / 20

ttabla vs tc tc E RA/ H 0

1.729 > -1.65

7 8

Aceptamos H 0

El promedio de ventas por distribuidor en la empresa Electric Pizza es inferior o igual a 7000 dlares.

DIFERENCIAS DE MEDIAS Estimacin y Prueba de Hiptesis:La informacin siguiente muestra la produccin fitoplanctnica (clorofila) por estanques ( E1 , E2 ) fertilizados con Nutrilake y superfosfato triple de fsforo (SPT). Se desea estudiar la diferencia de medias poblacionales, contando con muestras n1 = 15 ( E1 = Es tan que1 ) Y n2 = 19 ( E2 = es tan que 2 ). Para 0.90 =

12

La informacin es: N1 = 26 n1 = 15 ; 6250, 25000, 25000, 37250, 30000, 125000, 37500, 37250, 43750, 50000, 12500, 43750,37500, 250000, 28400. N 2 = 26 n2 = 19 25600, 10000, 12500, 50000, 30000, 37500, 10000, 26100, 30000, 350000, 43750, 57500, 12500, 6250, 10000, 12500, 12500, 6250, 32500.

n1 = 15 < 30, 2 = ? ;

n2 = 18 < 30, 2 = ?

usamos t

1 2 : ( x1 x2 ) ( t / 2 , n1 + n2 2 ) x1 x2

x 1 x 2 =

sc (

1 1 + ) n1 n2
2

sc =

(n1 1) sc + (n2 1) sc n1 + n2 2

En n1 ,

x1 = 30110 .00000 s1 = 12676 .44328 , s1 = 160692214 .2


2

En n2 ,

x2 = 24234 .21053 s2 = 15614 .92389 , s2 = 243825848


2

ss =
2

(15 1)(160692214 .2) + (19 1)(243825848 ) 15 + 19 2

sc = 840180476 .6

x1 x 2 = 840180476 .6(

1 1 + ) = 10011 .596 15 19

13

1 2 = (30110 .00000 24234 .21053) (0.6944 )(10011 .596)


0.90 = ,

= 0.10
0.10 ,15 + 19 2) = (0.05,32) = 0.6944 2 6952.05 5875.79 + 6952.05 12827.84

t( / 2, n1 + n 2 2 ) = t

: 5875.79

5875.798 6952.05 , -1076.26

P ( 1076.26 < 1 2 < 12872 .84) = 0.90 La probabilidad de la diferencia en produccin de clorofila en los dos estanques fertilizados oscila de 0 12872.84, al 0.90. Prueba de hiptesis comparativo de varianzas poblacionales Comparar las varianzas que corresponde a la produccin de clorofila en dos estanques fertilizados 1. H 0 : 12 = 2 2 H a : 1 2
2 2

2. = 0.05
2 3. n1 = 15 < 30 y 1 = ? n2 = 19 < 30 Y 2 2 = ? Usamos la prueba F( / 2;v1,v 2 )

4. calculamos las regiones de acepcin y de rechazo de la H 0 H a : = 0.05 F RR/ H 0 RA/ H 0 RR/ H 0

F(1 / 2;v1,v 2) FI FS = F( 0.025;15,19 ) = 2.62

F( / 2;v1,v 2 ) Fs

14

FI =

1 F( 0.025;19 )

1 = 0.43 ; 2.78

Explicacin del F1 F( 0.025;15,15) = 2.86 F( 0.025; 20,15 ) = 2.76 5 0.10 4 x 2.86-0.08 = 2.78 F( 0.025;19 ,15) = 0.43 FI = 1 = 0.43 2.78

RR/ H 0 FI = 0.43

RA/ H 0

RR/ H 0 FS = 2.62

5) Fc =

n1S1 (n1 1) 15(160692214 .2)(15 1) = = 0.40 2 n2 S 2 (n2 1) 19(243825848 )(19 1)

Fc = 0.40 6) Fc < FI 0.40 < 0.43 7) Se acepta H a 8) Existe diferente variabilidad en la produccin de clorofila en los estanques 1 y 2 fertilizados al 0.95 de confiabilidad PRUEBA DE HIPOTESIS COMPARATIVO DE MEDIAS POBLACIONALES Se toman como muestras 6 mujeres y 10 hombres fumadores. Se desea saber si el nmero de cigarrillos que consumen los hombres diariamente es superior al de las mujeres. Los datos brindaron en promedio 8 cigarrillos en el grupo de mujeres y 11 en el de los hombres; las desviaciones tpicas son 2.1 y 1.8 respectivamente. Al nivel del 5% Se puede llegar a la conclusin de que los hombres fuman ms que las mujeres?

Fc e RR/ H 0

15

x = mujeres y = hombres H0 : x = y Ha : x < y Para probarlas, de primera intencin se realiza el comparativo de varianzas poblacionales. Si dichas varianzas son iguales, procedemos a realizar el comparativo de medias poblacionales. Comparativo de varianzas poblacionales para el ejercicio precedente 1) 2) 3) H0 : x 2 = y 2 Ha : x2 y2 = 0.05

y2 = ? x 2 = ? n y = 10 Usamos la distribucin F, donde: 2 n S (n 1) F = x x2 x n y S y (n y 1)


nx = 6 ,

4)

= 0.05 H a :" " F


RR/ H 0 FI = 0.18 FS = f ( 6,10;0.025 ) = 4.07 FI = 1 F(10,6;0.025 ) = 1 = 0.18 5.46 RA/ H 0 RR/ H 0 FS = 4.07

RA/ H 0 : 0.18 < F < 4.07 RR/ H 0 : F 0.18 5) F 4.07

6(2.1) 2 (6 1) Fc = = 0.45 10(1.8) 2 (10 1)

16

6)

Ftabla vs Fc RA: 0.18 < F < 4.07 VS 0.45 FC e RA/ H 0 Se acepta H 0

7)

8) Las varianzas son estadsticamente iguales (no existe diferencia significativa entre ellas) con una confiabilidad del 95% Dado que las varianzas son iguales, realizaremos el comparativo de medias. Solucin: 1) 2) 3) H0 : x = y H a : x < y = 0.05 nx = 6 ,

x2 = ?

n y = 10

y2 = ?

Se usa la t ( , n1+n 2 2 ) t ( 0.05,6 +10 2) = t ( 0.05,14 ) = 1.761 4)

= 0.05 H a :" " F

RR/ H 0 t ( 0.05,14 ) - 1.761 tc = ( x x x y ) ( x y ) s2c ( sy =


2

RA/ H 0

5)

1 1 + ) nx ny
2 2

(n x 1) s x + (n y 1) s y nx + n y 2

Sc =

(6 1)(2.1) 2 + (10 1)(1.8) 2 = 3.66 6 + 10 2

17

Datos: tc = (8 11) 0 1 1 3.66( + 6 10 = 3.04

Xx =8 s y = 2.1 X y = 11 s y = 1.8 6) t tabla vs t c -1.761 < - 3.04 Se acepta H 0 7) 8) Se rechaza H a

t c e RA/ H 0

Al 0.95 de confiabilidad, no existe diferencia significativa entre el promedio de cigarrillos que fuman hombres y mujeres, en el estudio realizado. MUY IMPORTANTE

Hay muchos casos en que las varianzas poblacionales son desiguales o no se puede comprobar su igualdad. En estos casos se ha elaborado procedimientos aproximados, entre ellos la t de student con ciertos grados de laboral, mediante la aplicacin de la siguiente frmula:

(S

2 x

/ n1 + S y / n 2

) (

2 S x 2 / n1 S y / n 2 + n 1 n 1 1 2

APLICACIN Consideremos los datos sobre dos tipos de amortiguadores para vehculos MAZDA, las pruebas de duracin resultaron en dos muestras aleatorias, de tamao 16 y 12 respectivamente, las primeras con una duracin de 22.6 meses , y su desviacin tpica de 7 meses, mientras que en el segundo es de 18.2 meses y desviacin tpica de 5.2 meses. No hay ninguna prueba de que las varianzas respecto a la duracin sean iguales. Probar que la duracin no presenta diferencia significativa, al nivel del 5%. Solucin Calcularemos en primer lugar los grados de libertad.

18

7 2 5(2) 2 + 16 12 = 2 = 13 2 (7 / 16) (5(2) / 12) + 16 1 12 1 Con un nivel de significacin del 5%, el valor de t ( 0.025 ,13) = 2.16 1) H0 : x = y Ha : x y 2) 3) 4)

= 0.05
nx = 6 ,

x2 = ?

n y = 12

y2 = ?

= 0.05 H a :" " F


RR/ H 0 t ( 0.025 ,13) - 2. 16 H 0 : - 2.16 < t < 2.13 RA/ RR/ H 0 : t - 2.16 t 2.16 RA/ H 0 RR/ H 0

t ( 0.025 ,13) 2. 16

5)

tc =

( xx x y ) ( x y )
2 S Sx + y n1 n2 2

(22.6 18.2) 0 = 1.91 79 27.04 + 16 12

6)

t( 0.025 ,13) = 2.16 vs tc = 1.91 = 1.91 < 2.16 t c e RA/ H 0

7) 8)

Se rechaza H a La diferencia no es significativa al nivel del 5%

19

PRUEBA DE HIPOTESIS CON RESPECTO A LA VARIANZA POBLACIONAL En gran parte, por no decir en su totalidad, las unidades dedicadas a la inferencia estadstica van encaminadas hacia el promedio; sin embargo las inferencias realizadas con la varianza pueden constituirse en medidas ms importantes que el promedio, pues este ltimo, vale la pena recordar, es un punto de estimacin, siendo aquel valor que consideramos tpico, porque no siempre lo va a ser, dado que depende del grado de variabilidad para ser representativa del conjunto de observaciones. Se hace referencia a la prueba de hiptesis de una varianza con base en una muestra aleatoria. Partimos suponiendo que se tiene una poblacin normal con media uy varianza 2 desconocida. La simbologa que se usa en el proceso ser: H 0 : = 0 Lo que equivale H 0 :
2 2

2 =1 2 0
2

Ha : 2 0 , H a : 2 > 0 ; H a : 2 < 0

Que tambin pueden ser presentados como:

2 2 02 Ha : 2 1, Ha : > 1, Ha : 2 < 1 0 0 2
Para la realizacin de esta prueba se emplea la estadstica Chi-cuadrado con n -1 grados de libertad y la variante estadstica est dada de la siguiente manera: ( n 1) 2 S 2 X2 = 2 0 Aplicacin: Docimar (probar) la hiptesis de que = 8 dado que S = 10 para una muestra de tamao 20. Solucin: 1) H0 :

2 =1 2 0

H0 :

2 =1 82
Ha :

2 =1 64 2 1 64

2)

= 0.05

20

3)

La muestra es aleatoria, la poblacin es normal cuadrado con n-1 grados de libertad. Usamos la Chi-cuadrado con n- 1, X n 1
2

usamos

la

Chi-

4)

RA/ H 0 y RR/ H 0

RR/ H 0

RA/ H 0

RR/ H 0

X2 / 2, 0.469 RA/ H 0 = 0.469 < < 1.73


2

X2 1 / 2, 1.73

RA/ H 0 : ( ) 0.469 o ( ) 1.73


2 2

5)

x2 s2 100 = = = 1.56 64 64 x2 e RA/ H 0 Aceptamos H 0 Se puede afirmar al nivel del 5% que la varianza de la muestra, puede corresponder a una poblacin cuya varianza es 64. ESTIMACION DE PARAMETROS

6) 7) 8)

Establezca los lmites para con una confianza de 95% Siendo: s = 10 s 2 = 100

= 19
x

n = 20

Solucin: x2 = 0.469 0.025 ,1+19

= 1.73 00.97519

21

0.469 <

x2 < 1.73

siendo

x2 S 2 = 2 0.469 < 100 <1.73 2

S2 Tenemos: 0.469 < 2 < 1.73 1 2 1 > > 0.469 100 1.73 14.60 > >7.60

100 100 >2 > 0.469 1.73 7.60 < < 14.60

100 > > 0.469

100 1.73

1 Asume valores de 7.60 14.60 al 95% de la confiabilidad.

DIFERENCIA DE PROPORCIONES ESTIMACION DE PARMETROS Y PRUEBA DE HIPTESIS Se realiz un estudio sobre la cantidad de plomo en sangre en mujeres purperas ciudad de Mxico, aos 2005 y 2006, se trabaj con una poblacin de 102 mujeres en el ao 2005( N1 = 102 ) y con 120 mujeres en el ao 2006 ( N 2 = 120 ). Para efectos de estudio comparativo sobre la cantidad de plomo en sangre superior a 11 g / dl en mujeres purperas, se trabaja con una muestra de 30 mujeres purperas ( n1 = 30 ) en el ao 2005 y con una muestra aleatoria de 38 mujeres ( n2 = 38 ) en el ao 2006. Sobre esta investigacin. Ser diferente la proporcin de mujeres purperas con cantidad de plomo en sangre superior a 11 g / dl en los dos aos de realizada la investigacin en ciudad Mxico? La informacin est dada por:

n1 = 30 (Ao 2005) 10.0, 12.9, 6.9, 6.4, 11.6, 9.1, 17.0, 23.3, 10.0, 11.5, 11.7, 7.2, 5.6, 12.4, 4.6, 8.8, 15.9, 8.2, 7.6, 7.9, 10.3, 5.3, 5.1, 12.3, 11.5, 20.0, 4.9, 5.1, 11.4, 5.9

n2 = 38 (Ao 2006) 9.2, 10.5, 6.4, 12.4, 14.2, 9.7, 6.8, 7.8, 5.2, 9.2, 5.9, 10.5, 6.8, 5.1, 13.3, 21.0, 12.7, 23.1, 9.8, 2.9, 7.4, 18.9, 9.8, 8.5, 21.0, 7.1, 8.5, 13.1, 10.7, 5.5, 14.5, 14.4, 6.9, 8.8, 9.4, 7.4, 12.9, 11.0

22

ESTIMACIN PARA LA DIFERENCIA DE PROPORCIONES x = mujer purpera con plomo en sangre superior a 11 g / dl p1 = x1 11 = = 0.37 n1 30 p2 = x2 11 = = 0.29 n2 38

Para un 94 = % p1 p2 : p1 p2 Z / 2 0.37 0.29 1.88 P Q1 P2Q2 1 + n1 n2

(0.37)(0.63) (0.29)(0.71) + 30 38 0.94 = 0.4700 Si 0.94 = = , 2 2 : 0.08 0.22 P ( 0.14 < P P2 < 0.30 ) = 0.94 1

z= 1.88 (tabla normal Pg. 19)

Al 0.94 de confiabilidad la diferencia de proporciones de mujeres purperas en la ciudad de Mxico en los aos 2005 2006 de plomo en sangre es superior a 11 g / dl , oscila de 0 0.30 Prueba de hiptesis Diferencia de Proporciones 1. H 0 : P = P2 1 H a P P2 1 2. = 0.02 , 0.98 =

n2 = 38 3. n1 = 30 , Se usa la normal 4. = 0.02 H a : Z

p1 2 = ?

p22 = ?

RR/ H 0 z / 2 - 2.33 0.98 = 0.4900 = 2/ 2

RA/ H 0

RR/ H 0

z / 2 2.33

2.33

0.98 = tabla normal

RA/ H 0 : - 2.33 < z < 2.33

23

RR/ H 0 : z -2.33 Zc =

z 2.33 (0.37 0.29) 0 = 6.07 (0.37)(0.63) (0.29)(0.71) + 30 38

5.

( p1 p2 ) ( P P2 ) 1 P Q1 P2Q2 = 1 + n1 n

6. Z tabla vs Z c 2.33 < 6.07 Z c E RR/ H 0

7. Se rechaza H 0 . Se acepta H a 8. la proporcin de mujeres purperas cuya concentracin de plomo en sangre superior a 11 g / dl ciudad de Mxico 2005 es diferente de la proporcin de mujeres con igual caracterstica en el ao 2006, al 98% de confiabilidad. DISTRIBUCIN NORMAL Es sin duda la ms conocida y usada de todas. Corresponde a una distribucin de variable continua que se extiende sobre un campo de variabilidad infinito y est dado por la funcin de densidad normal. F(x)= 1 2 2 x Donde: e
1 / 2[ x x / x

] 2 (I)

x = media 2 x = var ianza


e = 2.71828

; x = E [ x ] = , talque < > ; x > 0


2

; = 3.14159

La grfica de la expresin (I) es la siguiente:

24

x 3 x

x 2 x

x x

x x + x 68% 95%
99%

x + 2 x

x + 3 x

rea bajo la curva o probabilidad. Esta se calcular por medio de tablas estadsticas. x N ( x , x )
x

Distribucin Normal Estandarizada (Z) = x x x

N ( z = 0, z = 1 )
2

z =1

25

0.34135 0.34135

-3

-2

-1

0 +1 68.27% 95.45% 99.73%

+2

+3

= Confiabilidad o probabilidad

= Error o nivel de significacin


Calcularemos algunos tipos de probabilidades para usarlos al realizar estimacin de parmetros y prueba de hiptesis. 1. Dada el rea o probabilidad calcular el valor Z. Un rea o probabilidad bajo la curva normal, se define:

z1 0 P ( 0 z z , )= 2/ Calcular el valor de Z, dadas las reas: 0.3413, 0.4788, 0.4969. Para determinarlas: P ( 0 z z , )= 0.3413, v a la tabla normal 26

(Pg. 19) tablas estadsticas, encontramos:

.00---------------------------------------------------.09

1.0

0.3413

En la tabla, para 0.3413, a la izquierda del valor z = 1.0, para 0.3413, z1 = 1.0 P ( 0 z z1 )= 0.4788 Para determinar z, ubicamos el rea en la tabla y luego observamos al lado izquierda que existe 2.0 y hacia arriba (en la misma columna de 0.4788) encontramos .03 el valor de z1 es 2.03. P ( 0 z z1 ) = 0.4969 Con el mismo procedimiento precedente, Z1 = 2.74. Si tenemos el rea o probabilidad total, como determinamos el valor de z1 ? Para 0.95 = cunto vale Z1 . Tenemos: P ( z1 z z1 )=0.95= De acuerdo al mensaje de la tabla, responde a P ( 0 z z1 ) = / 2 , por tanto, para esta cara, tenemos P ( 0 z z1 ) = 0.95/2=2/ ;P ( 0 z z1 ) = 0.4750; para 0.4750 en la tabla, Z1 = 1.96 Para 0.98=, ,z1 = ? P ( 0 z z1 )= 0.98 / 2 = 0.4900 Podemos advertir que 0.4900 no la encontramos en la tabla, Cmo se acta? Se toma el rea que ms cercana est a la buscada. Por defecto o por exceso. En este caso los ms cercanos son: 0.4901 (defecto) y 0.4904 (exceso), de las dos reas, la ms cercana es 0.4901, para esta rea el valor de z1 = 2.33 , el cual ser asignado como valor de z1 = 0.4900 Para 0.98, z1 = 2.33 27

Z 0.0 1.0 2.0 . . .

.00

.03

0.4788

2. Dado Z calcular el rea o probabilidad. Calcular la probabilidad, dado los valores de z. P ( 0 z 2.09 ) = ? En la tabla el rea es: 0.4817 Para P ( 0 z 0.97 )= cual es el rea, tabla, rea = 0.3340. Que es el valor de / 2 Donde el valor de / 2 ; si deseamos el valor , el rea obtenida se multiplicar por 2, as, 0.3340*2 = 0.6680. z1 = 0.97 , = 0.6680 P ( 2.58 z 0 ) = cul es el rea? P ( 2.58 z 0 ) = P ( 0 z 2.58 ) =, en la tabla / 2 = 0.4951, P ( 2.58 z 0 )= 0.4951. Si deseamos el rea total baja la curva: P ( 2.58 z 2.58 )= 0.4951*2=0.9902 (rea total). Para: ( 2.90 z 0 )= 0.4981 encontramos en la tabla total: 0.4981*2= 0.9972= P ( 2.90 z 2.90 ) 0.4981. rea

28

También podría gustarte