Prueba de Hipótesis para La Media Poblacional

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 37

 

 3
PRUEBA DE HIPÓTESIS PARA LA MEDIA POBLACIONAL.
El propósito de la prueba de hipótesis es determinar si un valor
propuesto(hipotético) para un parámetro poblacional, por ejemplo para una
media,debe aceptarse como plausible con base en la evidencia muestral.
Recuerdelas distribuciones de muestreo, en general el valor de una
media muestraldifiere del valor de la media poblacional. Si el valor de un
estadísticomuestral, como la media muestral es cercano al valor propuesto
conparámetro y solo difiere en una cantidad que resulta des esperarse
debido almuestreo aleatorio, entonces no se rechaza el valor hipotético. Si
elestadístico muestral difiere del valor propuesto en una cantidad que no esatribuible
a la casualidad, entonces se rechaza la hipótesis por noconsiderarse
plausible.Se han desarrollado tres métodos para pruebas de hipótesis, todos
ellosconducentes a la misma decisión cuando se usan los mismos
estándares deprobabilidad y de riesgo.
Independientemente del método que se utilice en las pruebas de
hipótesis,observe que cuando se rechaza el valor hipotético, y por tanto
se acepta,esto no constituye una prueba de que el valor hipotético sea
correcto. Laaceptación de un valor propuesto como un parámetro
simplemente indicaque es un valor plausible de acuerdo con el valor
observado en el estadísticomuestral.
- HIPOTESIS Y PRUEBA DE HIPOTESIS
Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis.
Hipótesis es una aseveración de una población elaborado con el propósito de poner aprueba, para verificar si
la afirmación es razonable se usan datos.
En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen
las pruebas para verificar la aseveración o para determinar que no es verdadera.
Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y
la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.
Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco paso:

Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no rechazar la hipótesis, pero
debemos de tener cuidado con esta determinación ya que en la consideración de estadística no proporciona
evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba más allá de una duda
razonable. Analizaremos cada paso en detalle
Objetivo de la prueba de hipótesis.
El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer
un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.
3.- Procedimiento sistemático para una prueba de hipótesis de una muestra
.Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.

Cualquier investigación estadística implicala existencia de hipótesis o afirmaciones acerca de las


poblaciones que se estudian.
La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población,
no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay
diferencia. Por lo general hay un "no" en la hipótesis nula que indica que "no hay cambio"
Podemos rechazar o aceptar Ho.
La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula
siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.
La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una
afirmación que se acepta si los datos maestrales proporcionan evidencia suficiente de que la
hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El
planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al
valor especificado del parámetro.
Paso 2: Seleccionar el nivel de significancia.
Nivel de significacia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le
denota mediante la letra griega α, tambiιn es denominada como nivel de riesgo, este termino es
mas adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es
verdadera. Este nivel esta bajo el control de la persona que realiza la prueba.
Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación
indicará la probabilidad de no aceptarla, es decir, estén fuera de área de aceptación. El nivel
de confianza (1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es
verdadera en la población.

La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de


rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la
estadística de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis
nula.
La región de rechazo puede considerarse como el conjunto de valores de la estadística de
prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro lado,
estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico
separa la región de no rechazo de la de rechazo.
Tipos de errores
Cualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación de
la Ho o de la Ha, puede incurrirse en error:
Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía
ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α
Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es aceptada
cuando de hecho es falsa y debía ser rechazada.
En cualquiera de los dos casos se comete un error al tomar una decisión equivocada.
En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las
consecuencias posibles.

Para que cualquier ensayo de hipótesis sea bueno, debe diseñarse de forma que minimice los
errores de decisión. En la práctica un tipo de error puede tener más importancia que el otro, y
así se tiene a conseguir poner una limitación al error de mayor importancia. La única forma de
reducir ambos tipos de errores es incrementar el tamaño de la muestra, lo cual puede ser o no
ser posible.
La probabilidad de cometer un error de tipo II denotada con la letra griega beta β, depende de
la diferencia entre los valores supuesto y real del parámetro de la población. Como es más fácil
encontrar diferencias grandes, si la diferencia entre la estadística de muestra y el
correspondiente parámetro de población es grande, la probabilidad de cometer un error de tipo
II, probablemente sea pequeña.
El estudio y las conclusiones que obtengamos para una población cualquiera, se habrán
apoyado exclusivamente en el análisis de una parte de ésta. De la probabilidad con la que
estemos dispuestos a asumir estos errores, dependerá, por ejemplo, el tamaño de la muestra
requerida. Las contrastaciones se apoyan en que los datos de partida siguen una distribución
normal
Existe una relación inversa entre la magnitud de los errores α y β: conforme a aumenta, β
disminuye. Esto obliga a establecer con cuidado el valor de a para las pruebas estadísticas. Lo
ideal sería establecer α y β.En la práctica se establece el nivel α y para disminuir el Error β se
incrementa el número de observaciones en la muestra, pues así se acortan los limites de
confianza respecto a la hipótesis planteada .La meta de las pruebas estadísticas es rechazar la
hipótesis planteada. En otras palabras, es deseable aumentar cuando ésta es verdadera, o sea,
incrementar lo que se llama poder de la prueba (1- β) La aceptación de la hipótesis
planteada debe interpretarse como que la información aleatoria de la muestra disponible no
permite detectar la falsedad de esta hipótesis.
Paso 3: Cálculo del valor estadístico de prueba
Valor determinado a partir de la información muestral, que se utiliza para determinar si se
rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso
utilizaremos los estadísticos z y t. La elección de uno de estos depende de la cantidad de
muestras que se toman, si las muestras son de la prueba son iguales a 30 o mas se utiliza el
estadístico z, en caso contrario se utiliza el estadístico t.
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad
Ejemplo
H0 : µ = 200
H1 : µ ≠ 200

b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤


H0 : µ ≥ 200 H0 : µ ≤ 200
H1 : µ < 200 H1 : µ > 200
 

En las pruebas de hipótesis para la media (μ), cuando se conoce la desviación estándar (σ)
poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de
prueba es z y se determina a partir de:
El valor estadístico z, para muestra grande y desviación estándar poblacional desconocida se
determina por la ecuación:

En la prueba para una media poblacional con muestra pequeña y desviación estándar
poblacional desconocida se utiliza el valor estadístico t.

Paso 4: Formular la regla de decisión


SE establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones
en que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los
valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la
suposición de que la hipótesis nula es verdadera, es muy remota

Distribución muestral del valor estadístico z, con prueba de una cola a la derecha
Valor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la
región en la que no se rechaza la hipótesis nula.
Paso 5: Tomar una decisión.
En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara
con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula. Tenga presente que
en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la
hipótesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula
cuando no debería haberse rechazado (error tipo I). También existe la posibilidad de que la
hipótesis nula se acepte cuando debería haberse rechazado (error de tipo II).
4.- Ejemplo en la cual se indica el procedimiento para la prueba de hipótesis
Ejemplo
El jefe de la Biblioteca Especializada de la Facultad de Ingeniería Eléctrica y Electrónica de la
UNAC manifiesta que el número promedio de lectores por día es de 350. Para confirmar o no
este supuesto se controla la cantidad de lectores que utilizaron la biblioteca durante 30 días. Se
considera el nivel de significancia de 0.05
Datos:

Día Usuarios Día Usuarios Día Usuario

1 356 11 305 21 429

2 427 12 413 22 376

3 387 13 391 23 328

4 510 14 380 24 411

5 288 15 382 25 397

6 290 16 389 26 365

7 320 17 405 27 405

8 350 18 293 28 369

9 403 19 276 29 429

10 329 20 417 30 364

Solución: Se trata de un problema con una media poblacional: muestra grande y desviación
estándar poblacional desconocida.
Paso 01: Seleccionamos la hipótesis nula y la hipótesis alternativa
Ho: μ═350
Ha: μ≠ 350
Paso 02: Nivel de confianza o significancia 95%
α═0.05
Paso 03: Calculamos o determinamos el valor estadístico de prueba
De los datos determinamos: que el estadístico de prueba es t, debido a que el numero de
muestras es igual a 30, conocemos la media de la población, pero la desviación estándar de la
población es desconocida, en este caso determinamos la desviación estándar de la muestra y la
utilizamos en la formula reemplazando a la desviación estándar de la población.

Calculamos la desviación estándar muestral y la media de la muestra empleando Excel, lo cual


se muestra en el cuadro que sigue.

Columna1

Media 372.8

Error típico 9.56951578

Mediana 381

Moda 405

Desviación estándar 52.4143965

Varianza de la muestra 2747.26897

Curtosis 0.36687081

Coeficiente de asimetría 0.04706877

Rango 234

Mínimo 276

Máximo 510

Suma 11184

Cuenta 30

Nivel de confianza (95.0%) 19.571868

Paso 04: Formulación de la regla de decisión.


La regla de decisión la formulamos teniendo en cuenta que esta es una prueba de dos colas, la
mitad de 0.05, es decir 0.025, esta en cada cola. el área en la que no se rechaza Ho esta entre
las dos colas, es por consiguiente 0.95. El valor critico para 0.05 da un valor de Zc = 1.96.
Por consiguiente la regla de decisión: es rechazar la hipótesis nula y aceptar la hipótesis
alternativa, si el valor Z calculado no queda en la región comprendida entre -1.96 y +1.96. En
caso contrario no se rechaza la hipótesis nula si Z queda entre -1.96 y +1.96.
Paso 05: Toma de decisión.
En este ultimo paso comparamos el estadístico de prueba calculado mediante
el Software Minitab que es igual a Z = 2.38 y lo comparamos con el valor critico de Zc = 1.96.
Como el estadístico de prueba calculado cae a la derecha del valor critico de Z, se rechaza Ho.
Por tanto no se confirma el supuesto del Jefe de la Biblioteca.
One-Sample Z
Test of mu = 350 vs not = 350
The assumed standard deviation = 52.414
N Mean SE Mean 95% CI Z P
30 372.800 9.569 (354.044, 391.556) 2.38 0.017

 
Conclusiones:
 Se rechaza la hipótesis nula (Ho), se acepta la hipótesis alterna (H1) a un nivel de
significancia de α = 0.05. La prueba resultó ser significativa.
 La evidencia estadística no permite aceptar la aceptar la hipótesis nula.

5.- BIBLIOGRAFIA
1. Vega, Escuela de Postgrado, Maestría en Ingeniería de Sistemas. Lima - Perú 2005.
2. Apunte de clases (versión digital). Dr. Jorge Luis Cordova Egocheaga. Universidad Inca
Garcilaso de la
3. Lind-Marchal-Mason. Estadística para Administración y Economía Edit. Alfaomrga
11ª Edición Capitulo

10
3.- Alicia Takemoto (monografía.com). Trabajo de Curso de Estadística UNFV. 2005 Lima-
Perú
4.- Hines-Montgomery-Goldsman-Borror. Probabilidad y Estadística para Ingeniería Edit.
CECSA 4ª
Edición. 2005 México. Capitulo 11
 
 
Por:
Ing. Armando Pedro Cruz Ramirez
Universidad Inca Garcilaso de la Vega, Maestría en Ingeniería de Sistemas
Lima - Perú
Preparada para la asignatura: Modelos Estadísticos
Primer Ciclo de Maestría en Ingeniería de Sistemas
Mención Tecnología de la Información

Comentarios

Miercoles, 20 de Abril de 2011 a las 15:42  |  0       


Alexa Columbus
hola quisiera saber que programa utilizaron para los graficos?

Lunes, 3 de Mayo de 2010 a las 15:14  |  0       


Diana Villa
Hola, soy Diana, acabo de encontrar este artículo y me gustó muchísimo, porque, en lo personal no
entiendo nada de estadística, y curiosamente a este texto sí. Estoy estudiando Probabilidad y
estadística en la prepa y este artículo me ayudó muchísimo a aprobar el examen. Muchisimas
gracias a las personas que publican artículos tan buenos como este!!!

Leer más: http://www.monografias.com/trabajos30/prueba-de-hipotesis/prueba-de-
hipotesis.shtml#ixzz4hZw7NVh4

1. . UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA AUTOR: CARLOS MUÑOZ


2. 2. PRUEBAS DE HIPÓTESIS PARA UNA MUESTRA
3. 3. Prueba para una media poblacional con una desviación estándar poblacional conocida
PRUEBA DE DOS COLAS
4. 4. CONCEPTO <ul><li>Una prueba es de dos colas cuando no se establece una dirección
específica de la hipótesis alterna H1, como: H0 : el ingreso medio de las mujeres es igual al
ingreso medio de los hombres. H1 : el ingreso medio de las mujeres no es igual al ingreso medio
de los hombres. </li></ul><ul><li>Distribución de muestreo para el valor estadístico z, prueba
de dos colas, nivel de significancia de 0.05 </li></ul>
5. 5. Para entender mejor este concepto, a continuación daré un ejemplo con cinco pasos para
realizar la prueba de hipótesis, usando una prueba de dos colas. Esto es, no nos interesa si los
resultados muestrales son menores o mayores que la media poblacional propuesta. Únicamente
nos interesa sin son diferentes del valor propuesto para la media poblacional
6. 6. Ejemplo: La empresa Jamestown Steel Company fabrica y ensambla escritorios y otros
muebles para oficina, en diversas plantas del oeste de Nueva York. La producción semanal del
escritorio modelo A325 en la planta Fredonia, se distribuye normalmente con una media de 200
y una desviación estándar de 16. En tiempos recientes, debido a la expansión del mercado, se
han introducido nuevos métodos de producción y se han contratado más empleados. El
vicepresidente de la compañía quisiera saber si ha habido alguna variación en la producción
semanal. Planteado de otra forma, ¿el número medio de escritorios producidos en la Planta
mencionada es diferente de 200? Utilice el nivel de significancia 0.01
7. 7. DESARROLLO <ul><li>Se utiliza el procedimiento estadístico de prueba de hipótesis para
investigar si la tasa de producción ha cambiado respecto del valor de 200 por semana
</li></ul><ul><li>Paso 1: La hipótesis nula es la “La media poblacional es 200”. La hipótesis
alternativa es “La media es diferente de 200” o “La media no es 200”. Las dos hipótesis se
expresa como sigue: </li></ul><ul><li>H o : u = 200 </li></ul><ul><li>H 1 : u ≠ 200
</li></ul><ul><li>Esta es una prueba de dos colas debido a que la hipótesis alternativa no
establece una dirección. En otras palabras, no establece si la producción media es mayor o
menor que 200. El vicepresidente sólo desea averiguar si la tasa de producción es diferente de
200 </li></ul>
8. 8. DESARROLLO <ul><li>Paso 2: Como se observó, se utilizara el nivel de significancia 0.01.
Esto es α , la probabilidad de cometer un error de tipo I, y la posibilidad de rechazar una
hipótesis verdadera. </li></ul><ul><li>Paso 3: El estadístico de prueba para una media es z. La
transformación de los datos de producción a unidades estándar (valores z) permite su uso no
sólo en este problema, sino también en otros problemas de prueba de hipótesis . La formula de z
entonces es: </li></ul><ul><li>Donde es la media muestral, µ la media poblacional, la
desviación estándar de la población y √n el número en la muestra. </li></ul>
9. 9. DESARROLLO <ul><li>Paso 4: La regla de decisión se formula hallando el valor crítico de
z en el apéndice D. Puesto que ésta en una prueba de dos colas, la mitad es 0.01, es decir 0.005,
esta en cada cola. El área en la que no se rechaza Ho, localizada entre las dos colas es por
consiguiente, 0.99. El apéndice D se basa en sólo la mitad del área bajo la curva, o sea 0.5000.
luego, 0.5000 – 0.005 es 0.4950, y así este valor de 0.4950 es el área entre 0 y el valor crítico.
Localícese 0.4950 en la tabla. El valor más cercano a 0.4950 es 0.4951. Luego se lee el valor
crítico en la fila y la columna correspondientes a 0.4951. Este valor es 2.58. Todos los aspectos
de este problema se muestran en la grafica siguiente: </li></ul>
10. 10. DESARROLLO <ul><li>Por consiguiente, la regla de decisión es: rechazar la hipótesis nula
y aceptar la hipótesis alternativa (que establece que la media poblacional no es 200), si el valor z
calculado no queda en la región entre -2.58 y 2.58. En caso contrario, no se rechaza la hipótesis
nula si z queda entre -2.58 y 2.58 </li></ul><ul><li>Paso 5: Se toma una muestra de la
población (producción semanal); se calcula z y con base en la regla de decisión, se toma la
decisión de rechazar o no Ho . El número medio de escritorios producidos en el último año (50
semanas, porque la planta estuvo cerrada dos semanas por vacaciones), es 203.5. La desviación
estándar de la población es 16 escritorios por semana. Calculando el valor z con la siguiente
formula : </li></ul>= 1.54
11. 11. DESARROLLO <ul><li>Puesto que 1.55 no cae en la región de rechazo, no se rechaza Ho.
De modo que se concluye que la media de la población, no es distinta de 200. Así que se
informa al Vicepresidente que la evidencia muestral no refleja que la taza de producción en la
Planta Fredonia haya cambiado de 200 por semana. La diferencia de 3.5 unidades entre la tasa
de producción semanal histórica, y la del año anterior, puede atribuirse razonablemente al azar.
Esta información se resume en el siguiente diagrama. <
7.1-De Una o Dos Colas
Muy a menudo, en la práctica se tienen que tomar
decisiones sobre poblaciones, partiendo de la información
muestral de las mismas. Tales decisiones se llaman
decisiones estadísticas. Por ejemplo, se puede querer
decidir a partir de los datos del muestreo, si un suero nuevo
es realmente efectivo para la cura de una enfermedad, si un
sistema educacional es mejor que otro, si una moneda
determinada está o no cargada, etc. 

HIPOTESIS NULA

Para llegar a tomar decisiones, conviene hacer


determinados supuestos o conjeturas acerca de las
poblaciones que se estudian. Tales supuestos que pueden
ser o no ciertos se llaman hipótesis estadísticas y en
general, lo son sobre la distribución de probabilidad de las
poblaciones.

     En muchos casos se formulan las hipótesis estadísticas


con el solo propósito de rechazarlas o invalidarlas. Por
ejemplo, si se quiere decidir si una moneda está cargada, se
formula la hipótesisde que la moneda está bien, es decir, p
= 0.5; donde p es la probabilidad de cara. Análogamente, si
se quiere decidir sobre si un procedimiento es mejor que
otro, se formula la hipótesis de que no hay diferencia entre
ios procedimientos (es decir, cualquier diferencia observada
se debe meramente a fluctuaciones en el muestreo de la
misma población) Tales hipótesis se llaman también
hipótests nulas y se denotan por Ho .

     Cualquier hipótesis que difiera de una hipótesis dada se


llama hipótesis alternativa. Por ejemplo, si una hipótesis es
p=0.5, hipótesis alternativas son p=0.7; p≠0.56 ó p>0.5.
Unahipótesis alternativa de la hipótesis nula se denota por
H1 .
 

ENSAYOS DE HIPÓTESIS Y SIGNIFICACIÓN

Si en el supuesto de que una hipótesis determinada es


cierta, se encuentra que los resultados observados en una
muestra aleatoria difieren marcadamente de aquellos que
cabía esperar con la hipótesis y con la variación propia del
muestreo, se diría que las diferencias observadas
son significativas y se estaría en condiciones de rechazar
la hipótesis (o al menos no estaría de
acuerdo con la evidencia obtenida). Por ejemplo, si en
20 lanzamientos de una moneda se obtienen
16 caras, se estaría inclinado a rechazar la hipótesis de que
la moneda está bien, aunque sería posible que
fuese un rechazamiento erróneo.

     Los procedimientos que facilitan el decidir si una


hipótesis se acepta o se rechaza o el determinar si las
muestras observadas difieren significativamente de los
resultados esperados se llaman ensayos o pruebas de
hipótesis, ensayos de significación o reglas de decisión. 

 ERRORES TIPO I Y TIPO II

Si se rechaza una hipótesis cuando debería ser aceptada,


se dice que se comete un error del Tipo i. Si por el contrario,
se acepta una hipótesis que debería ser rechazada, se dice
que se comete un error del Tipo II. En cualquiera de los
dos casos se comete un
error al tomar una decisión equivocada.

     Para que cualquier ensayo de hipótesis o reglas de


decisión sea bueno, debe diseñarse de forma que minimice
los errores de decisión. Esto no es tan sencillo como pueda
parecer puesto que para un tamaño de muestra dado, un
intento de disminuir un tipo de error, va generalmente
acompañádo por un incremento en el otro tipo de error. En
la práctica, un tipo de error puede tener más importancia
que el otro, y así se tiende a conseguir poner una limitación
al error de mayor importancia. La única forma de reducir al
tiempo ambos tipos de errores es incrementar el tamaño de
la muestra, lo cual puede o no ser posible. 

NIVEL DE SIGNIFICACION

La probabilidad máxima con la que en el ensayo de una


hipótesis se puede cometer un error del Tipo I se llama nivel
de significación del ensayo. Esta probabilidad se denota
frecuentemente por α; generalmente se fija antes de la
extracción de las muestras, de modo que los resultados
obtenidos no influyen en la elección.

    En la práctica se acostumbra a utilizar niveles de


significación del 0.05 ó 0.01, aunque igualmente pueden
emplearse otros valores. Si, por ejemplo se elige un nivel de
significación del 0.05 ó 5% al diseñar un ensayo de
hipótesis, entonces hay aproximadamente 5 ocasiones en
100 en que se rechazaría la hipótesis cuando debería ser
aceptada, es decir, se está con un 95% de confianza de que
se toma la decisión adecuada. En tal caso se dice que la
hipótesis ha sido rechazada al nivel de significación del
0.05,lo que significa que se puede cometer error con una
probabilidad de 0.05.

ENSAYOS REFERENTES A LA DISTRIBUCION NORMAL

Para aclarar las ideas anteriores, supóngase que con una


hipótesis dada, la distribución muestral de un estadístico S
es una distribución normal con media μs y desviación típica
σs. Entonces la distribución de la variable tipificada dada por
Z = (S- μs )/ σs,es una normal tipificada (media 0, varianza
1) .
 

Figura 7.1.1 Distribución Normal

     Como se indica en la figura, se puede estar con el 95%


de confianza de que, si la hipótesis es cierta, el valor de z
obtenido de una muestra real para el estadístico S se
encontrará entre -1.96 y 1.96 (puesto que el área bajo la
curva normal entre estos valores es 0.95).

     Sin embargo, si al elegir una muestra aleatoria se


encuentraque z para ese estadístico se halla fuera del
recorrido -1.96 a1.96, lo que quiere decir que es un suceso
con probabilidad de solamente 0.05 (área sombreada de la
figura) si la hipótesis fuese verdadera. Entonces puede
decirse que esta z difiere significativamente de la que cabía
esperar bajo esta hipótesis y se estaría inclinado a rechazar
la hipótesis.

     El área total sombreada 0.05 es el nivel de significación


del ensayo. Representa la probabilidad de cometer error al
rechazar la hipótesis, es decir, la probabilidad de cometer
error del Tipo I. Así pues, se dice que la hipótesis se
rechaza a nivel de significación del 0.05 o que la z obtenida
del estadístico muestral dado es significativa al nivel de
significación del 0.05.

     El conjunto de las z que se encuentran fuera del rango


-1.96 a 1.96 constituyen lo que se llama región crítica o
región de rechace de la hipótesis o región de significación.
El conjunto de las z que se encuentran dentro del recorrido
-1.96 a 1.96 podía entonces llamarse región de aceptación
de h hipótesis o región de no significación.

     De acuerdo con lo dicho hasta ahora, se puede formular


la siguiente regla de decisión o ensayo de hipótesis o
significación:

 Se rechaza la hipótesis al nivel de significación del


0.05 si la z obtenida para el estadístico S se
encuentra fuera del recorrido -1.96 a 1.96 (es decir, z
> I.96 ó z < 1- 1.96). Esto equivale a decir que el
estadístico muestral observado es significativo al nivel
del 0.05.
 Se acepta Ia hipótesis (o si se desea no se toma
decisión alguna) en caso contrario.

     Debe ponerse de manifiesto que pueden igualmente


emplearse otros niveles de significación. Por ejemplo, si se
utilizase el nivel de 0.01 se sustituría 1.96 en todo lo visto
anteriormente por 2.58.

 ENSAYOS DE UNA Y DOS COLAS

En el ensayo anterior se mostraban los valores extremos del


estadístico S o su correspondiente z a ambos lados de la
media, es decir, en las dos "colas" de la distribución. Por
esta razón, tales ensayos se llaman ensayos de dos colas ,
ensayos bilaterales o prueba de hipótesis de dos colas.

     Sin embargo, con frecuencia se puede estar solamente


interesado en los valores extremos a un solo lado de Ia
media, es decir, en una "cola" de la distribución, como por
ejemplo, cuando se está ensayando la hipótesis de que un
proceso es mejor que otro (que es diferente a ensayar si un
proceso es mejor o peor que otro). Tales ensayos se llaman
ensayos de una cola o ensayos unilaterales. En tales casos,
Ia región crítica es una región a un lado de la distribución,
con área igual al nivel de significación.

     La siguiente tabla da los valores críticos de z para


ensayos de una y dos colas a distintos niveles de
significación, será́ de utilidad para propósitos de referencia.
Valores críticos de z para otros niveles de significación, se
pueden encontrar utilizando la tabla que da las áreas bajo la
curva normal.

0.10 0.05 0.01 0.005 0.0002


Nivel de
significación α

 
Valores críticos de -128 ó -1.645 -2.33 ó -2.58 ó -2.88 ó
z Para ensayos 1.28 ó 1.645 2.33 2.58 2.88
Unilaterales

 
Valores críticos de -1.645 ó -1.96 ó -2.58 ó
z para ensayos 1.645 1.96
bilaterales -
- 3.0
  2.8 8 ó
1 ó 3-
2.8 08
1
8

Pruebas de Una y Dos Colas  Una prueba de cualquier hipótesis estadística, donde la alternativa
es unilateral como se denomina prueba de una sola cola.  Por lo general, la región crítica para la
hipótesis alternativa θ > θ0 yace en la cola derecha de la distribución del estadístico de prueba; en
tanto que la región crítica para la hipótesis alternativa θ < θ0 yace en la cola izquierda. 16 1 0 0 0 1
0 0 0 : : o : : θ θ θ θ θ θ θ θ < = > = H H H H UCR-ECCI CI-1352 Probabilidad y Estadística Pruebas de
Hipótesis de Una y Dos Muestras Pruebas de Una y Dos Colas (cont.)  Una prueba de cualquier
hipótesis estadística, donde la alternativa es bilateral como se denomina prueba de dos colas.  La
región crítica se divide en dos partes, que a menudo tienen probabilidades iguales que se colocan
en cada cola de la distribución del estadístico de prueba.  La hipótesis alternativa θ ≠ θ0 establece
que ya sea θ < θ0 o que θ > θ0. 17 1 0 0 0 : : θ θ θ θ ≠ = H H UCR-ECCI CI-1352 Probabilidad y
Estadística Pruebas de Hipótesis de Una y Dos Muestras Pruebas de Una y Dos Colas (cont.) 
Ejemplo. Un fabricante de cierta marca de cereal de arroz afirma que el contenido promedio de
grasa saturada no excede de 1.5 gramos. Establezca las hipótesis nula y alternativa a utilizar para
probar esta afirmación y determinar dónde se localiza la región crítica.  Solución. La afirmación
del fabricante se debe rechazar sólo si μ es mayor que 1.5mg y no se debe rechazar si es menor o
igual que 1.5mg. La prueba es de una sola cola, el símbolo mayor indica que la región crítica yace
en la cola derecha de la distribución de nuestro estadístico de prueba . 18 : 1.5 : 1.5 1 0 > = µ µ H X
H UCR-ECCI CI-1352 Probabilidad y Estadística Pruebas de Hipótesis de Una y Dos Muestras
Pruebas de Una y Dos Colas (cont.)  Ejemplo. Un fabricante de cierta marca de cereal de arroz
afirma que el contenido promedio de grasa saturada no excede ni disminuye de 1.5 gramos.
Establezca las hipótesis nula y alternativa a utilizar para probar esta afirmación y determinar
dónde se localiza la región crítica.  Solución. La afirmación del fabricante se debe rechazar sólo si
μ es mayor o menor que 1.5mg y no se debe rechazar si es igual que 1.5mg. La prueba es de dos
colas, con la región crítica dividida por igual en ambas colas de la distribución de nuestro
estadístico de prueba . 19 : 1.5 : 1.5 1 0 ≠ = µ µ H X H UCR-ECCI CI-1352 Probabilidad y Estadística
Pruebas de Hipótesis de Una y Dos Muestras Uso de ValPruebas de Una y Dos Colas  Una prueba
de cualquier hipótesis estadística, donde la alternativa es unilateral como se denomina prueba de
una sola cola.  Por lo general, la región crítica para la hipótesis alternativa θ > θ0 yace en la cola
derecha de la distribución del estadístico de prueba; en tanto que la región crítica para la hipótesis
alternativa θ < θ0 yace en la cola izquierda. 16 1 0 0 0 1 0 0 0 : : o : : θ θ θ θ θ θ θ θ < = > = H H H H
UCR-ECCI CI-1352 Probabilidad y Estadística Pruebas de Hipótesis de Una y Dos Muestras Pruebas
de Una y Dos Colas (cont.)  Una prueba de cualquier hipótesis estadística, donde la alternativa es
bilateral como se denomina prueba de dos colas.  La región crítica se divide en dos partes, que a
menudo tienen probabilidades iguales que se colocan en cada cola de la distribución del
estadístico de prueba.  La hipótesis alternativa θ ≠ θ0 establece que ya sea θ < θ0 o que θ > θ0.
17 1 0 0 0 : : θ θ θ θ ≠ = H H UCR-ECCI CI-1352 Probabilidad y Estadística Pruebas de Hipótesis de
Una y Dos Muestras Pruebas de Una y Dos Colas (cont.)  Ejemplo. Un fabricante de cierta marca
de cereal de arroz afirma que el contenido promedio de grasa saturada no excede de 1.5 gramos.
Establezca las hipótesis nula y alternativa a utilizar para probar esta afirmación y determinar
dónde se localiza la región crítica.  Solución. La afirmación del fabricante se debe rechazar sólo si
μ es mayor que 1.5mg y no se debe rechazar si es menor o igual que 1.5mg. La prueba es de una
sola cola, el símbolo mayor indica que la región crítica yace en la cola derecha de la distribución de
nuestro estadístico de prueba . 18 : 1.5 : 1.5 1 0 > = µ µ H X H UCR-ECCI CI-1352 Probabilidad y
Estadística Pruebas de Hipótesis de Una y Dos Muestras Pruebas de Una y Dos Colas (cont.) 
Ejemplo. Un fabricante de cierta marca de cereal de arroz afirma que el contenido promedio de
grasa saturada no excede ni disminuye de 1.5 gramos. Establezca las hipótesis nula y alternativa a
utilizar para probar esta afirmación y determinar dónde se localiza la región crítica.  Solución. La
afirmación del fabricante se debe rechazar sólo si μ es mayor o menor que 1.5mg y no se debe
rechazar si es igual que 1.5mg. La prueba es de dos colas, con la región crítica dividida por igual en
ambas colas de la distribución de nuestro estadístico de prueba . 19 : 1.5 : 1.5 1 0 ≠ = µ µ H X H
UCR-ECCI CI-1352 Probabilidad y Estadística Pruebas de Hipótesis de Una y Dos Muestras Uso de
Val

Pruebas de hipótesis para proporciones

Las pruebas de proporciones son adecuadas cuando los datos que se están analizando constan


de cuentas o frecuencias de elementos de dos o más clases. El objetivo de estas pruebas es
evaluar las afirmaciones con respecto a una proporción (o Porcentaje) de población. Las
pruebas se basan en la premisa de que una proporción muestral (es decir, x ocurrencias en n
observaciones, o x/n) será igual a la proporción verdadera de la población si se toman
márgenes o tolerancias para la variabilidad muestral. Las pruebas suelen enfocarse en la
diferencia entre un número esperado de ocurrencias, suponiendo que una afirmación es
verdadera, y el número observado realmente. La diferencia se compara con la variabilidad
prescrita mediante una distribución de muestreo que tiene como base el supuesto de que   
es realmente verdadera.
En muchos aspectos, las pruebas de proporciones se parecen a las pruebas de medias, excepto
que, en el caso de las primeras, los datos muestrales se consideran como cuentas en lugar de
como mediciones. Por ejemplo, las pruebas para medias y proporciones se pueden utilizar para
evaluar afirmaciones con respecto a:
1) Un parámetro de población único (prueba de una muestra)
2) La igualdad de parámetros de dos poblaciones (prueba de dos muestras), y
3) La igualdad de parámetros de más de dos poblaciones (prueba de k muestras). Además, para
tamaños grandes de muestras, la distribución de muestreo adecuada para pruebas de
proporciones de una y dos muestras es aproximadamente normal, justo como sucede en el caso
de pruebas de medias de una y dos muestras.

Prueba de proporciones de una muestra


Cuando el objetivo del muestreo es evaluar la validez de una afirmación con respecto a la
proporción de una población, es adecuado utilizar una prueba de una muestra.
La metodología de prueba depende de si el número de observaciones de la muestra es grande o
pequeño.
Como se habrá observado anteriormente, las pruebas de grandes muestras de medias y
proporciones son bastante semejantes. De este modo, los valores estadísticos de prueba miden
la desviación de un valor estadístico de muestra a partir de un valor propuesto. Y ambas
pruebas se basan en la distribución normal estándar para valores críticos. Quizá la única
diferencia real entre las ambas radica en la forma corno se obtiene la desviación estándar de la
distribución de muestreo.
Esta prueba comprende el cálculo del valor estadístico de prueba Z
Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una tabla
normal a un nivel de significación seleccionado.
Como ocurrió con la prueba de medias de una muestra, las pruebas de proporciones pueden ser
de una o dos colas.

La primera alternativa establece una prueba de cola derecha, la segunda, izquierda y la tercera,
una prueba de dos colas.
Ejemplo ilustrativo
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe esta
aseveración, a un nivel de significación de 0,025, respecto a la alternativa de que la proporción
real de los estudiantes universitarios trabajan es mayor de lo que se afirma, si una muestra
aleatoria de 600 estudiantes universitarios revela que 200 de ellos trabajan. La muestra fue
tomada de 10000 estudiantes.
Los datos son:

Como en los datos aparece el tamaño de la población, se debe verificar si el tamaño de la


nuestra es mayor que el 5%. Se remplaza valores en la siguiente fórmula:

Los cálculos en Excel se muestran en la siguiente figura:


El gráfico elaborado en Winstats y Paint se muestra a continuación:

Decisión:

Prueba de proporciones de dos muestras


El objetivo de una prueba de dos muestras es determinar si las dos muestras independientes
fueron tomadas de dos poblaciones, las cuales presentan la misma proporción de elementos
con determinada característica. La prueba se concentra en la diferencia relativa (diferencia
dividida entre la desviación estándar de la distribución de muestreo) entre las dos proporciones
muestrales. Diferencias pequeñas denotan únicamente la variación casual producto del
muestreo (se acepta H0), en tanto que grandes diferencias significan lo contrario (se rechaza
H0). El valor estadístico de prueba (diferencia relativa) es comparado con un valor tabular de
la distribución normal, a fin de decidir si H0 es aceptada o rechazada. Una vez más, esta
prueba se asemeja considerablemente a la prueba de medias de dos muestras.
La hipótesis nula en una prueba de dos muestras es

Ejemplo ilustrativo
Se ponen a prueba la enseñanza de la Estadística empleando Excel y Winstats. Para determinar
si los estudiantes difieren en términos de estar a favor de la nueva enseñanza se toma una
muestra de 20 estudiantes de dos paralelos. De paralelo A 18 están a favor, en tanto que del
paralelo B están a favor 14. ¿Es posible concluir con un nivel de significación de 0,05 que los
estudiantes que están a favor de la nueva enseñanza de la Estadística es la misma en los dos
paralelos?.
Los datos son:
Las hipótesis son

Calculando la proporción muestral se obtiene:


Los cálculos en Excel se muestran en la siguiente figura:

El gráfico elaborado en Winstats y Paint se muestra a continuación:

Decisión:
Prueba de proporciones de k muestras
La finalidad de una prueba de k muestras es evaluar la aseveración que establece que todas las
k muestras independientes provienen de poblaciones que presentan la misma proporción de
algún elemento. De acuerdo con esto, las hipótesis nula y alternativa son

En una muestra se puede dar un conjunto de sucesos, los cuales ocurren con frecuencias
observadas "o"(las que se observa directamente) y frecuencias esperadas o teóricas "e" (las que
se calculan de acuerdo a las leyes de probabilidad).

Por lo tanto el valor estadístico de prueba para este caso es la prueba ji cuadrado o conocida
también como chi cuadrado
Como sucede con las distribuciones t y F, la distribución ji cuadrado tiene una forma que
depende del número de grados de libertad asociados a un determinado problema.
Para obtener un valor crítico (valor que deja un determinado porcentaje de área en la cola) a
partir de una tabla de ji cuadrado, se debe seleccionar un nivel de significación y determinar los
grados de libertad para el problema que se esté resolviendo.

Ejemplos ilustrativos:

Determine el número de grados de libertad y obtenga el valores crítico en el niveles 0,05 se


significación.
Solución:
Los grados de libertad se calculan aplicando la fórmula:
Los cálculos en Excel se muestran en la siguiente figura:
2) La siguiente tabla muestra las frecuencias observadas y las frecuencias esperadas al lanzar
un dado 60 veces. Contrastar la hipótesis de que el dado es bueno, con un nivel de significación
de 0,01.

Cara del dado 1 2 3 4 5 6

Frecuencia observada 6 8 9 15 14 8

Frecuencia esperada 10 10 10 10 10 10

Solución:

Los cálculos en Excel se muestran en la siguiente figura:


El gráfico elaborado en Winstats y Paint se muestra a continuación:

Decisión:
Ejercicios Prueba de hipótesis
para proporciones
Ejercicios: Prueba de hipótesis para proporciones
EJERCICIO 1 

El expendio Pollos Deliciosos asegura que 90% de sus órdenes se entregan en menos de 10
minutos. En una muestra de 100 órdenes, 82 se entregaron dentro de ese lapso. Puede
concluirse en el nivel de significancia 0,01, que menos de 90% de las órdenes se entregan en
menos de 10 minutos?

 
 

EJERCICIO  2

Un artículo reciente, publicado en el diario USA today, indica que solo a uno de cada tres
egresados de una universidad les espera un puesto de trabajo. En una investigación a 200
egresados recientes de su universidad, se encontró que 80 tenían un puesto de trabajo.
Puede concluirse en el nivel de significancia 0,02, que en su universidad la proporción de
estudiantes que tienen trabajo es mayor?
   

 
 

EJERCICIO 3 

A una muestra a nivel nacional (en Estados Unidos) de ciudadanos influyentes de los partidos
republicano y demócrat, se les preguntó entre otras cosas, si estaban de acuerdo con
ladisminución de los estándares ambientales para permitir el uso del carbón con alto
contenido de azufre como combustible. Los resultados fueron:

                                       Republicanos                 Demócratas 

Cantidad muestreada              1000  800

Cantidad a favor                       200   168

Al nivel de significancia 0,02, puede decirse que hay una proporción mayor de Demócratas a
favor de reducir los estándares?
 

 
 

 
 

   

También podría gustarte