Estadistica Inferencial
Estadistica Inferencial
Estadistica Inferencial
Autor
Profesional en Matemáticas y Estadística
Todos los derechos reservados. Ninguna parte de esta publicación puede ser reproducida,
almacenada en sistema alguno de tarjetas perforadas o trasmitida por otro medio – electrónico,
mecánico, fotocopiador, registrador, etcétera sin permiso previo por escrito del autor.
All rights reserved. No part of this publication may be reproduced, stored in a retrieval system, or
transmitted in any form by any means, electronic, mechanical, photocopying, recording or
otherwise, without the prior writing permission from author.
TABLA DE CONTENIDO
PROBABILIDADES........................................................................................................................... 5
ESPACIO MUESTRAL .................................................................................................................. 5
EVENTO O SUCESO MUESTRAL ................................................................................................. 5
PROBABILIDAD CLÁSICA ............................................................................................................ 6
AXIOMAS ELEMENTALES DE LA PROBABILIDAD........................................................................ 6
PROBABILIDAD CONDICIONAL .................................................................................................. 7
TEOREMA DE LA PROBABILIDAD TOTAL ................................................................................... 8
TEOREMA DE BAYES .................................................................................................................. 8
INDEPENDENCIA DE EVENTOS .................................................................................................. 9
GUÍA DE TRABAJO N°1 ................................................................................................................ 10
DISTRIBUCIÓN DE PROBABILIDAD ............................................................................................... 12
VALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA ............................................. 13
DISTRIBUCIONES DISCRETAS ....................................................................................................... 16
Distribución Binomial .............................................................................................................. 16
Distribución Hipergeométrica ................................................................................................. 17
Distribución de Poisson ........................................................................................................... 18
GUÍA DE TRABAJO Nº2 ................................................................................................................ 19
DISTRIBUCIÓN CONTINUA........................................................................................................... 21
DISTRIBUCIÓN NORMAL.......................................................................................................... 21
APLICACIONES DE LA DISTRIBUCIÓN NORMAL ....................................................................... 24
GUÍA DE TRABAJO Nº3 ................................................................................................................ 27
MUESTREO .................................................................................................................................. 28
Técnicas de muestreo estadístico ............................................................................... 28
Muestreo probabilístico .......................................................................................................... 28
Muestreo aleatorio simple (MAS): .......................................................................................... 28
Muestreo sistemático: ............................................................................................................ 29
Muestreo estratificado:........................................................................................................... 29
Muestreo por estadios múltiples: ........................................................................................... 30
Muestreo por conglomerados: ............................................................................................... 30
Homogeneidad de las poblaciones o sus subgrupos: ............................................................. 30
Muestreo no probabilístico ..................................................................................................... 31
La probabilidad nos permite estudiar o analizar los fenómenos o procesos llamados aleatorios,
es decir, es el cálculo matemático de las posibilidades que existen de que un evento se cumpla
o suceda al azar.
ESPACIO MUESTRAL
Sea A el evento de que salga un número par, B de que salga un número menor o igual que cuatro
y C de que salga un número primo.
A={
B={
C={
Encuentre:
𝐴∪𝐵 = {
𝐵∩𝐶 ={
𝐴𝑐 = {
Estadística Inferencial Página 5
Se da el nombre de probabilidad clásica cuando ésta se toma objetivamente (en sentido práctico)
y se puede considerar de dos maneras: a priori y a posteriori.
Sea S un espacio muestral finito y A un evento del espacio muestral, entonces la probabilidad de
A se denota P(A) y se define:
Ejemplo 3. Se lanza un dado dos veces; halle la probabilidad de los eventos siguientes: A la
suma de los puntos es siete y B la suma de los puntos es menor o igual a cinco.
S={
A={
B={
P(A) =
P(B) =
Las reglas generales de probabilidad las podemos dividir en dos grupos. Un primer grupo
formado por las reglas que podríamos llamar primarias o básicas, llamadas axiomas. Estas reglas
no se aprecian directamente en la solución de problemas, pero son las que dan un soporte lógico
a las que se utilizan directamente en la solución de tales problemas y que se llaman teoremas.
Establecemos en primera instancia los axiomas.
Axioma 1. Si A es un evento del espacio muestral S, entonces P(A) representa un número entre
0 y 1 incluidos. Esto es,
0 ≤ 𝑃(𝐴) ≤ 1.
𝑃(𝑆) = 1.
A partir de los tres axiomas anteriores se deducen los teoremas que constituyen reglas para
calcular probabilidades de situaciones más o menos complejas.
𝑃(∅) = 0.
𝑃(𝐴𝑐 ) = 1 − 𝑃(𝐴).
Ejemplo 4. Suponga que en una urna hay cuatro bolas blancas y seis rojas. De la urna se extrae
al azar una bola y sea A: la bola extraída es roja. Hallar la probabilidad de que la bola extraída
no sea roja.
𝑃(𝐴𝑐 ) =
A={
B={
𝑃(𝐴 ∪ 𝐵) =
PROBABILIDAD CONDICIONAL
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴/𝐵) = , 𝑃(𝐵) > 0
𝑃(𝐵)
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐵/𝐴) = , 𝑃(𝐴) > 0
𝑃(𝐴)
Ejemplo 6. La oficina de Acción Social lleva a cabo un censo de todas las personas que viven
en una pequeña comunidad. Los encuestadores anotan en una relación el número de visitas que
una persona hace al centro de salud y las condiciones sanitarias de la vivienda que habita. Los
resultados son los siguientes:
Tabla 1. Número de visitas que una persona hace al centro de salud y las condiciones sanitarias
de la vivienda que habita.
Condiciones sanitarias
Número de visitas Total
Buenas Malas
Dos o menos 700 100 800
Más de dos 800 400 1200
Total 1 500 500 2 000
Con base en esta tabla, ¿cuál es la probabilidad de que una persona escogida al azar viva en
malas condiciones sanitarias, dado que visita dos veces o menos el centro de salud?
Estadística Inferencial Página 7
Este teorema o regla de probabilidad total nos indica cómo calcular la probabilidad de un
evento A cuando conocemos las probabilidades condicionales 𝑃[𝐴⁄𝐵𝑖 ] en donde los 𝐵𝑖 forman
una partición del espacio muestral S.
𝑃[𝐵1 ] = 0.2, 𝑃[𝐵2 ] = 0.3 y 𝑃[𝐵3 ] = 0.5. Además, 𝑃[𝐴⁄𝐵1 ] = 0.02, 𝑃[𝐴⁄𝐵2 ] = 0.03 y 𝑃[𝐴⁄𝐵3 ] =
0.05.
Hay una probabilidad del 3.8% de que el artículo escogido sea defectuoso.
TEOREMA DE BAYES
El teorema o regla de Bayes es una técnica que nos permite obtener la probabilidad
condicional de un evento cuando mediante el efecto tratamos de determinar la probabilidad de
la causa. Este resultado ha sido muy utilizado para estudiar fenómenos sociales; sin embargo,
por el empleo de probabilidades subjetivas ha sido muy cuestionado su uso.
El teorema de Bayes trata de responder los interrogantes tales como: si el evento B ocurrió,
¿cuál es la probabilidad de que haya sido generado por el evento 𝐴1 ?,¿Cual por 𝐴2 ?, etc.
Sea {𝐵𝑖 }𝑛𝑖=1 es una partición de un espacio muestral S con 𝑃[𝐵𝑖 ] > 0 y A un evento de S.
Entonces,
𝑃[𝐴⁄𝐵𝑘 ]𝑃[𝐵𝑘 ]
𝑃[𝐵𝑘 ⁄𝐴] =
𝑃[𝐴⁄𝐵1 ]𝑃[𝐵1 ] + 𝑃[𝐴⁄𝐵2 ]𝑃[𝐵2 ] + ⋯ + 𝑃[𝐴⁄𝐵𝑛 ]𝑃[𝐵𝑛 ]
Ejemplo 8. A partir del problema de la fábrica de tornillos (ejemplo 7), halle la probabilidad de
que el tornillo provenga de la máquina C, dado que es defectuoso.
𝑃[𝐴⁄𝐵3 ]𝑃[𝐵3 ]
𝑃[𝐵3 ⁄𝐴] =
𝑃[𝐴⁄𝐵1 ]𝑃[𝐵1 ] + 𝑃[𝐴⁄𝐵2 ]𝑃[𝐵2 ] + 𝑃[𝐴⁄𝐵3 ]𝑃[𝐵3 ]
(0.05)(0.5) 0.025
𝑃[𝐵3 ⁄𝐴] = = = 0.66
(0.02)(0.2) + (0.03)(0.3) + (0.05)(0.5) 0.038
Hay una probabilidad del 66% de que el tornillo defectuoso provenga de la máquina C.
INDEPENDENCIA DE EVENTOS
𝑃(𝐴)𝑃(𝐵) = 𝑃(𝐴 ∩ 𝐵)
Ejemplo 9. Suponga que se lanza una moneda dos veces. Sean los eventos, A el primer
resultado es “cara” y B el segundo resultado es “sello”. Son mutuamente independientes los
eventos.
𝑃(𝐴) =
𝑃(𝐵) =
𝑃(𝐴 ∩ 𝐵)=
𝑃(𝐴)𝑃(𝐵) = 𝑃(𝐴 ∩ 𝐵)
2. Se lanza una moneda cuatro veces. Encuentre todos los sucesos elementales del espacio
muestral.
3. Supongamos que lanzamos una moneda y un dado, y que el espacio muestral S consta de
doce elementos:
S = C1, C2, C3, C4, C5, C6, S1, S2, S3, S4, S5, S6}
Sexo Total
Cargo
Hombres Mujeres
Operarios 80 113 193
Administrativos 30 17 47
Directivos 4 6 10
Total 114 136 250
Recursos humanos de la empresa desea otorgar un premio como estímulo especial y para
ello decide seleccionar al alzar uno de los trabajadores. Calcular: (a) la probabilidad de que
la persona sea administrativo dado que es mujer y (b) la probabilidad de que la persona sea
hombre dado que es directivo.
10. Sean A y B eventos independientes con P(A) = 0.3 y P(B) = 0.4. Encuentre:
a. P(A∩B) y P(AUB).
b. P(A/B) y P(B/A).
11. En la sala de pediatría de un hospital, el 60% de los pacientes son niñas. De los niños el 35%
son menores de 24 meses. El 20% de las niñas tienen menos de 24 meses. Un pediatra que
ingresa a la sala selecciona un infante al azar.
a. Determine el valor de la probabilidad de que sea menor de 24 meses.
b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea una niña.
12. Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se
realizan correcciones faciales, un 35% implantes mamarios y el restante en otras cirugías
correctivas. Se sabe además, que son de género masculino el 25% de los que se realizan
correcciones faciales, 15% implantes mamarios y 40% otras cirugías correctivas. Si se
selecciona un paciente al azar, determine:
a. Determine la probabilidad de que sea de género masculino
b. Si resulta que es de género masculino, determine la probabilidad que se haya realizado
una cirugía de implantes mamarios.
Los experimentos aleatorios originan resultados y los resultados nos permiten tomar decisiones.
Un mismo experimento aleatorio se puede llevar a cabo para tomar distintas decisiones. Sin
embargo, a pesar de que el propósito sea distinto cuando se lleva a cabo un experimento
aleatorio, éste no cambia su comportamiento por el simple hecho de que los propósitos cambien.
Lo anterior nos está indicando que una cosa son los distintos resultados de un experimento y
otra los propósitos que perseguimos cuando lo realizamos. El medio por el cual expresamos
nuestro aspecto de interés al llevar a cabo un experimento aleatorio es el de variable aleatoria.
Variable Aleatoria
Una variable aleatoria es aquella que asume valores de acuerdo con los resultados de un
experimento aleatorio. Las variables aleatorias generalmente son designadas por las letras X, Y,
Z.
Ejemplo 1. Se lanza una moneda tres veces. Sabemos que el espacio muestral correspondiente
a este experimento aleatorio está dado por:
Si de los resultados del lanzamiento de la moneda nos interesa el número de “caras” que se
obtienen en cada lanzamiento, entonces definimos la variable X= número de caras en los tres
lanzamientos. Los valores posibles de esta variable son:
X 0 1 2 3
1 3 3 1
P[X = x]
8 8 8 8
Ejemplo 2. Consideremos el lanzamiento de dos dados una vez. Sea X= suma de puntos de las
dos caras. Hallar la distribución de probabilidad de esta variable aleatoria.
P[X = x]
Una vez que se haya definido la variable, hallar las siguientes probabilidades:
Valor esperado
Sea X una variable aleatoria discreta que asume los valores x 1, x2, x3, …, xn, con probabilidades
respectivas P[X = x1], P[X = x2], P[X = x3], …,P[X = xn] el valor esperado de X se denota y define
de la manera siguiente:
= ∑ 𝑥𝑖 P[X = 𝑥𝑖 ]
𝑖=1
X 1 2 3 4 5 6
1 1 1 1 1 1
P[X = x]
6 6 6 6 6 6
1 1 1 1 1 1 7
𝜇𝑥 = 𝐸[𝑋] = 1 ( ) + 2 ( ) + 3 ( ) + 4 ( ) + 5 ( ) + 6 ( ) = = 3.5
6 6 6 6 6 6 2
¿Cómo interpretar este resultado? Si dijéramos que es el puntaje que usted debe esperar que le
dé cuando lanza el dado muchas veces, con justa razón podría decir que eso es imposible,
puesto que podrán verse en el dado tres o cuatro puntos, pero jamás 3.5 puntos. Estamos de
acuerdo con usted, pero le proponemos que no cuente los puntos de cada lanzamiento sino que
sume el puntaje de los dos lanzamientos y los promedie, puede hallar la lógica al valor de 3.5.
Además se convencerá que lo dicho a cerca de 3.5 es cierto. A pesar de que esta interpretación
que le hemos dado al valor de 3.5 es acertada, en la práctica el valor esperado se interpreta de
una manera un poco distinta, que en el ejemplo presente es: “si lanzamos el dado un número
grande de veces y tomamos la media aritmética de la suma de los distintos puntajes que se van
obteniendo entonces, la media tiende a 3.5”. Igual interpretación seria para cualquier otra
situación.
$1, 𝑠𝑖𝑠𝑎𝑙𝑒𝑐𝑎𝑟𝑎
𝑋={
−$1, 𝑠𝑖𝑠𝑎𝑙𝑒𝑠𝑒𝑙𝑙𝑜
Estadística Inferencial Página 13
X -$1 $1
Así que el valor esperado de X (ganancia esperada del jugador) está dado por E[X] = (-1)(0.5) +
(1)(0.5) = 0, lo que quiere decir que si estas personas juegan un gran número de veces, a la larga
no hay ganancias, es decir, no hay ganador ni perdedor.
Pero si ahora vamos a suponer que la moneda está diseñada de tal forma que la posibilidad de
obtener “cara” es de 2/3 y la de obtener “sello” es de 1/3. En este caso la distribución de X sería:
X -$1 $1
1 2
P[X = x]
3 3
1 2 1
Y la ganancia esperada (por jugada) para a sería E[X] = (−1) ( ) + (1) ( ) = , lo que quiere
3 3 3
decir que si juegan unas 3000 veces, se espera que A gane $1000.
(5) 𝐸[𝑋 2 ] = 𝑥12 P[X = 𝑥1 ] + 𝑥22 P[X = 𝑥2 ] + 𝑥32 P[X = 𝑥3 ] + ⋯ + 𝑥𝑛2 P[X = 𝑥𝑛 ]
X 0 1 2 3
1 1 1 1
P[X = x]
8 4 2 8
Calcule:
(a) E[X – 1]
(b) E[X2]
(c) E[3X]
(d) E[(X + 2)2]
Varianza y Desviación estándar
La varianza es una medida del grado de concentración de los valores de la variable aleatoria
alrededor de su media 𝜇𝑥 , mientras más dispersos estén los valores respecto de la media, mayor
será la varianza. La cual se denota y define de la manera siguiente:
Sea X una variable aleatoria que asume valores x 1, x2, x3, …, xn, con probabilidades respectivas
P[X = x1], P[X = x2], P[X = x3], …,P[X = xn], la varianza de X se denota y define
= ∑(𝑥𝑖 − 𝜇𝑥 )2 𝑃[𝑋 = 𝑥𝑖 ]
𝑖=1
Ejemplo 6. Vamos a calcular la varianza para la variable X que corresponde al número de puntos
de la cara superior del dado (Ver ejemplo 3).
1 1 1 1 1
𝜎𝑥2 = 𝑉[𝑋] = (1 − 3.5)2 ( ) + (2 − 3.5)2 ( ) + (3 − 3.5)2 ( ) + (4 − 3.5)2 ( ) + (5 − 3.5)2 ( )
6 6 6 6 6
2
1 35
+ (6 − 3.5) ( ) =
6 12
La desviación estándares
35
𝜎𝑥 = √ = 1.7
12
Propiedades de la varianza
X 0 1 2 3
1 1 1 1
P[X = x]
8 4 2 8
Calcule:
(a) V[X]
(b) V[X+1]
(c) V[5X]
Los valores que puede asumir la variable aleatoria en una distribución discreta es X = números
enteros.
Distribución Binomial
Un ensayo de Bernoulli es un experimento aleatorio que sólo puede concluir de dos maneras
distintas mutuamente excluyentes e independientes. Uno de los resultados se llama éxito y el
otro fracaso. Los ensayos de Bernoulli dan origen a una variable aleatoria y toma sólo dos
valores, y cuyos valores de probabilidad (distribución) están dados por la siguiente fórmula:
𝑝, 𝑦 = 1
𝑃[𝑌 = 𝑦] = { 𝑞, 𝑦 = 0
0, 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
De las definiciones de valor esperado y de varianza dadas anteriormente, se tiene que para una
variable con distribución de Bernoulli, su valor esperado es
𝜇𝑌 = 𝐸[𝑌] = 𝑝
(1) En cada ensayo, el éxito tiene una probabilidad p y el fracaso una probabilidad q = 1 – p de
ocurrir.
(3) Los ensayos son independientes, es decir, el resultado de cualquier ensayo particular no es
afectado por el resultado de cualquier otro ensayo.
Suponga que se lleva a cabo un proceso de Bernoulli y sea la variable X = número de éxitos en
n ensayos de Bernoulli, tiene valores de probabilidad (distribución), como se indica en la siguiente
fórmula:
𝑛
( ) 𝑝 𝑥 𝑞 𝑛−𝑥 , 𝑥 = 0,1,2, … , 𝑛
𝑃[𝑋 = 𝑥] = { 𝑥
0, 𝑝𝑎𝑟𝑎 𝑐𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
𝑛
Siendo p = probabilidad de éxito; q = probabilidad de fracaso y ( ): combinatoria.
𝑥
Combinatoria: se llama combinatoria de x elementos tomados de n elementos,
con n ≥ x, a todas las agrupaciones posibles que pueden hacerse con los x
elementos y está dada por la fórmula:
𝑛 𝑛!
( )=
𝑥 (𝑛 − 𝑥)! 𝑥!
Cuando una variable aleatoria tiene valores de probabilidad dados por la fórmula anterior, se dice
que la variable tiene distribución binomial.
Ejemplo 1. Suponga que el 10% de las partes que produce una máquina automática sea
defectuoso. Si se toma al azar una muestra de 20 partes, defina la variable que le permita
determinar las probabilidades siguientes:
Solución:
El problema que nos enfrentamos es el de precisar que se va a tomar como éxito. Para tal
propósito el éxito siempre se tomará como aquel aspecto en el cual centramos nuestra atención
“partes defectuosas”, por tanto, al definir la variable, X = número de partes defectuosas, entonces
p = 10% = 0.1 y q = 90% =0.9; con una muestra de n=20.
20
(a) 𝑃[𝑋 = 2] = ( ) (0.1)2 (0.9)20−2 = 190(0.1)2 (0.9)18 = 0.2851
2
Hay una probabilidad del 28.51% de que en una muestra de 20 partes, dos sean defectuosas.
Distribución Hipergeométrica
Para aplicar la distribución hipergeométrica, ésta debe estar formada por dos grupos de
individuos u objetos. Un primer grupo constituido por aquellos individuos que poseen la
característica objeto de estudio, y su número de elementos lo denotaremos como N1 y el otro
estará conformado por los que no poseen la característica y el número de sus elementos lo
denotamos N2.
La variable con distribución hipergeométrica debe ser de la forma: X = número de éxitos en los
n ensayos, los valores de probabilidad asociados a esta variable con distribución hipergeométrica
están dados por
𝑁1 𝑁
( )( 2 )
𝑥 𝑛−𝑥
𝑃[𝑋 = 𝑥] = 𝑁 , 𝑥 = 0,1,2, … , 𝑛 𝑠𝑖 𝑛 ≤ 𝑁2
( )
𝑛
{ 0, 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Siendo, 𝑁 = 𝑁1 + 𝑁2 .
Solución:
X = Unidades defectuosas.
N = 100, N1 = 10 y N2 =90.
10 90
( )( )
𝑃[𝑋 = 5] = 5 15 = 0.0215
100
( )
20
Hay una probabilidad del 2.15% de que al escoger 20 unidades, cinco sean defectuosas.
Distribución de Poisson
Esta distribución es aplicable a muchos procesos en los que ocurren determinados sucesos por
unidad de tiempo, espacio, área, volumen, etc.
Una variable con distribución de Poisson debe tener la estructura o responder los interrogantes
mediante el siguiente planteamiento:
X = número de veces que ocurre un suceso en la unidad de tiempo, espacio, área, volumen, etc.
Los valores de probabilidad de una variable con distribución de Poisson están dados por,
𝑒 −𝜆 𝜆𝑥
𝑃[𝑋 = 𝑥] = { 𝑥! , 𝑥 = 0,1,2, …
0, 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Ejemplo 3. Suponga que el número de llamadas que llegan a un conmutador es de 0.5 por
minuto en promedio, halle la probabilidad de que:
Solución:
𝜆 = 0.5
𝑒 −0.5 (0.5)0
(a) 𝑃[𝑋 = 0] = = 0.6065
0!
Hay una probabilidad del 60.65% de que en un minuto no lleguen llamadas al conmutador.
1. Se lanza una moneda cuatro veces. Si de los resultados del lanzamiento de la moneda nos
interesa el número de “sellos” que se obtienen en cada lanzamiento, entonces definimos la
variable X= número de “sellos” en los cuatro lanzamientos. Hallar la distribución de
probabilidad de esta variable aleatoria.
Calcule:
a. E[X]
b. V[X]
3. Suponga que cierta población, el 65% de los nacimientos registrados son niñas. Si
tomamos tres registros, defina la variable que permita calcular las probabilidades que a
continuación se piden.
a. Que tres registros corresponda a niñas.
b. Menos de dos sean niña.
4. Una caja tiene 15 baterías para radio, de las cuales cinco son defectuosas. De la caja se
escogen al azar seis baterías. Halle la probabilidad de que:
a. Cuatro sean defectuosas.
b. Ninguna sea defectuosa.
7. Una caja tiene 20 bombillos, de las cuales cinco son defectuosos. De la caja se escogen al
azar diez bombillos. Halle la probabilidad de que:
a. Tres sean defectuosos.
b. Ninguna sea defectuoso.
8. El promedio de personas que llegan a la ventanilla de un banco por minuto durante las horas
hábiles es una. Halle la probabilidad de que en un minuto:
a. No aparezcan clientes.
b. Haya tres o más clientes.
10. El número de clientes que llegan a una corporación de ahorro y vivienda los días sábados
es en promedio 40 por hora. ¿Cuál es la probabilidad de que lleguen por lo menos dos
clientes en media hora?
11. En la producción de cierto artículo, se sabe que por cada 50 producidos en 30 su terminado
es excelente. Si se toma una muestra de 20 artículos, ¿cuál es la probabilidad de que diez
sean clasificados excelentes?
Los valores que puede asumir la variable aleatoria en una distribución continua es X = números
reales.
DISTRIBUCIÓN NORMAL
Una de las distribuciones continúas y tal vez la más importante es la distribución normal, la cual
ocupa un lugar destacado en la inferencia estadística. Su gráfica, que recibe el nombre de curva
normal, es la curva en forma de campana , la cual describe de forma aproximada muchos
fenómenos que suceden en la naturaleza, tales como la estaturas de los seres humanos, el
coeficiente intelectual de las personas, la industria y la investigación. Además, los errores en las
mediciones científicas se aproximan hasta límites extremadamente pequeños gracias a la
distribución normal. A las anteriores consideraciones podemos agregar otra que nos muestra el
porqué de la importancia de la distribución normal; se refiere al aspecto de inferencia estadística
y particularmente a lo que tiene que ver con el análisis de datos, puesto que las distribuciones
de muchas estadísticas muestrales tienden a la distribución normal, conforme crece el tamaño
de muestra.
Los valores de probabilidad de eventos definidos mediante una variable aleatoria continua se
mantiene mediante valores de integrales definidas de una función llamada función de densidad
continua (área bajo la curva). Al ser la normal una variable de tipo continuo, debe tener una
función de densidad que nos permita obtener valores de probabilidad relacionados con esta
variable.
1 (𝑥−𝜇)2
−
𝐹(𝑋) = 𝑒 2𝜎2 ; 𝑥𝜖𝑅
(√2𝜋)𝜎
Cuando nos referimos a una variable aleatoria con distribución normal con media 𝜇 y varianza
𝜎 2 , lo denotamos de la siguiente manera 𝑋~𝑁(𝜇, 𝜎 2 ).
La dificultad que se encuentra al resolver las integrales de las funciones de densidad normal
hace necesaria una tabulación de las áreas de la curva normal para una referencia rápida. No
obstante sería una tarea de nunca acabar elaborar una tabla para cada valor posible de 𝜇 y de
𝜎. Afortunadamente, es posible transformar todas las observaciones de cualquier variable
aleatoria normal X en un nuevo conjunto de observaciones de una variable aleatoria normal Z,
con media cero y varianza 1. Esto puede realizarse por medio de la transformación:
𝑥−𝜇
𝑍= .
𝜎
Se ha reducido ahora el número requerido de tablas de las áreas de la curva normal a sólo una,
la Distribución Normal Estándar (Tabla I), Página 75.
A continuación se ilustra gráficamente como obtener los valores de probabilidad, según las
siguientes propiedades:
En algunos casos lo que nos interesa es calcular el valor de z t (valor de z de tabla), que satisfaga
P[Z ≤ zt] = valor de probabilidad de tabla. En este caso el proceso es a la inversa.
Para darle desarrollo a este ejemplo, primero hay que determinar la región (desigualdad) que
corresponde a la probabilidad indicada. Como no se da la región, entonces se toma como
defecto, menor o menor igual, siendo así, simbólicamente queda: P[Z ≤ zt] = 0.9732,
posteriormente, hay que determinar si el valor de z t es negativo o positivo, para ello, tengamos
en cuenta las siguientes condiciones:
Como el valor de probabilidad es mayor de 0.5, por tanto el valor de z es positivo y al buscar el
valor de probabilidad de 0.9732 en la Tabla I, tenemos que el valor de zt = 1.93.
Ejemplo 10. Suponga que 𝑋~𝑁(50, 100), encuentre la probabilidad de que asuma:
Solución:
(a) Para dar solución a la P[X < 66], es necesario realizar la transformación llamada
estandarización, con la cual se obtiene el valor de z.
66 − 50
𝑧= = 1.6
10
(d) Para expresar simbólicamente esta probabilidad y como no se da la región (desigualdad) que
se está tomando, entonces se procede a tomar por defecto la desigualdad de menor o menor
igual, como se ilustra en seguida:
𝒙−𝝁
𝒁= 𝑿 = 𝝁 + 𝒛𝝈
𝝈
X = 50 + (–0.2)(10) = 48
Ejemplo 11. Una fábrica de alimentos empaca productos cuyos pesos están normalmente
distribuidos con media de 450 gramos y desviación estándar de 20 gramos. Encuentre la
probabilidad de que un paquete escogido al azar pese entre 425 y 486 gramos.
Solución:
Para este problema tenemos que𝜇 = 450 gramos y 𝜎 = 20 gramos, por lo tanto debemos calcular
P[425 ≤ X ≤ 486].
Estandarizando, tenemos:
425−450 486−450
𝑧1 = = −1.25 , 𝑧2 = = 1.8
20 20
Hay una probabilidad del 85.85% de que un paquete escogido al azar pese entre 425 y 486
gramos.
Solución:
Para este problema tenemos que𝜇 = 3.5 y 𝜎 = 0.3, por lo tanto debemos calcular P[X < 2.0] y
P[X > 4.0], estandarizamos tenemos
2.0−3.5 4.0−3.5
𝑧1 = = −5 , 𝑧2 = = 1.67
0.3 0.3
Para las preguntas tenemos,
P[X < 2.0] = P[Z < –5] y P[X > 4.0] = P[Z > 1.67]
= 1 – P[Z ≤ 5] = 1– P[Z ≤ 1.67]
=1–1 = 1 – 0.9525
=0 = 0.0475
hay una probabilidad del 0% de que los estudiantes obtengan una nota menor de 2.0 y del 4.75%
de que obtengan una nota mayor a 4.0.
1. Dada una distribución normal, encuentre el área bajo la curva que cae:
a. A la izquierda de z = 1.52
b. A la derecha de z = − 0.9
c. Entre 1.8 y 2.7
d. A la izquierda de z = − 1.93
6. Una fábrica de harina empaqueta en sacos de tela. El saco de harina se acepta como de
distribución normal con media y desviación estándar iguales a 25 y 0.5 respectivamente. Si
se toma al azar un saco, ¿cuál es la probabilidad de que:
a. Pese cuando más 24.75?
b. Pese por lo menos 26.25?
7. Una máquina despachadora de refrescos está ajustada para servir en promedio 200 mililitros
por vaso. Si la cantidad de refrescos es normalmente distribuidas con una desviación estándar
igual a 15 mililitros.
a. ¿Qué fracción de los vasos contendrá más de 224 mililitros?
b. ¿Cuál es la probabilidad de que un vaso contenga entre 191 y 209 mililitros?
c. ¿Cuántos vasos probablemente se derramarán si se utilizan vasos de 230 mililitros en los
siguientes 1000 refrescos?
d. ¿Bajo qué valor se obtiene el 25% más pequeño de los refrescos?
8. La vida útil de cierta marca de batería para automóvil se admite con distribución normal con
media = 38 meses y desviación estándar 𝜎 = 2 meses. Si la compañía no desea reemplazar
más del 5% de las baterías vendidas, ¿qué tiempo de garantía debe ofrecer?
9. Los estudiantes de cierta escuela secundaria tiene un coeficiente intelectual promedio de 106
y varianza 256. Al suponer la distribución normal, halle la proporción de estudiantes con
coeficiente intelectual.
a. Igual o menor que 98.
b. Igual o menor que 130.
c. Igual o mayor que 127.
d. Entre 94 y 118.
En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir
de una población.
Al elegir una muestra se espera conseguir que sus propiedades sean extrapolables a
la población. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a
los que se alcanzarían si se realizase un estudio de toda la población.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio adecuado
(que consienta no solo hacer estimaciones de la población sino estimar también los márgenes
de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos. Nunca
podremos estar enteramente seguros de que el resultado sea una muestra representativa, pero
sí podemos actuar de manera que esta condición se alcance con una probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se
puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se
pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada
muestra su probabilidad de extracción, sigue la llamada distribución muestral.
Muestreo probabilístico
Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcular la
probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de
muestreo es el más aconsejable, aunque en ocasiones no es posible optar por él. En este caso
se habla de muestras probabilísticas, pues no es en rigor correcto hablar de muestras
representativas dado que, al no conocer las características de la población, no es posible tener
certeza de que tal característica se haya conseguido. Las técnicas de muestreos pueden ser:
Sin reposición de los elementos: Cada elemento extraído se descarta para la subsiguiente
extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar
la vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla
seleccionada.
Con reposición de los elementos: Las observaciones se realizan con remplazo de los
individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy
grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede
considerarse con reposición aunque, realmente, no lo sea.
Con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir una extracción
es tan pequeña que el muestreo puede considerarse con reposición.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción
de números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto. Pero
no es exacto. A continuación, se muestran algunas técnicas de muestreo probabilístico.
Es aquel en que cada elemento de una población finita pequeña, tiene la misma probabilidad de
ser seleccionado para integrar la muestra. Cada uno de los elementos de la muestra, se
selecciona aleatoriamente uno por uno.
Muestreo sin reemplazo: No se devuelve los elementos extraídos a la población hasta que no
se hallan extraídos todos los elementos que conforman la muestra.
Hay diversos procedimientos para extraer los individuos de una muestra aleatoria:
Una de ellas consiste en realizar un sorteo aleatorio con papeles o bolas enumeradas y sacar
uno a uno tantos como lo indique el tamaño de la muestra. Otra forma, es utilizar la tabla de
números aleatorios, pero solamente para poblaciones finitas, la utilización de estas tablas puede
realizarse de diferentes modos.
También se puede encontrar un intervalo constante (𝑁⁄𝑛), para escoger a cada individuo de la
muestra seleccionada; por ejemplo, en una institución educativa tienen 90 estudiantes en el
grado undécimo y se desea extraer una muestra de 30 estudiantes. En primer lugar se numeran
𝑁 90
los estudiantes del 1 al 90, luego se calcula el intervalo constante entre cada individuo = =
𝑛 30
3, se sortea un número al azar del 1 al 3, supongamos que el 2, los siguientes estudiantes se
obtienen 3 hasta llegar los 30 estudiantes de la muestra, teniendo así los estudiantes
seleccionados son: 2, 5, 8, 11,…, 89.
Muestreo sistemático:
Muestreo estratificado:
Asignación óptima: la muestra recogerá más individuos de aquellos estratos que tengan más
variabilidad. Para ello es necesario un conocimiento previo de la población.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por separado las
opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede
haber cierta homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45%
Se utiliza cuando la población se encuentra dividida de manera natural, en grupos que se supone
que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a
la característica a elegir, pueden seleccionarse sólo algunos de estos grupos
o conglomerados para la realización del estudio.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las
personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es
decir, los miembros del grupo, o sólo se les podría aplicar a algunos de ellos, seleccionados al
azar. Este método tiene la ventaja de simplificar la recogida de información muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos para integrar
la muestra, el diseño se llama muestreo bietápico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer método
funciona mejor cuanto más homogénea es la población respecto del estrato, aunque más
diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los conglomerados deben
presentar toda la variabilidad, aunque deben ser muy parecidos entre sí.
Es la técnica más difundida sobre todo en estudios de mercado y sondeos de opinión. En primer
lugar es necesario dividir la población de referencia en varios estratos definidos por algunas
variables de distribución conocida (como el género o la edad). Posteriormente se calcula el peso
proporcional de cada estrato, es decir, la parte proporcional de población que representan.
Finalmente se multiplica cada peso por el tamaño de n de la muestra para determinar la cuota
precisa en cada estrato. Se diferencia del muestreo estratificado en que una vez determinada la
cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato.
En este caso las unidades de la muestra se eligen en función de algunas de sus características
de manera racional y no casual. Una variante de esta técnica es el muestreo compensado o
equilibrado, en el que se seleccionan las unidades de tal forma que la media de la muestra para
determinadas variables se acerque a la media de la población. La cual funciona en base a
referencias o por recomendación.
El tamaño de la muestra que debemos escoger para hacer una estimación del parámetro con las
características especificadas (nivel de confianza y error de estimación) es un problema que tarde
o temprano tenemos que resolver. La determinación el tamaño de la muestra es de importancia
debido a que:
• Si se toma una muestra más grande de lo indicada para alcanzar los resultados
presupuestados, constituye un desperdicio de recursos (tiempo, dinero, etc.).
• Al tomar una muestra demasiado pequeña conduce a menudo a resultados poco confiables.
• Cuando elegimos una muestra de tamaño n sólo revisamos una fracción o parte de la
población y con base en ella tomamos decisiones que afectan a toda la población. Es evidente
que este procedimiento existe una posibilidad de que nos equivoquemos en nuestras
decisiones, pero esta posibilidad depende en gran medida del tamaño de muestra de la
población que se haya escogido y por tanto analizado.
El tamaño que debe tener la muestra cuando se estima la media o proporción depende del nivel
de confianza propuesto para el intervalo, así como el máximo error que estemos dispuestos a
admitir entre el valor estimado y el valor real del parámetro que corresponde al error de
estimación.
TAMAÑO DE MUESTRA CON VARIANZA POBLACIONAL CONOCIDA.
GUÍA DE TRABAJO N° 4
Teniendo en cuenta, que una misma población se pueden tomar muchas muestras diferentes
del mismo tamaño. El desarrollo de un ejercicio en donde se obtienen los valores muestrales de
una variable (la media muestral) de acuerdo con los datos observados y al encontrar los valores
de probabilidad para cada uno de los valores muestrales, con lo cual se llega así a lo que se
conoce como distribución muestral.
̅ es la media de una muestra aleatoria de tamaño 𝒏 que se toma de una población con media
Si 𝑿
𝝁 y varianza 𝝈𝟐 , entonces la variable:
√𝑛(𝑥̅ − 𝜇)
𝑍=
𝜎
Donde,
𝑋̅: Media muestral
𝜇: Media poblacional
𝜎: Desviación estándar poblacional
𝑛: Tamaño de muestra
𝑍
La variable 𝒁 tiende a la normal estándar a medida que 𝒏 tiende a infinito.
La importancia de este resultado radica en que nos proporciona un medio para trabajar con 𝑋̅
aun si desconocemos que distribución tiene 𝑋 (la variable objeto de estudio), de ahí su gran
utilidad práctica.
El teorema del límite central, lo podemos escribir de otra manera para su mejor interpretación.
“Si 𝑋 es una variable aleatoria de media 𝜇 y varianza 𝜎 2 , la distribución muestral de la media 𝑋̅
de una muestra aleatoria de tamaño 𝑛 es aproximadamente normal con media 𝜇 y varianza 𝜎 2 /𝑛
si n es suficientemente grande. Simbólicamente, se escribe 𝑋̅~𝑁(𝜇, 𝜎 2 ⁄𝑛).
Para el teorema del límite central, hay que tener las siguientes consideraciones:
i. Sin importar la distribución de la población las medias muestrales tienen distribución normal.
ii. La media de la media muestral coincide con la media poblacional.
iii. La varianza de las medias muestrales, está relacionada con la varianza poblacional.
iv. A mayor tamaño de muestra 𝑛, la variabilidad disminuye.
v. Si no se tiene la varianza, se puede decir que la varianza muestral es igual a la varianza
poblacional.
Ejemplo 1. Una industria está produciendo actualmente cables para la suspensión de puentes.
La característica más importante de este producto es su resistencia, el peso que puede soportar
antes de que se reviente. Por experiencias pasadas se sabe que el promedio de la resistencia
es de 6 toneladas con desviación estándar de ¾ de tonelada. Para efectos de control, se
selecciona una muestra de 9 cables y se adopta la siguiente regla de decisión:
Si la resistencia promedio está por encima de 6.5 toneladas o por debajo de 5.5 toneladas, se
suspende el proceso. Si está entre 5.5 y 6.5 se continua el proceso.
Solución:
√9(5.5−6) √9(6.5−6)
𝑧1 = 0.75
= −2 y 𝑧2 = 0.75
=2
Entonces, concluimos que hay una probabilidad del 4.56% de detener el proceso si la
media de la producción es de 6 toneladas.
√9(5.5−6.18) √9(6.5−6.18)
𝑧1 = = −2.72 y 𝑧2 = = 1.28
0.75 0.75
√9(5.5−6.4) √9(6.5−6.4)
𝑧1 = 0.75
= −3.6 y 𝑧2 = 0.75
= 0.4
𝑥̅ − 𝜇
𝑍=
𝜎 𝑁−𝑛
( 𝑛) √ 𝑁−1
√
Solución
1.60 − 1.50
𝑧= = 2.51
0.25 400−36
( )√
√36 400−1
Por lo tanto, hay una probabilidad del 0.6% de una muestra de 36 estudiantes, de que la media
sea superior a 1.60 m.
En muchos casos, se puede utilizar la distribución normal para evaluar la distribución muestral
de proporciones, siendo así:
𝑝−𝑃
𝑍=
𝑃𝑄
√
𝑛
Ejemplo 3. Se tiene que el 4% de las piezas producidas por cierta máquina son defectuosas,
¿cuál es la probabilidad de que en un grupo de 200 piezas, el 3% o más sean defectuosas.
Solución
Hay una probabilidad del 76.42% de que en un grupo de 200 piezas, el 3% o más sean
defectuosas.
𝑝−𝑃
𝑍=
𝑃𝑄 𝑁−𝑛
√ √
𝑛 𝑁−1
Solución
0.60 − 0.65
𝑧= = −1.09
(0.65)(0.35) 1200−100
√ √
100 1200−1
Hay una probabilidad del 13.79% de que no más del 60% de los estudiantes consuman bebidas
alcohólicas.
1. Suponga que el contenido de nicotina de cierta marca de cigarrillos tiene distribución normal
con media de 25 miligramos y desviación estándar de 4 miligramos. Se toma una muestra
aleatoria de 25 cigarrillos, ¿cuál es la probabilidad de que la media sea mayor o igual a 26
miligramos?
2. Un fabricante de lámparas asegura que la vida promedio de las lámparas que produce es de
1000 horas con una desviación estándar de 100 horas. Un comprador potencial decide probar
si la vida promedio es como lo garantiza el fabricante y para ello toma una muestra de 64
lámparas, ¿cuál es la probabilidad de la que la media de la vida útil de las lámparas sea menor
a 957 horas?
3. Quinientos cojines de bolas tienen un peso medio de 5.02 onzas y una desviación de 0.30
onzas. Hallar la probabilidad de que una muestra al azar de 100 cojines, elegidos entre este
grupo, tenga un peso de más de 5.10 onzas?
4. Un fabricante de desodorantes recibe cada semana lotes de 10000 válvulas para los frascos
rociadores. Para aceptar o rechazar dichos lotes, seleccionan al azar 400 válvulas de cada
lote; si el 2% o más resultan defectuosas, se rechaza el lote. En caso contrario se acepta el
lote. ¿Cuál es la probabilidad de rechazar un lote que contenga el 1% de las válvulas
defectuosas?
5. Una empresa recibe un lote grande de artículos provienen de un fabricante, el cual asegura
que el porcentaje de artículos defectuosos es del 2%. Al seleccionar una muestra aleatoria de
200 artículos, ¿cuál es la probabilidad de que el porcentaje de artículos defectuosos de la
muestra sea superior al 5%?
6. En una gran ciudad la proporción de personas que padecen de problemas pulmonares debido
a la polución es del 30%. Se escogen 100 personas al azar; halle la probabilidad de que la
proporción de los que tengan problemas pulmonares motivados por la polución sea, a) menos
del 38% y b) sea superior al 20%.
7. Un auditor toma una muestra de 49, de una población de 800 cuentas por cobrar. La
desviación estándar de la población es de $93800 y la media es de $226000. ¿Cuál es la
probabilidad de que la media de la muestra, sea menor o igual a $206000?
8. El jefe de bodega de un almacén de cadena, recibe semanalmente 15000 unidades de un
determinado artículo, que debe ser examinado para su aceptación. El tiempo disponible para
esta revisión es pequeño dado el volumen de los artículos, por lo cual se consideró necesario
la selección al azar de 300 artículos, con la recomendación de que el 5% o más de ellos no
están en buen estado, se devuelve la mercancía. ¿Cuál probabilidad de devolver las 15000
unidades, si sabemos que el 3% de los artículos se consideran en mal estado?
9. Un profesor de deportes, afirma que el promedio de peso de los que practican un determinado
deporte es de 58 kilos, con una desviación estándar de 6 kilos. Si se realiza una encuesta,
entre las preguntas se incluye el peso de 25 deportistas. ¿Cuál es la probabilidad de que el
promedio obtenido sea mayor de 60 kilos?
10.Plantee y desarrolle un ejercicio de cada uno de los casos de la distribución muestral (Los
problemas de aplicación tienen que ser de su área de conocimiento). Los ejercicios deben ser
de su autoría.
LÍMITES DE CONFIANZA
Los límites de confianza también denominada como intervalos de confianza. En ésta sección
abordaremos los intervalos de confianza para una media y la proporción; además la fijación de
los niveles de significación (confianza), que generalmente son del 95%, cuyo resultado se
considera significativo, del 99% altamente significativo y del 90% poco significativo.
Los límites de confianza para la estimación de la media aritmética, cuando se tiene la desviación
estándar de la muestra y el tamaño de la muestra mayor a 30 (>30). Llegado el caso, de que se
conozca la desviación estándar poblacional, ésta podrá utilizarse en cambio de la muestral, sin
importar el tamaño de la muestra. A continuación, daremos las fórmulas de los límites o intervalos
de confianza para población infinita y finita:
𝑠
𝜇̂ = 𝑥̅ ± 𝑍1−𝛼⁄2 , (Población infinita)
√𝑛
𝑠 𝑁−𝑛
𝜇̂ = 𝑥̅ ± 𝑍1−𝛼⁄2 √ , (Población finita)
√𝑛 𝑁−1
Solución
0.2
𝜇̂ = 3.0 ± 1.96
√25
𝜇̂ = (2.92, 3.08)
Podemos concluir que el fabricante puede dar una garantía de la resistencia del material del
calzado entre 2.92 kg/cm2 y 3.08 kg/cm2 con una confianza del 95%.
0.2 1200 − 25
𝜇̂ = 3.0 ± 1.96 √
√25 1200 − 1
𝜇̂ = (2.92, 3.08)
𝑝𝑞
𝜇̂ = 𝑝 ± 𝑍1−𝛼⁄2 √ , (Población infinita)
𝑛
𝑝𝑞 𝑁−𝑛
𝜇̂ = 𝑝 ± 𝑍1−𝛼⁄2 √ √ , (Población finita)
𝑛 𝑁−1
Solución
(0.05)(0.95)
𝜇̂ = 0.05 ± 1.96√
25
𝜇̂ = (−0.035, 0.135)
La proporción de la producción que puede ser rechazada está entre 0% y el 13.5%, con una
confianza del 95%.
1. La vida útil en millas de cierta llanta, se distribuye normalmente. Se tomó una muestra de 25
llantas y se obtuvo una vida promedio de 30000 millas y una desviación estándar de 4000
millas. Calcule e interprete un intervalo de confianza del 95% para la verdadera vida útil
promedio de estas llantas.
2. Con el propósito de estimar la proporción de estudiantes regulares que asistirán a los cursos
intersemestrales, los profesores analizaron una muestra aleatoria de 200 estudiantes, el 45%
de estos indicaron que asistirán a los cursos. Construya e interprete un intervalo de confianza
del 90% para la verdadera proporción de los que asistirán a los cursos intersemestrales.
3. Se administra un test estándar a una numerosa clase de estudiantes, la puntuación promedio
de 100 estudiantes escogidos al azar fue de 75 puntos. Suponga que las puntuaciones tienen
distribución normal con varianza de 2500 y determine un intervalo de confianza del 99% para
la verdadera puntuación promedio, interprete el intervalo hallado.
4. Una máquina produce arandelas, se toma una muestra de 9 piezas y se les mide el diámetro
interior, los resultados fueron: 0.99, 0.95, 1.01, 1.03, 0.97, 0.96, 0.97, 0.99 y 1.01 cm.
Encuentre e interprete un intervalo del 95% de confianza para el diámetro promedio.
5. Se obtiene una muestra de 16 estudiantes con un promedio de 68 y una varianza de 9 en un
examen de estadística. Suponga que las calificaciones tienen distribución normal y determine
un intervalo del 90% de confianza para las calificaciones.
6. Se selecciona una muestra de 250 fumadores de cigarrillo y se encuentra que 75 prefieren la
marca A. Encuentre e interprete un intervalo del 99% de confianza para la verdadera
proporción. Si el fabricante de estos cigarrillos asegura que el 40% de los fumadores prefieren
la marca A, ¿qué puede decirse según el intervalo hallado?
7. En un conjunto residencial habitan 300 personas, de las cuales a 90 de ellas se le aplica un
test en el que se le mide el grado de satisfacción sobre el cuidado de las zonas verdes. El
administrador del conjunto estima que el 80% de los residentes están de acuerdo con el
cuidado de las zonas verdes. Construya e interprete un intervalo de confianza del 95% para
la verdadera proporción de habitantes que están de acuerdo con el cuidado de estas zonas.
8. Una fábrica de tornillos realiza un pedido de 50000 tornillos. Se toma una muestra de 2000
tornillos y se obtuvo que la longitud promedio es de 6 cm y una desviación estándar de 0.3
cm. Determine un intervalo de confianza del 99% para el verdadero promedio de la longitud
de los tornillos.
9. Una muestra de 49 observaciones tiene una media de 30 y una desviación estándar de 3.5.
Encuentre los intervalos de confianza para el 90%, 95% y 99% para la media de la población.
10. Plantee y desarrolle un ejercicio de cada uno de los casos de los límites de confianza (Los
problemas de aplicación tienen que ser de su área de conocimiento). Los ejercicios debe ser
de su autoría.
Se denomina hipótesis nula a la hipótesis (𝑯𝟎 ) que se desea contrastar. El nombre de "nula"
significa “sin valor, efecto o consecuencia”, lo cual sugiere que (𝑯𝟎 ) debe identificarse con la
hipótesis de no cambio (a partir de la opinión actual); no diferencia, no mejora,
etc. (𝑯𝟎 ) representa la hipótesis que mantendremos a no ser que los datos indiquen su falsedad,
y puede entenderse, por tanto, en el sentido de “neutra”. La hipótesis (𝑯𝟎 ) nunca se considera
probada, aunque puede ser rechazada por los datos. La hipótesis alternativa (𝑯𝒂 ) es la que
establece que el parámetro de la población es diferente del valor del parámetro de la población
de la hipótesis nula (𝑯𝟎 ), es también lo que se podría pensar que es cierto o se espera probar
que es cierto "sospecha". Por ejemplo, la hipótesis de que dos poblaciones tienen la misma
media puede ser rechazada fácilmente cuando ambas difieren mucho, analizando muestras
suficientemente grandes de ambas poblaciones, pero no puede ser "demostrada" mediante
muestreo, puesto que siempre cabe la posibilidad de que las medias difieran en una cantidad 𝜹 lo
suficientemente pequeña para que no pueda ser detectada, aunque la muestra sea muy grande.
A partir de una muestra de la población en estudio, se extrae un estadístico (esto es, un valor
que es función de la muestra) cuya distribución de probabilidad esté relacionada con la hipótesis
en estudio y sea conocida. Se toma entonces como región de rechazo al conjunto de valores que
es más improbable bajo la hipótesis, esto es, el conjunto de valores para el que rechazaremos
la hipótesis nula si el valor del estadístico observado entra dentro de él.
La probabilidad de que se obtenga un valor del estadístico que entre en la región de rechazo aun
siendo cierta la hipótesis puede calcularse. De esta manera, se puede escoger dicha región de
tal forma que la probabilidad de cometer este error sea suficientemente pequeña.
Siguiendo con el anterior ejemplo de la moneda trucada, la muestra de la población es el conjunto
de los treinta lanzamientos a realizar, el estadístico escogido es el número total de caras
obtenidas, y la región de rechazo está constituida por los números totales de caras iguales o
superiores a 25. La probabilidad de cometer el error de admitir que la moneda está trucada a
pesar de que no lo está es igual a la probabilidad binomial de tener 25 "éxitos" o más en una
serie de 30 ensayos de Bernoulli con probabilidad de "éxito" 0,5 en cada uno, entonces: 0,0002,
pues existe la posibilidad, aunque poco probable, que la muestra nos dé más de 25 caras sin
haber sido la moneda trucada.
Procedimientos de prueba
Un procedimiento de prueba es una regla con base en datos muestrales, para determinar si se
rechaza 𝑯𝟎 .
𝑯𝟎 : 𝝁 = 𝟓 𝒗𝒔. 𝑯𝒂 : 𝝁 < 5
La escritura nos indica que existe una confrontación de afirmaciones y sólo la evidencia de los
datos nos podrá indicar hacia dónde debemos inclinarnos, lo que no requiere decir que queda
demostrada, sino que no queda validada ante la evidencia de la muestra. Esto hay que tenerlo
en cuenta porque olvidarlo o desconocerlo da origen a las muchas conclusiones erradas que se
hacen y que motivan una crítica injustificada a las conclusiones con base en la inferencia
estadística.
1. Un estadístico de prueba: una función de los datos muestrales en los cuales se basa la
decisión de rechazar 𝑯𝟎 o no rechazar 𝑯𝟎 .
2. Una región de rechazo, el conjunto de todos los valores del estadístico de prueba para los
cuales 𝑯𝟎 será rechazada.
Entonces, la hipótesis nula será rechazada si y solo si el valor observado o calculado del
estadístico de prueba se ubica en la región de rechazo.
La región de aceptación es un conjunto de valores, determinado bajo ciertas reglas, tal que si el
valor de la estadística de prueba cae dentro, la hipótesis nula 𝑯𝟎 se declara no contraria al valor
de la estadística (esto no significa que sea verdadera sino que su falsedad no ha sido probada).
La región de rechazo, también llamada región crítica, es un conjunto de valores distinto a los
anteriores; si la estadística de prueba asume un valor que esté dentro, la hipótesis nula 𝑯𝟎 se
declara contraria a la evidencia de la muestra y por lo tanto debe ser rechazada.
El valor crítico es aquel número que separa la región de aceptación de la región de rechazo.
̅ < 5, entonces 5 es un valor
Así por ejemplo, si la regla de decisión es rechazar 𝑯𝟎 : 𝝁 = 𝟓 si 𝑿
crítico.
3. 𝐻0 : 𝜇 = 𝑎 𝑣𝑠. 𝑯𝒂 : 𝝁 ≠ 𝒂.
En los casos anteriores la hipótesis nula también puede formularse como 𝐻0 : 𝜇 ≥ 𝑎, para el caso
1, y 𝐻0 : 𝜇 ≤ 𝑎 para el caso 2. Sin embargo, en los cálculos siempre se tomará 𝜇 = 𝑎.
En el mejor de los casos podrían desarrollarse procedimientos de prueba para los cuales ningún
tipo de error es posible. Pero esto puede alcanzarse solo si una decisión se basa en un examen
de toda la población, lo que casi nunca es práctico. La dificultad al usar un procedimiento basado
en datos muestrales es que debido a la variabilidad en el muestreo puede resultar una muestra
no representativa.
Un buen procedimiento es aquel para el cual la probabilidad de cometer cualquier tipo de error
es pequeña. La elección de un valor particular de corte de la región de rechazo fija las
probabilidades de errores tipo I y II. Estas probabilidades de error son representadas por α y β,
respectivamente.
Errores en el contraste
Una vez realizado el contraste de hipótesis, se habrá optado por una de las dos
hipótesis, 𝑯𝟎 o 𝑯𝒂 , y la decisión escogida coincidirá o no con la que en realidad es cierta. Se
pueden dar los cuatro casos que se exponen en el siguiente cuadro:
Decisión
Estado de naturaleza
Aceptar𝑯𝟎 Descartar 𝑯𝟎
𝑯𝟎 es cierta Acción correcta Error de tipo I
(1 − 𝛼) (𝛼)
𝑯𝟎 es falsa Error d tipo II Acción correcta
(𝛽) (1 − 𝛽)
Si la probabilidad de cometer un error de tipo I está unívocamente determinada, su valor se suele
denotar por la letra griega α, y en las mismas condiciones, se denota por β la probabilidad de
cometer el error de tipo II, esto es:
𝑃(𝑒𝑠𝑐𝑜𝑔𝑒𝑟𝐻𝑎 / 𝐻0 𝑒𝑠 𝑐𝑖𝑒𝑟𝑡𝑎) = 𝛼
Es un procedimiento estadístico que nos permite decidir si los datos muestrales son consistentes
o no con algun valor que hemos fijado para la media de una población normalmente distribuida.
Existen dos casos relacionados: cuando la varianza de la población es conocida y cuando ésta
es desconocida.
Solución:
1. Hipótesis
𝜇 = Longitud promedio de los pedazos de cable.
𝐻0 : 𝜇 ≤ 4 𝑣𝑠𝐻𝑎 : 𝜇 > 4
2. n = 18, 𝛼 = 0.05.
3. Estadística de prueba.
√𝑛(𝑥̅ − 𝜇)
𝑧𝑐 = ~ 𝑁(0, 1)
𝜎
4. Regla de decisión.
5. Cálculos.
𝑥̅ = 5.04, 𝜎 = 2.3, 𝑛 = 18
√18(5.04 − 4)
𝑧𝑐 = = 1.918
2.3
Como 𝑧𝑐 > 𝑧∝ , entonces se rechaza H0 de que la longitud promedio es menor o igual a 4 cm.
Solución:
1. Hipótesis
𝜇 = Contenido promedio de humedad de cada tonelada de trigo.
𝐻0 : 𝜇 ≤ 7.1 𝑣𝑠 𝐻𝑎 : 𝜇 > 7.1
2. n = 16, 𝛼 = 0.05.
3. Estadística de prueba.
√𝑛(𝑥̅ − 𝜇)
𝑡𝑐 = ~ 𝑡(𝑛 − 1)
𝑠
4. Regla de decisión.
5. Cálculos.
𝑥̅ = 7.213, 𝑠 = 0.253, 𝑛 = 16
√16(7.213 − 7.1)
𝑡𝑐 = = 1.786
0.253
Como𝑡𝑐 > 𝑡∝ , entonces se rechaza H0 de que el promedio de humedad de cada tonelada de trigo
es menor o igual a 7.1, ante esta evidencia el proceso de secado debe continuar.
Cuando se trata de pruebas de dos medias relacionadas con poblaciones independientes, las
hipótesis a probar son:
1. 𝐻0 : 𝜇1 = 𝜇 2 𝑣𝑠 𝐻𝑎 : 𝜇1 > 𝜇2
Equivalente a:
𝐻0 : 𝜇1 − 𝜇 2 = 0 𝑣𝑠 𝐻𝑎 : 𝜇1 − 𝜇2 > 0. Prueba de una cola a la derecha.
2. 𝐻0 : 𝜇1 = 𝜇 2 𝑣𝑠 𝐻𝑎 : 𝜇1 < 𝜇2
Equivalente a:
𝐻0 : 𝜇1 − 𝜇 2 = 0 𝑣𝑠 𝐻𝑎 : 𝜇1 − 𝜇2 < 0. Prueba de una cola a la izquierda.
3. 𝐻0 : 𝜇1 = 𝜇 2 𝑣𝑠 𝐻𝑎 : 𝜇1 ≠ 𝜇2
Equivalente a:
𝐻0 : 𝜇1 − 𝜇 2 = 0 𝑣𝑠 𝐻𝑎 : 𝜇1 − 𝜇2 ≠ 0. Prueba de dos colas.
También se tienen en cuenta dos casos, cuando las varianzas de las poblaciones son conocidas
o cuando las varianzas son desconocidas.
Si las varianzas poblacionales son conocidas, se utiliza como estadística de prueba la variable
con distribución normal estándar:
(𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 )
𝑍=
√𝜎12 ⁄𝑛1 + 𝜎22 ⁄𝑛2
Cuando las varianzas poblacionales son desconocidas pero supuestas iguales con muestras
pequeñas, se utiliza como estadística de prueba a la distribución t-student:
(𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 )
𝑇=
𝑆𝑝 √1⁄𝑛1 + 1⁄𝑛2
con (n1 + n2 – 2) grados de libertad y donde,
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22
𝑆𝑝2 =
(𝑛1 + 𝑛2 − 2)
𝑆𝑝2 se llama varianza ponderada.
Ejemplo 3. Mediciones del diámetro transversal del corazón de los adultos del sexo masculino y
femenino dieron los resultados siguientes:
Solución:
1. Hipótesis
𝜇1 =Diámetro transversal promedio de los hombres.
𝜇2 =Diámetro transversal promedio de las mujeres.
𝐻0 : 𝜇1 = 𝜇 2 𝑣𝑠𝐻𝑎 : 𝜇1 ≠ 𝜇2
3. Estadística de prueba.
4. Regla de decisión.
5. Cálculos.
6. Decisión.
Como𝑡𝑐 > 𝑡∝ , entonces se rechaza H0 de que el diámetro transversal promedio del corazón de
los hombres es igual al de las mujeres.
Esta prueba aparece cuando por ejemplo, comparamos los pesos de las personas antes y
después de un tratamiento para bajar peso. La aplicación de esta prueba requiere que las
unidades que formen la pareja tengan las mismas características, como sucede en los siguientes
casos:
✓ Los mismos individuos reciben el tratamiento antes y después.
✓ Las parejas son gemelos que reciben tratamientos distintos.
✓ Dos partes del mismo material son sometidos a tratamientos distintos.
El procedimiento estadístico para analizar el comportamiento de la variable de interés se basa
en la diferencia de las mediciones de las unidades que forman la pareja y es similar al que se
sigue para la prueba de una media al utilizar la distribución t-student, sólo que se toma como
estadística de prueba a la variable:
√𝑛(𝑥̅𝑑 − 𝜇𝑑 )
𝑇=
𝑆𝑑
Ejemplo 4. Diez personas fueron sometidas a un test antes y después de recibir cierta
instrucción. Los resultados fueron los siguientes:
Individuo 1 2 3 4 5 6 7 8 9 10
Antes 70 84 88 110 105 100 110 67 79 86
Después 115 148 176 191 158 178 179 140 161 157
¿Proporcionan estos datos evidencia suficiente para decir que la instrucción fue efectiva? Tome
𝛼 = 1%.
Solución:
1. Hipótesis
𝐻0 : 𝜇𝑑 ≤ 0 𝑣𝑠𝐻𝑎 : 𝜇𝑑 > 0
2. n = 10, 𝛼 = 0.01.
3. Estadística de prueba.
√𝑛(𝑥̅𝑑 − 𝜇𝑑 )
𝑡𝑐 = ~ 𝑡(𝑛 − 1)
𝑆𝑑
4. Regla de decisión.
5. Cálculos.
Estadística Inferencial Página 51
6. Decisión.
Como𝑡𝑐 > 𝑡∝ , entonces se rechaza H0, los datos evidencian que la instrucción fue efectiva.
1. Una fábrica de pilas garantiza que su producto tiene una vida media de 1000 horas y una
desviación estándar de 50. Pruebe la hipótesis de que 𝜇 = 1000 en contraposición de la
alterna 𝜇 ≠ 1000 horas, si una muestra aleatoria de 30 baterías tiene una duración promedio
de 950 horas. Utilice 𝛼 = 5%.
3. Los siguientes datos representan el contenido de grasa en los cuerpos de 10 hombres: 4.22,
3.99, 5.41, 4.23, 4.29, 4.62, 4.55, 4.13, 4.23, 4.48. ¿Evidencian estos datos que el contenido
promedio de grasa en los hombres es menor de 4.464? Considere 𝛼 = 5% y tome 𝜎 = 0.4.
Operario 1 Operario 2
10 12
9 16
16 16
14 15
11 14
Si supone que el número de unidades terminadas diariamente por los trabajadores son
variables aleatorias independientes distribuidas normalmente con varianzas iguales, ¿puede
concluirse alguna diferencia entre las medias? Tome 𝛼 = 5%.
5. Las siguientes son las distancias en metros que cierto animal se aleja de su morada: 194,
202, 335, 515, 184, 369, 142, 552, 200, 344, 421, 590, 301, 439. ¿Podemos concluir que la
distancia promedio en que se aleja es mayor de 338 m? Suponga 𝜎 = 140 y tome 𝛼 = 5%.
7. Se desea comparar dos métodos para enseñar estadística. Para ello se tomaron 10 pares de
estudiantes del mismo nivel de aprovechamiento en estadística. De cada par, a uno se le
asigna al azar el método A y al otro al método B. Después de un periodo de cuatro semanas,
cada estudiante se sometió a un examen, con las puntuaciones siguientes:
Par 1 2 3 4 5 6 7 8 9 10
Método A 36 37 41 42 36 35 42 33 40 38
Método B 35 35 42 41 36 34 40 31 39 37
¿Proporcionan estos datos suficiente evidencia como para indicar que los niveles medios de
aprovechamiento de los métodos son distintos? Sea 𝛼 = 5%.
8. Los siguientes datos son los tiempos que tardan dos grupos de estudiantes para resolver un
examen de estadística.
9. Los siguientes datos corresponden a los diámetros de dos muestras de arandelas producidas
por dos máquinas distintas.
Considere que los diámetros se distribuyen normalmente y que las varianzas respectivas son
𝜎12 = 0.12 𝑦𝜎22 = 0.13. ¿Evidencian estos datos que los diámetros promedios de las arandelas
producidas por las dos máquinas son iguales? Tome 𝛼 = 5%.
10. Cinco personas con exceso de peso se pusieron a dieta durante tres meses. Fueron
observados sus pesos al comienzo y al final de la dieta. Estos datos se muestran en la tabla
que sigue:
Individuo 1 2 3 4 5
Peso inicial 295 305 323 299 310
Peso final 251 259 267 265 263
¿Se puede concluir según estos datos que la dieta es efectiva? Tome 𝛼 = 10%.
12. Suponga que la varianza de los cocientes intelectuales de los estudiantes de enseñanza
secundaria media en una ciudad es de 225. Una muestra aleatoria de 25 estudiantes arroja
un coeficiente intelectual de 106. ¿Se puede concluir a partir de estos datos que el
coeficiente intelectual medio de los estudiantes es superior a 100? Tome 𝛼 = 5%.
13. Una muestra aleatoria de tamaño n1 = 25, tomada de una población normal con desviación
estándar de 𝜎1 = 4.8, tiene una media 𝑋̅1 = 75. Una segunda muestra aleatoria de tamaño
n2 = 36, tomada de una población normal diferente con desviación estándar 𝜎2 = 3.5, tiene
media 𝑋̅2 = 70. Pruebe la hipótesis de 𝜇1 = 𝜇2 , en contraposición a la alterna𝜇1 > 𝜇2 . Tome
𝛼 = 5%.
14. Se conduce una prueba sobre la potencia de fricción producida por ciertas máquinas
lubricadas con dos aceites comerciales. Los resultados fueron:
Marca 1 Marca2
𝑛1 = 9 𝑛2 = 11
𝑋̅1 = 10.4 𝑋̅2 = 14.1
𝑆12 = 1.0 𝑆22 = 0.9
Considere que se trata de poblaciones normales con igual varianza. ¿Evidencian estos
datos que las potencias promedios son iguales? Tome 𝛼 = 2%.
Las pruebas referentes a varianzas pueden ser para una o dos varianzas. Si se trata de una sola
varianza utilizamos como estadístico de prueba la variable con distribución Ji cuadrado:
(𝑛 − 1)𝑆 2
𝑋2 =
𝜎2
y con un valor de tabla (𝑋𝛼2 ):𝑋 2 (𝑘, 𝑞), en donde k = (n – 1) grados de libertad y q la medida de la
cola derecha.
Ejemplo 1. Se tomó una muestra aleatoria de tamaño n= 25 se obtuvo un valor S=150, con estos
datos. Pruebe la hipótesis 𝐻𝑜 : 𝜎 2 = 10 000 vs.𝐻𝑜 : 𝜎 2 > 10 000.
Solución
1. Hipótesis
𝐻𝑜 : 𝜎 2 = 10 000 vs. 𝐻𝑜 : 𝜎 2 > 10 000
2. n = 25
3. Estadística de prueba.
(𝑛 − 1)𝑆 2
𝑋𝑐2 =
𝜎2
4. Regla de decisión.
5. Cálculos.
(25 − 1)(150)2
𝑋𝑐2 = = 54
10000
6. Decisión.
𝑆12
𝐹=
𝑆22
Ejemplo 2. Se comparó la eficiencia de dos tipos de aceites para evitar el desgaste en ciertas
piezas sometidas a intenso trabajo. En trece piezas se utilizó el aceite 1 y en otras trece el aceite
2. Las varianzas muestrales fueron 𝑆12 = 64, 𝑆22 = 16. Pruebe la hipótesis nula según la cual las
varianzas de las dos poblaciones son iguales. Tome 𝛼 = 5%.
Solución
1. Hipótesis
𝐻0 : 𝜎12 = 𝜎22 𝑣𝑠. 𝐻𝑎 : 𝜎12 ≠ 𝜎22
3. Estadística de prueba.
𝑆12
𝐹𝑐 = 2
𝑆2
4. Regla de decisión.
1
Se rechaza H0, si 𝐹𝑐 > 𝐹𝛼 , 𝑜, 𝐹𝑐 < .
𝐹𝛼
5. Cálculos.
64
𝐹𝑐 = =4
16
6. Decisión.
Como 𝐹𝑐 > 𝐹𝛼 , entonces rechaza H0, de que las varianzas de las dos poblaciones son iguales.
2. Se sabe que el contenido de nicotina de una marca de cigarrillos tiene distribución normal con
varianza de 1.3 miligramos. Pruebe la hipótesis de que 𝜎 2 = 1.3, si una muestra aleatoria de
8 de estos cigarrillos tiene una desviación estándar 𝑆 = 1.8. use 𝛼 = 5%.
3. Se conduce una prueba sobre la potencia de fricción producida por ciertas máquinas
lubricadas con dos aceites comerciales. Los resultados fueron:
Marca 1 Marca2
𝑛1 = 9 𝑛2 = 11
𝑋̅1 = 10.4 𝑋̅2 = 14.1
𝑆12 = 1.0 𝑆22 = 0.9
¿Proporcionan estos datos suficiente evidencia que indique una diferencia en la variabilidad
de las dos poblaciones de donde se obtuvieron las muestras? Tome 𝛼 = 10%.
5. Una firma fabricante de detergentes elabora dos marcas. Si se encuentra que 56 amas de
casa de 200 consultadas prefieren la marca A; y que 29 de 150 la marca B. ¿Es esto evidencia
suficiente para sostener que la marca A es preferida a la B? Tome 𝛼 = 1%.
6. Se realizó una encuesta para determinar la diferencia que pueda existir entre las fracciones
de casados y solteros entre 20 y 30 años que fuman. Se entrevistaron 200 personas de cada
grupo y se encontraron 64 casados y 80 solteros que fuman. ¿Contienen los datos suficiente
evidencia que indique que existe una diferencia entre las dos fracciones de fumadores para
las dos poblaciones? Tome 𝛼 = 10%.
7. Dos máquinas diferentes A y B se utilizan para producir pernos idénticos que se suponen de
2 pulgadas de longitud. Se toman dos muestras aleatorias de 25 pernos cada una de la
producción de ambas máquinas Y arrojan dos varianzas𝑆12 = 0.03 pulgadas para la máquina
A, y 𝑆22 = 0.04 pulgadas para la máquina B. ¿Evidencian estos datos que las varianzas son
iguales? Tome 𝛼 = 5%.
El estudio se restringirá a la regresión simple solamente, o sea, aquella en que la ecuación que
describe la relación entre X y Y es lineal y se representa gráficamente por una recta.
Cuando se encuentra que unas variables están relacionadas entre sí, suele ser útil averiguar
cuán estrecha es la relación. El grado de relación entre éstas se denomina también correlación
entre las variables. El problema de correlación está íntimamente asociado al de la regresión y es
parte integrante del análisis de dos variables.
La recta de regresión
Cuando tratamos la estimación observamos que para llevar a cabo tal proceso, partíamos de la
propuesta de un modelo para la población, por ejemplo: distribución normal. A partir de este
modelo supuesto y mediante una estadística adecuada obteníamos estimadores o estimaciones
del parámetro en discusión.
𝑌𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜖𝑖 (1)
Estimación de 𝜶 y 𝜷
Con el fin de explicar las nociones básicas de la estimación de la recta de regresión con
utilización de los datos muestrales, consideremos el siguiente problema.
Ejemplo 1. Suponga que un profesor de estadística desea predecir la nota final que obtendrán
en el próximo curso sus estudiantes utilizando como base el puntaje de ingreso de los mismos.
Para ello, escogió al azar 10 estudiantes que iniciaron el curso; esperó luego el final de semestre
y registró la nota definitiva que obtuvo cada uno de ellos. Los resultados fueron los que se dan
en la siguiente tabla.
La variable independiente es aquella que representa la característica que parece influir sobre la
otra que se toma como respuesta, la que a su vez se constituye en la dependiente. En el caso
que nos ocupa parece ser claro que esta variable es la que corresponde al puntaje de ingreso.
Lógicamente, fijada ésta como variable independiente, la que representa las notas definitivas en
estadística corresponderá a la variable dependiente.
Una vez que hemos precisado las variables independiente y dependiente, sería deseable hacer
una representación gráfica de los datos muestrales. Esta representación se lleva a cabo en plano
cartesiano al registrar en el eje horizontal los valores de la variable independiente, la cual se
denota con la x; y en el eje vertical los valores de la variable dependiente que se denota con la
Y. Con estos valores individuales se forman las parejas ordenas (x, y) que determina un punto
en el plano cartesiano; estos puntos forman en conjunto una nube de puntos que se llama
diagrama de dispersión. La construcción de este diagrama es de mucha importancia puesto que
a partir de él podemos tener una idea visual de la posible relación entre las variables y de esta
forma poder sugerir el modelo que más se pueda ajustar a los datos.
El diagrama de dispersión para los datos de la tabla 1 se muestra en la figura 1. Indica que existe
una relación (correlación) positiva entre el puntaje de ingreso y la nota definitiva de estadística.
Sugiere además que la relación entre las dos variables es de tipo lineal (recta) en promedio, ya
que se tendría una recta al trazar una línea de ajuste por el centro de la nube de puntos al partir
de la parte inferior de la nube a la superior (figura 2)
Una vez que se tiene la evidencia o mejor, que resulta razonable considerar una relación de tipo
lineal, la tarea siguiente es estimar la verdadera relación. El método más usual para elegir una
recta de este tipo es el de mínimos cuadrados, y la resultante se llama recta de mínimos
cuadrados. Este nombre se debe a que la suma de cuadrados de las desviaciones verticales de
los puntos respecto de esta recta es menor que la suma de los cuadrados de dichas desviaciones
respecto de cualquier recta.
El procedimiento de los mínimos cuadrados para determinar la recta de regresión parte de que
cada 𝑌𝑖 es de la forma
𝑌𝑖 = 𝛼 + 𝛽𝑥𝑖 + 𝜖𝑖
El proceso matemático que se sigue es el determinar los valores de 𝛼 y 𝛽 que hacen mínimo a
(2). Estos valores los denotamos 𝛼̂ y 𝛽̂ , y se obtienen mediante métodos de optimización para
funciones de dos variables que se estudian en cursos avanzados de cálculo, razón por la cual lo
omitimos aquí. Basta saber que mediante la aplicación del mencionado método obtenemos el
sistema de ecuaciones llamado sistema de ecuaciones normales, que sigue
(3)
(4)
El numerador que aparece en (4) puede ser reconocido como la covarianza de la muestra de x
y Y, y el denominador como la varianza de la muestra de los datos x. Esto es,
(5)
(6)
(7)
Así pues, que para obtener los valores de 𝛼̂ y de 𝛽̂ es necesario conocer los de n, ∑𝑛𝑖=1 𝑥𝑖 , ∑𝑛𝑖=1 𝑌𝑖 ,
∑𝑛𝑖=1 𝑥𝑖 𝑌𝑖 , ∑𝑛𝑖=1 𝑥𝑖2 . También hay que conocer ∑𝑛𝑖=1 𝑌𝑖2 para cálculos posteriores. Una vez obtenidos
los valores de 𝛼̂ y 𝛽̂ formamos la ecuación 𝑌̂ = 𝛼̂ + 𝛽̂ 𝑥 que recibe el nombre de recta estimada o
ecuación de predicción.
En la tabla 2 aparecen los cálculos de estos términos con base en los datos de la tabla 1.
Tabla 2. Cálculo de la regresión del puntaje de ingreso (Y) respecto de la nota definitiva de
estadística (x).
460 760
De la tabla anterior podemos calcular, 𝑥̅ = = 46 y 𝑌̅ = = 76.
10 10
y en la ecuación (7),
𝛼̂ = 76 − (0.766)(46) = 40.76
𝑌̂ = 40.76 + (0.766)𝑥
La ecuación de regresión lineal basada en datos muestrales se utiliza ampliamente para fines de
predicción. Dado un valor x, se puede predecir cuál será el valor de Y asociado, en promedio.
Por ejemplo, si un estudiante ingresó con un puntaje de x=60, la nota definitiva provista en
estadística será 𝑌̂ = 40.76 + (0.766)(60) = 87(aproximadamente) lo cual es una estimación
puntual de la media condicional 𝜇𝑌⁄𝑥 .
¿Cuál buena es entonces esta estimación? O bien, ¿cuál es el grado de precisión del valor
predicho? Para responder a esta pregunta hay que considerar la estimación por intervalo que se
tratará más tarde.
Si se utiliza este criterio, las dos rectas que aparecen en la figura 4 se ajustan bien con las
observaciones, a pesar de que el ajuste en a) es intuitivamente un ajuste bueno y b) es muy
malo.
2. Hay un problema de signo; en ambos casos los errores positivos neutralizan los negativos y
hacen que la suma sea igual a cero. Este criterio debe ser rechazado porque no permite
distinguir entre los ajustes buenos y malos.
Como los errores positivos no pueden anularse entre sí con los errores negativos, este criterio
eliminaría los malos ajustes, tal como el ajuste de la figura 6b. Sin embargo, todavía tiene una
desventaja. Es claro que la figura 6 el ajuste de (b) satisface mejor el criterio de minimizar la
suma de los valores absolutos (∑|𝑌𝑖 − 𝑌̂𝑖 |) que el ajuste (a). Intuitivamente se puede ver que la
línea que une en (b) los puntos extremos satisface este criterio mejor que cualquier otra. No
obstante, no parece ser la mejor solución al problema puesto que se ignora totalmente el punto
medio. Tal vez en ese sentido es mejor el ajuste (a), porque en él se consideran los tres puntos.
Figura 6. Dos ajustes que minimizan la suma de los valores absolutos de las desviaciones.
ii) La operación de elevar al cuadrado destaca los errores grandes y cuando se trata de
satisfacer este criterio se evitan esos errores siempre que sea posible. Por consiguiente,
se toman en cuenta todos los puntos y mediante este criterio, se elige el ajuste en la figura
6ª, el cual es preferible al de la figura 6b.
iv) Existen justificaciones teóricas importantes para los mínimos cuadrados, como el criterio
de máxima verosimilitud.
Ejemplo 2. Supongamos que se tiene una población de 50 personas adultas del género
masculino. De esta muestra nos interesa estudiar la relación entre la estatura (Y), medida en
centímetros y el peso (x).
Tabla 3. Relación de las estatura y los pesos de 50 personas adultas del género masculino.
Peso (X)
60 65 70 75 80
159 164 164 189 171
160 166 164 170 173
Estaturas por persona (Y)
Supongamos que para cada valor dado de (X) escogemos aleatoriamente un valor de (Y)
mediante un muestreo aleatorio simple (MAS). Ahora organizamos estos valores en una tabla
como sigue:
𝑿 60 65 70 75 80
𝒀 162 168 169 175 171
Los valores estimados de 𝛼 y de 𝛽 por el método de mínimos cuadrados son: 𝛼̂ = 134 y 𝛽̂ = 0.5.
La ecuación de la recta de regresión estimada es 𝑌̂ = 134 + (0.5)𝑥
La verdadera ecuación de la recta de regresión es 𝑌 = 129 + 0.6𝑥
Los valores 𝑌̂ determinados por la anterior ecuación son estimaciones de 𝐸[𝑌⁄𝑋 = 𝑥0 ], es posible
comprobarse fácilmente: Para 𝑋 = 60, se tiene al reemplazar en la ecuación 𝑌̂ = 164. El valor
exacto es 𝐸[𝑌⁄𝑋 = 60] = 165, como puede verse en la tabla 3. Las demás estimaciones se
obtienen de forma similar.
2. En la tabla que sigue se dan los tiempos se dan los tiempos de retraso medidos en minutos,
en la llegada a sus puestos de trabajo y la antigüedad en años de siete empleados de una
compañía, escogidos al azar en un día cualquiera laboral.
Tiempo de retraso 7 1 10 11 9 10 6
Antigüedad 8 10 3 5 10 4 8
3. Los datos que se dan en la tabla que sigue corresponden a la cantidad de fertilizante (en
libras) y la producción de trigo (en toneladas).
4. Diez secretarías de una compañía escogida al azar fueron sometidas a una prueba que
consistió en un dictado con cierto tiempo de duración y luego contar el número de errores
cometidos al transcribirlos a un computador. Los resultados fueron los siguientes:
Tiempo dictado 7 6 5 4 5 8 7 8 9 6
Número de errores 8 7 6 6 7 10 9 9 10 8
5. Los siguientes datos corresponden a una comparación entre el rendimiento académico a final
de año y el puntaje obtenido en una prueba para medir el coeficiente intelectual de diez
estudiantes.
Promedio 3,6 3,7 3,8 4,6 4,9 4,4 4,4 4,2 3,6 3,2
C.I. 120 130 125 120 135 130 125 128 115 120
6. El jefe de personal de una empresa cree existe una relación entre la ausencia al trabajo y la
edad del empleado. Con el propósito de estudiar el problema tomó en cuenta la edad de diez
trabajadores escogidos al azar y contabilizó los días de ausencia durante el año. Los
resultados fueron como se observa en la tabla que sigue:
Edad 25 50 35 20 45 50 30 40 62 40
Ausencia 20 5 10 20 8 2 15 12 1 8
Hemos visto en casi todas las pruebas hasta ahora estudiadas permitían que se estimaran
algunos valores desconocidos de los parámetros a partir de valores calculados gracias a
muestras elegidas al azar en una población dada.
Las hipótesis se enunciaban en función del valor o valores especificados de los parámetros de
la población.
Como se presentan muchas situaciones en las que no cumplen los supuestos, se han
desarrollado recientemente numerosas pruebas estadísticas que no exigen supuestos rigurosos
acerca de la distribución de la población y que no requieren enunciar las hipótesis en términos
de valores especificados de los parámetros, son por consiguiente, pruebas que se pueden llamar
de distribución libre o no paramétricos. El término de distribución libre describe un método de
probar hipótesis o de definir un intervalo de confianza que no depende de la naturaleza de la
distribución de la población que se esté considerando; el término no paramétrico se utiliza para
indicar que no hay hipótesis enunciada en términos de valores especificados de parámetros.
No obstante, los métodos no paramétricos tienen sus ventajas por ser fáciles de aplicar. Son
relativamente sencillos, claros de exponer y de comprender en comparación con los métodos
paramétricos. De ahí que a veces se les llame métodos “abreviados” y que se les emplee a
menudo, al aumentar el tamaño de la muestra, incluso en situaciones en que se cumplen en
realidad supuestos paramétricos. En esta guía nos ocuparemos al estudio de algunos métodos
más frecuentemente empleados.
La prueba de signos deja completamente de lado la magnitud de la diferencia entre cada par de
valores. Frank Wilcoxon, en 1945, sugirió un método para mejorar la prueba de signos. Ésta
mejora, llamada prueba de rangos signados de Wilcoxon, toma en consideración la magnitud de
las diferencias. Para llevarla a cabo, el primer paso consiste en ordenar todos los valores
absolutos de las diferencias entre observaciones pareadas, del menor al mayor. El rango de la
diferencia más pequeña es entonces 1, el que sigue es 2 y así sucesivamente. Como se asigna
rangos a las diferencias independientemente del signo, por ejemplo a las diferencias -1 y +1 se
les da el mismo rango, es decir, cada diferencia le corresponde un rango y como se omite el
signo entonces ocuparía el mismo rango, entonces se promedia los rangos que le corresponde
y ese sería el rango para cada uno de ellos. Una vez ordenadas por rangos las diferencias, se
da a cada rango el signo de la diferencia. Se calculan entonces por aparte la suma de de rangos
positivos y la suma de los rangos negativos y la suma menor omitido el signo, es la estadística
de prueba que se suele designar por T.
Si la hipótesis nula según la cual las dos poblaciones tienen idéntica distribución (relativa) es
cierta, podría esperarse que las dos sumas sean aproximadamente iguales, y si las dos sumas
son muy diferentes entre y sí, habría que concluir que las dos poblaciones no son idénticas; es
decir, habría que descartar la hipótesis nula. La estadística de prueba T se puede emplear para
pruebas de una o dos colas. Para de una cola es necesario anticipar el signo de la suma de los
rangos menor, en caso de ser falsa la hipótesis nula. Si la suma más pequeña tiene signo distinto
del que se anticipó, no se rechaza la hipótesis nula.
Que es mayor que el valor crítico -1.645 con 𝛼 = 5%. Por consiguiente, no se rechaza la hipótesis
nula de que el periodo de vacaciones no da por resultado aumento de la productividad. Este
resultado es el mismo obtenido por la prueba de signos estudiada antes.
Prueba de independencia
Entre todas las aplicaciones que se ofrecen de la distribución Ji cuadrado, es tal vez la prueba
de independencia la que mayor empleo tiene. Este procedimiento consiste en probar la hipótesis
nula según la cual dos criterios de clasificación cuando se aplican a dos conjuntos de entidades,
son independientes. Por ejemplo, probar que el hábito de fumar es independiente del sexo o
probar que los retrasos en la llegada al trabajo de las personas que laboran en una empresa es
independiente del tiempo de vinculación del trabajador.
La clasificación de un conjunto de entidades, de acuerdo con dos criterios, puede presentarse
mediante una tabla en la que los renglones (filas) representan los diversos niveles de uno de los
Estadística Inferencial Página 70
Ejemplo 2. Suponga que se desea averiguar si existe alguna relación entre el nivel de formación
académica y el rendimiento laboral para un grupo de 200 empleados. El nivel de formación
académica se clasifica en tres clases: escuela media o primaria, escuela superior y escuela de
especialización, en tanto que el rendimiento en el trabajo se clasifican como “excelente”, “bueno”
o “regular”. La distribución de frecuencia conjunta de las 200 observaciones está representada
en la siguiente tabla.
Formación académica
Rendimiento Media o primaria Superior Especialización Total
Excelente 10 (15) 40 (30) 10 (15) 60
Bueno 30 (20) 30 (40) 20 (20) 80
Regular 10 (15) 30 (30) 20 (15) 60
Total 50 100 50 200
La frecuencia esperada (número que aparece entre el paréntesis) se obtiene al multiplicar el total
de la columna por el total del respectivo renglón y dividir por el total de observaciones. Ejemplo
de las primeras frecuencias esperadas:
50×60 100×60 50×60 50×80
𝐸1 = = 15, 𝐸2 = = 30, 𝐸3 = = 15, 𝐸4 = = 20, …
200 200 200 200
A partir de la tabla anterior se obtiene 𝑋𝑐2 como sigue:
(10 − 15)2 (40 − 30)2 (10 − 15)2 (30 − 20)2 (30 − 40)2 (20 − 20)2 (10 − 15)2
𝑋𝑐2 = + + + + + +
15 30 15 20 40 20 15
(30 − 30) 2 (20 − 15) 2
+ ⋯+ +
30 15
2
2100
𝑋𝑐 = = 17.5
120
Este valor calculado se confronta con el valor de tabla Ji cuadrado (𝑋𝛼2 ), con∝= 0.05 tenemos,
2 2 2 2
𝑋[1−𝛼,(𝑟−1)(𝑐−1)] = 𝑋[1−0.05,(3−1)(3−1)] = 𝑋[0.9,4] = 9.48773y con ∝= 0.01, 𝑋[0.99,4] = 13.2767.
El valor calculado es considerablemente superior a estos valores. Así que aunque se fijara el
nivel de significancia al 1%, se podría rechazar la hipótesis nula de que no hay relación
significativa entre la formación académica de los empleados y su rendimiento en el trabajo.
𝑛(𝑎𝑑−𝑏𝑐)2
𝑋𝑐2 (𝑎+𝑏)(𝑎+𝑐)(𝑐+𝑑)(𝑏+𝑑) (1)
𝑛(|𝑎𝑑−𝑏𝑐|−𝑛⁄2)2
𝑋𝑐2 = (𝑎+𝑏)(𝑎+𝑐)(𝑐+𝑑)(𝑏+𝑑) (2)
Ejemplo 3. En un estudio para determinar si existía relación entre el sexo y el propósito de elegir
una carrera técnica se entrevistaron 120 aspirantes a la universidad. Los resultados fueron los
siguientes:
120(40 × 40 − 10 × 30)2
𝑋𝑐2 = = 16.56
70 × 50 × 50 × 70
De la tabla III tenemos que para un grado de libertad el valor crítico 𝑋 2 que separa 0.1% superior
es 10.828. Por lo tanto, la hipótesis según la cual existe independencia entre el sexo y el propósito
de elegir una carrera técnica debe ser rechazada.
que es ligeramente menor que el valor antes obtenido, pero aun así la hipótesis de independencia
debe ser rechazada.
Personas A B C D E F G H I J K L M N O PQ
Pesos antes 210 197 203 175 234 178 252 230 190 195 154 179 243 195 198 169
217
Pesos 208 196 195 175 229 170 242 221 213 180 150 173 235 204 193 169
después 210
2. Los datos que siguen se reunieron con el propósito de determinar si las edades de los
esposos se pueden considerar superiores a las de las esposas.
Esposos 58 46 30 35 53 20 45 35 38 43 25 22 37 61 78
Esposas 47 35 25 38 49 21 42 40 38 38 26 24 39 60 68
¿Qué puede decir, de acuerdo con estos datos? Empleando la prueba T de Wilcoxon. Emplee
el nivel de significancia 𝛼 = 1%.
3. Se desea determinar si un alza en los salarios incrementaría la producción por hora de los
trabajadores. Sea X esta producción por hora antes de alza de salarios y sea Y la misma
producción después del alza. Una muestra de 20 trabajadores arroja los siguientes datos:
Trabajadores A B C D E F G H I J K L M N O P Q R S T
X 91 83 70 64 85 86 91 66 72 60 75 84 71 80 70 85 65 75 75 65
Y 88 87 67 69 83 81 94 67 76 55 74 86 72 90 75 83 75 82 65 67
Utilice la estadística de prueba T para probar la hipótesis nula de que el alza de salarios no
tiene efecto sobre la producción horaria de los trabajadores, con la hipótesis alterna de que:
a. La producción por hora tras el alza es superior a la de antes del alza a un nivel de
significancia del 𝛼 = 1%.
b. La producción por hora tras el alza difiere de la producción anterior al alza a un nivel de
significancia del 𝛼 = 5%.
Pruebe la hipótesis según la cual la afiliación al partido no tiene nada que ver con la
preferencia del voto. Tome 𝛼 = 5%.
5. Cierta compañía desea determinar si el ausentismo se relaciona con la edad. Se toma una
muestra de 200 empleados al azar y se clasifican según edad y causa de ausentismo así:
Edad
Causa
Menos de 30 30 – 50 Más de 50
Enfermedad 40 28 52
Otras 20 36 24
¿Se encuentra la edad relacionada con el ausentismo? Tome 𝛼 = 0.01.
6. Una fábrica de automóviles quieren averiguar si el sexo de sus posibles clientes no tienen
relación con la preferencia del modelo. Se toma una muestra aleatoria de 2 000 posibles
clientes y se clasifican así:
Modelo
Sexo
I II III
Varón 350 270 380
Mujer 340 400 260
Pruebe la hipótesis según la cual el sexo no tiene relación con la preferencia del modelo.
Tome 𝛼 = 0.01.
7. La administración de cierta firma elaboró una encuesta para determinar si el tipo de empleo
se relaciona con preferencias por una póliza de seguros. Una muestra de 300 empleados a
los que se entrevistó arrojó los datos siguientes:
Póliza de seguro
Tipo de empleados
I II III
Inspectores 18 6 12
Empleados de oficina 42 24 30
Obreros 36 72 60
𝜎=1
𝑋𝛼2
Grados libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
F
𝛼 =0.10 superior
𝒏𝟏 ⁄𝒏𝟐 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 39.8634 49.5000 53.5932 55.8329 57.24 58.2044 58.9059 59.4389 59.8575 60.1949 60.7052 61.2203 61.7402 62.002 62.2649 62.529 62.7942 63.0606 63.3281
2 8.52632 9.00000 9.16179 9.24342 9.29263 9.32553 9.34908 9.36677 9.38054 9.39157 9.40813 9.42471 9.44131 9.44962 9.45793 9.46624 9.47456 9.48289 9.49122
3 5.53832 5.46238 5.39077 5.34264 5.30916 5.28473 5.26619 5.25167 5.24 5.23041 5.21562 5.20031 5.18448 5.17636 5.16811 5.15972 5.15119 5.14251 5.1337
4 4.54477 4.32456 4.19086 4.10725 4.05058 4.00975 3.97897 3.95494 3.93567 3.91988 3.89553 3.87036 3.84434 3.83099 3.81742 3.80361 3.78957 3.77527 3.76073
5 4.06042 3.77972 3.61948 3.5202 3.45298 3.40451 3.3679 3.33928 3.31628 3.2974 3.26824 3.23801 3.20665 3.19052 3.17408 3.15732 3.14023 3.12279 3.105
6 3.77595 3.4633 3.28876 3.18076 3.10751 3.05455 3.01446 2.98304 2.95774 2.93693 2.90472 2.87122 2.83634 2.81834 2.79996 2.78117 2.76195 2.74229 2.72216
7 3.58943 3.25744 3.07407 2.96053 2.88334 2.82739 2.78493 2.75158 2.72468 2.70251 2.66811 2.63223 2.59473 2.57533 2.55546 2.5351 2.51422 2.49279 2.47079
8 3.45792 3.11312 2.9238 2.80643 2.72645 2.66833 2.62413 2.58935 2.56124 2.53804 2.50196 2.46422 2.42464 2.4041 2.38302 2.36136 2.3391 2.31618 2.29257
9 3.3603 3.00645 2.81286 2.69268 2.61061 2.55086 2.50531 2.46941 2.44034 2.41632 2.37888 2.33962 2.29832 2.27683 2.25472 2.23196 2.20849 2.18427 2.15923
10 3.28502 2.92447 2.72767 2.60534 2.52164 2.46058 2.41397 2.37715 2.34731 2.3226 2.28405 2.24351 2.20074 2.17843 2.15543 2.13169 2.10716 2.08176 2.05542
11 3.2252 2.85951 2.66023 2.53619 2.45118 2.38907 2.34157 2.304 2.2735 2.24823 2.20873 2.16709 2.12305 2.10001 2.07621 2.05161 2.02612 1.99965 1.97211
12 3.17655 2.8068 2.60552 2.4801 2.39402 2.33102 2.28278 2.24457 2.21352 2.18776 2.14744 2.10485 2.05968 2.03599 2.01149 1.9861 1.95973 1.93228 1.90361
13 3.13621 2.76317 2.56027 2.43371 2.34672 2.28298 2.2341 2.19535 2.16382 2.13763 2.09659 2.05316 2.00698 1.98272 1.95757 1.93147 1.90429 1.87591 1.8462
14 3.10221 2.72647 2.52222 2.39469 2.30694 2.24256 2.19313 2.1539 2.12195 2.0954 2.05371 2.00953 1.96245 1.93766 1.91193 1.88516 1.85723 1.828 1.79728
15 3.07319 2.69517 2.48979 2.36143 2.27302 2.20808 2.15818 2.11853 2.08621 2.05932 2.01707 1.97222 1.92431 1.89904 1.87277 1.84539 1.81676 1.78672 1.75505
16 3.04811 2.66817 2.46181 2.33274 2.24376 2.17833 2.128 2.08798 2.05533 2.02815 1.98539 1.93992 1.89127 1.86556 1.83879 1.81084 1.78156 1.75075 1.71817
17 3.02623 2.64464 2.43743 2.30775 2.21825 2.15239 2.10169 2.06134 2.02839 2.00094 1.95772 1.91169 1.86236 1.83624 1.80901 1.78053 1.75063 1.71909 1.68564
18 3.00698 2.62395 2.41601 2.28577 2.19583 2.12958 2.07854 2.03789 2.00467 1.97698 1.93334 1.88681 1.83685 1.81035 1.78269 1.75371 1.72322 1.69099 1.65671
19 2.9899 2.60561 2.39702 2.2663 2.17596 2.10936 2.05802 2.0171 1.98364 1.95573 1.9117 1.86471 1.81416 1.78731 1.75924 1.72979 1.69876 1.66587 1.63077
20 2.97465 2.58925 2.38009 2.24893 2.15823 2.09132 2.0397 1.99853 1.96485 1.93674 1.89236 1.84494 1.79384 1.76667 1.73822 1.70833 1.67678 1.64326 1.60738
22 2.94858 2.56131 2.35117 2.21927 2.12794 2.0605 2.0084 1.9668 1.93273 1.90425 1.85925 1.81106 1.75899 1.73122 1.70208 1.67138 1.63885 1.60415 1.56678
23 2.93736 2.54929 2.33873 2.20651 2.11491 2.04723 1.99492 1.95312 1.91888 1.89025 1.84497 1.79643 1.74392 1.71588 1.68643 1.65535 1.62237 1.58711 1.54903
24 2.92712 2.53833 2.32739 2.19488 2.10303 2.03513 1.98263 1.94066 1.90625 1.87748 1.83194 1.78308 1.73015 1.70185 1.6721 1.64067 1.60726 1.57146 1.5327
25 2.91774 2.52831 2.31702 2.18424 2.09216 2.02406 1.97138 1.92925 1.89469 1.86578 1.82 1.77083 1.71752 1.68898 1.65895 1.62718 1.59335 1.55703 1.5176
26 2.90913 2.5191 2.30749 2.17447 2.08218 2.01389 1.96104 1.91876 1.88407 1.85503 1.80902 1.75957 1.70589 1.67712 1.64682 1.61472 1.5805 1.54368 1.5036
27 2.90119 2.51061 2.29871 2.16546 2.07298 2.00452 1.95151 1.90909 1.87427 1.84511 1.79889 1.74917 1.69514 1.66616 1.6356 1.6032 1.56859 1.53129 1.49057
28 2.89385 2.50276 2.2906 2.15714 2.06447 1.99585 1.9427 1.90014 1.8652 1.83593 1.78951 1.73954 1.68519 1.656 1.62519 1.5925 1.55753 1.51976 1.47841
29 2.88703 2.49548 2.28307 2.14941 2.05658 1.98781 1.93452 1.89184 1.85679 1.82741 1.78081 1.7306 1.67593 1.64655 1.61551 1.58253 1.54721 1.50899 1.46704
30 2.88069 2.48872 2.27607 2.14223 2.04925 1.98033 1.92692 1.88412 1.84896 1.81949 1.7727 1.72227 1.66731 1.63774 1.60648 1.57323 1.53757 1.49891 1.45636
40 2.83535 2.44037 2.22609 2.09095 1.99682 1.92688 1.87252 1.82886 1.7929 1.76269 1.71456 1.66241 1.60515 1.57411 1.54108 1.50562 1.46716 1.42476 1.37691
60 2.79107 2.39325 2.17741 2.04099 1.94571 1.87472 1.81939 1.77483 1.73802 1.70701 1.65743 1.60337 1.54349 1.51072 1.47554 1.43734 1.3952 1.34757 1.29146
120 2.74781 2.34734 2.12999 1.9923 1.89587 1.82381 1.76748 1.72196 1.68425 1.65238 1.6012 1.545 1.48207 1.44723 1.40938 1.3676 1.32034 1.26457 1.19256
∞ 2.70554 2.30259 2.0838 1.94486 1.84727 1.77411 1.71672 1.6702 1.63152 1.59872 1.54578 1.48714 1.4206 1.38318 1.34187 1.29513 1.23995 1.1686 1
𝛼 =0.05 superior
𝒏𝟏 ⁄ 𝒏𝟐 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
df2=1 161.447 199.5 215.707 224.583 230.161 233.986 236.768 238.882 240.543 241.881 243.906 245.949 248.013 249.051 250.095 251.143 252.195 253.252 254.314
2 18.5128 19 19.1643 19.2468 19.2964 19.3295 19.3532 19.371 19.3848 19.3959 19.4125 19.4291 19.4458 19.4541 19.4624 19.4707 19.4791 19.4874 19.4957
3 10.128 9.5521 9.2766 9.1172 9.0135 8.9406 8.8867 8.8452 8.8123 8.7855 8.7446 8.7029 8.6602 8.6385 8.6166 8.5944 8.572 8.5494 8.5264
4 7.7086 6.9443 6.5914 6.3882 6.2561 6.1631 6.0942 6.041 5.9988 5.9644 5.9117 5.8578 5.8025 5.7744 5.7459 5.717 5.6877 5.6581 5.6281
5 6.6079 5.7861 5.4095 5.1922 5.0503 4.9503 4.8759 4.8183 4.7725 4.7351 4.6777 4.6188 4.5581 4.5272 4.4957 4.4638 4.4314 4.3985 4.365
6 5.9874 5.1433 4.7571 4.5337 4.3874 4.2839 4.2067 4.1468 4.099 4.06 3.9999 3.9381 3.8742 3.8415 3.8082 3.7743 3.7398 3.7047 3.6689
7 5.5914 4.7374 4.3468 4.1203 3.9715 3.866 3.787 3.7257 3.6767 3.6365 3.5747 3.5107 3.4445 3.4105 3.3758 3.3404 3.3043 3.2674 3.2298
8 5.3177 4.459 4.0662 3.8379 3.6875 3.5806 3.5005 3.4381 3.3881 3.3472 3.2839 3.2184 3.1503 3.1152 3.0794 3.0428 3.0053 2.9669 2.9276
9 5.1174 4.2565 3.8625 3.6331 3.4817 3.3738 3.2927 3.2296 3.1789 3.1373 3.0729 3.0061 2.9365 2.9005 2.8637 2.8259 2.7872 2.7475 2.7067
10 4.9646 4.1028 3.7083 3.478 3.3258 3.2172 3.1355 3.0717 3.0204 2.9782 2.913 2.845 2.774 2.7372 2.6996 2.6609 2.6211 2.5801 2.5379
11 4.8443 3.9823 3.5874 3.3567 3.2039 3.0946 3.0123 2.948 2.8962 2.8536 2.7876 2.7186 2.6464 2.609 2.5705 2.5309 2.4901 2.448 2.4045
12 4.7472 3.8853 3.4903 3.2592 3.1059 2.9961 2.9134 2.8486 2.7964 2.7534 2.6866 2.6169 2.5436 2.5055 2.4663 2.4259 2.3842 2.341 2.2962
13 4.6672 3.8056 3.4105 3.1791 3.0254 2.9153 2.8321 2.7669 2.7144 2.671 2.6037 2.5331 2.4589 2.4202 2.3803 2.3392 2.2966 2.2524 2.2064
14 4.6001 3.7389 3.3439 3.1122 2.9582 2.8477 2.7642 2.6987 2.6458 2.6022 2.5342 2.463 2.3879 2.3487 2.3082 2.2664 2.2229 2.1778 2.1307
15 4.5431 3.6823 3.2874 3.0556 2.9013 2.7905 2.7066 2.6408 2.5876 2.5437 2.4753 2.4034 2.3275 2.2878 2.2468 2.2043 2.1601 2.1141 2.0658
16 4.494 3.6337 3.2389 3.0069 2.8524 2.7413 2.6572 2.5911 2.5377 2.4935 2.4247 2.3522 2.2756 2.2354 2.1938 2.1507 2.1058 2.0589 2.0096
17 4.4513 3.5915 3.1968 2.9647 2.81 2.6987 2.6143 2.548 2.4943 2.4499 2.3807 2.3077 2.2304 2.1898 2.1477 2.104 2.0584 2.0107 1.9604
18 4.4139 3.5546 3.1599 2.9277 2.7729 2.6613 2.5767 2.5102 2.4563 2.4117 2.3421 2.2686 2.1906 2.1497 2.1071 2.0629 2.0166 1.9681 1.9168
19 4.3807 3.5219 3.1274 2.8951 2.7401 2.6283 2.5435 2.4768 2.4227 2.3779 2.308 2.2341 2.1555 2.1141 2.0712 2.0264 1.9795 1.9302 1.878
20 4.3512 3.4928 3.0984 2.8661 2.7109 2.599 2.514 2.4471 2.3928 2.3479 2.2776 2.2033 2.1242 2.0825 2.0391 1.9938 1.9464 1.8963 1.8432
22 4.3009 3.4434 3.0491 2.8167 2.6613 2.5491 2.4638 2.3965 2.3419 2.2967 2.2258 2.1508 2.0707 2.0283 1.9842 1.938 1.8894 1.838 1.7831
23 4.2793 3.4221 3.028 2.7955 2.64 2.5277 2.4422 2.3748 2.3201 2.2747 2.2036 2.1282 2.0476 2.005 1.9605 1.9139 1.8648 1.8128 1.757
24 4.2597 3.4028 3.0088 2.7763 2.6207 2.5082 2.4226 2.3551 2.3002 2.2547 2.1834 2.1077 2.0267 1.9838 1.939 1.892 1.8424 1.7896 1.733
25 4.2417 3.3852 2.9912 2.7587 2.603 2.4904 2.4047 2.3371 2.2821 2.2365 2.1649 2.0889 2.0075 1.9643 1.9192 1.8718 1.8217 1.7684 1.711
26 4.2252 3.369 2.9752 2.7426 2.5868 2.4741 2.3883 2.3205 2.2655 2.2197 2.1479 2.0716 1.9898 1.9464 1.901 1.8533 1.8027 1.7488 1.6906
27 4.21 3.3541 2.9604 2.7278 2.5719 2.4591 2.3732 2.3053 2.2501 2.2043 2.1323 2.0558 1.9736 1.9299 1.8842 1.8361 1.7851 1.7306 1.6717
28 4.196 3.3404 2.9467 2.7141 2.5581 2.4453 2.3593 2.2913 2.236 2.19 2.1179 2.0411 1.9586 1.9147 1.8687 1.8203 1.7689 1.7138 1.6541
29 4.183 3.3277 2.934 2.7014 2.5454 2.4324 2.3463 2.2783 2.2229 2.1768 2.1045 2.0275 1.9446 1.9005 1.8543 1.8055 1.7537 1.6981 1.6376
30 4.1709 3.3158 2.9223 2.6896 2.5336 2.4205 2.3343 2.2662 2.2107 2.1646 2.0921 2.0148 1.9317 1.8874 1.8409 1.7918 1.7396 1.6835 1.6223
40 4.0847 3.2317 2.8387 2.606 2.4495 2.3359 2.249 2.1802 2.124 2.0772 2.0035 1.9245 1.8389 1.7929 1.7444 1.6928 1.6373 1.5766 1.5089
60 4.0012 3.1504 2.7581 2.5252 2.3683 2.2541 2.1665 2.097 2.0401 1.9926 1.9174 1.8364 1.748 1.7001 1.6491 1.5943 1.5343 1.4673 1.3893
120 3.9201 3.0718 2.6802 2.4472 2.2899 2.175 2.0868 2.0164 1.9588 1.9105 1.8337 1.7505 1.6587 1.6084 1.5543 1.4952 1.429 1.3519 1.2539
∞ 3.8415 2.9957 2.6049 2.3719 2.2141 2.0986 2.0096 1.9384 1.8799 1.8307 1.7522 1.6664 1.5705 1.5173 1.4591 1.394 1.318 1.2214 1
𝛼 =0.025superior
𝒏𝟏 ⁄ 𝒏𝟐 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 647.789 799.5 864.163 899.583 921.847 937.111 948.216 956.656 963.284 968.627 976.707 984.866 993.102 997.249 1001.41 1005.59 1009.8 1014.02 1018.258
2 38.5063 39 39.1655 39.2484 39.2982 39.3315 39.3552 39.373 39.3869 39.398 39.4146 39.4313 39.4479 39.4562 39.465 39.473 39.481 39.49 39.498
3 17.4434 16.0441 15.4392 15.101 14.8848 14.7347 14.6244 14.5399 14.4731 14.4189 14.3366 14.2527 14.1674 14.1241 14.081 14.037 13.992 13.947 13.902
4 12.2179 10.6491 9.9792 9.6045 9.3645 9.1973 9.0741 8.9796 8.9047 8.8439 8.7512 8.6565 8.5599 8.5109 8.461 8.411 8.36 8.309 8.257
5 10.007 8.4336 7.7636 7.3879 7.1464 6.9777 6.8531 6.7572 6.6811 6.6192 6.5245 6.4277 6.3286 6.278 6.227 6.175 6.123 6.069 6.015
6 8.8131 7.2599 6.5988 6.2272 5.9876 5.8198 5.6955 5.5996 5.5234 5.4613 5.3662 5.2687 5.1684 5.1172 5.065 5.012 4.959 4.904 4.849
7 8.0727 6.5415 5.8898 5.5226 5.2852 5.1186 4.9949 4.8993 4.8232 4.7611 4.6658 4.5678 4.4667 4.415 4.362 4.309 4.254 4.199 4.142
8 7.5709 6.0595 5.416 5.0526 4.8173 4.6517 4.5286 4.4333 4.3572 4.2951 4.1997 4.1012 3.9995 3.9472 3.894 3.84 3.784 3.728 3.67
9 7.2093 5.7147 5.0781 4.7181 4.4844 4.3197 4.197 4.102 4.026 3.9639 3.8682 3.7694 3.6669 3.6142 3.56 3.505 3.449 3.392 3.333
10 6.9367 5.4564 4.8256 4.4683 4.2361 4.0721 3.9498 3.8549 3.779 3.7168 3.6209 3.5217 3.4185 3.3654 3.311 3.255 3.198 3.14 3.08
11 6.7241 5.2559 4.63 4.2751 4.044 3.8807 3.7586 3.6638 3.5879 3.5257 3.4296 3.3299 3.2261 3.1725 3.118 3.061 3.004 2.944 2.883
12 6.5538 5.0959 4.4742 4.1212 3.8911 3.7283 3.6065 3.5118 3.4358 3.3736 3.2773 3.1772 3.0728 3.0187 2.963 2.906 2.848 2.787 2.725
13 6.4143 4.9653 4.3472 3.9959 3.7667 3.6043 3.4827 3.388 3.312 3.2497 3.1532 3.0527 2.9477 2.8932 2.837 2.78 2.72 2.659 2.595
14 6.2979 4.8567 4.2417 3.8919 3.6634 3.5014 3.3799 3.2853 3.2093 3.1469 3.0502 2.9493 2.8437 2.7888 2.732 2.674 2.614 2.552 2.487
15 6.1995 4.765 4.1528 3.8043 3.5764 3.4147 3.2934 3.1987 3.1227 3.0602 2.9633 2.8621 2.7559 2.7006 2.644 2.585 2.524 2.461 2.395
16 6.1151 4.6867 4.0768 3.7294 3.5021 3.3406 3.2194 3.1248 3.0488 2.9862 2.889 2.7875 2.6808 2.6252 2.568 2.509 2.447 2.383 2.316
17 6.042 4.6189 4.0112 3.6648 3.4379 3.2767 3.1556 3.061 2.9849 2.9222 2.8249 2.723 2.6158 2.5598 2.502 2.442 2.38 2.315 2.247
18 5.9781 4.5597 3.9539 3.6083 3.382 3.2209 3.0999 3.0053 2.9291 2.8664 2.7689 2.6667 2.559 2.5027 2.445 2.384 2.321 2.256 2.187
19 5.9216 4.5075 3.9034 3.5587 3.3327 3.1718 3.0509 2.9563 2.8801 2.8172 2.7196 2.6171 2.5089 2.4523 2.394 2.333 2.27 2.203 2.133
20 5.8715 4.4613 3.8587 3.5147 3.2891 3.1283 3.0074 2.9128 2.8365 2.7737 2.6758 2.5731 2.4645 2.4076 2.349 2.287 2.223 2.156 2.085
22 5.7863 4.3828 3.7829 3.4401 3.2151 3.0546 2.9338 2.8392 2.7628 2.6998 2.6017 2.4984 2.389 2.3315 2.272 2.21 2.145 2.076 2.003
23 5.7498 4.3492 3.7505 3.4083 3.1835 3.0232 2.9023 2.8077 2.7313 2.6682 2.5699 2.4665 2.3567 2.2989 2.239 2.176 2.111 2.041 1.968
24 5.7166 4.3187 3.7211 3.3794 3.1548 2.9946 2.8738 2.7791 2.7027 2.6396 2.5411 2.4374 2.3273 2.2693 2.209 2.146 2.08 2.01 1.935
25 5.6864 4.2909 3.6943 3.353 3.1287 2.9685 2.8478 2.7531 2.6766 2.6135 2.5149 2.411 2.3005 2.2422 2.182 2.118 2.052 1.981 1.906
26 5.6586 4.2655 3.6697 3.3289 3.1048 2.9447 2.824 2.7293 2.6528 2.5896 2.4908 2.3867 2.2759 2.2174 2.157 2.093 2.026 1.954 1.878
27 5.6331 4.2421 3.6472 3.3067 3.0828 2.9228 2.8021 2.7074 2.6309 2.5676 2.4688 2.3644 2.2533 2.1946 2.133 2.069 2.002 1.93 1.853
28 5.6096 4.2205 3.6264 3.2863 3.0626 2.9027 2.782 2.6872 2.6106 2.5473 2.4484 2.3438 2.2324 2.1735 2.112 2.048 1.98 1.907 1.829
29 5.5878 4.2006 3.6072 3.2674 3.0438 2.884 2.7633 2.6686 2.5919 2.5286 2.4295 2.3248 2.2131 2.154 2.092 2.028 1.959 1.886 1.807
30 5.5675 4.1821 3.5894 3.2499 3.0265 2.8667 2.746 2.6513 2.5746 2.5112 2.412 2.3072 2.1952 2.1359 2.074 2.009 1.94 1.866 1.787
40 5.4239 4.051 3.4633 3.1261 2.9037 2.7444 2.6238 2.5289 2.4519 2.3882 2.2882 2.1819 2.0677 2.0069 1.943 1.875 1.803 1.724 1.637
60 5.2856 3.9253 3.3425 3.0077 2.7863 2.6274 2.5068 2.4117 2.3344 2.2702 2.1692 2.0613 1.9445 1.8817 1.815 1.744 1.667 1.581 1.482
120 5.1523 3.8046 3.2269 2.8943 2.674 2.5154 2.3948 2.2994 2.2217 2.157 2.0548 1.945 1.8249 1.7597 1.69 1.614 1.53 1.433 1.31
∞ 5.0239 3.6889 3.1161 2.7858 2.5665 2.4082 2.2875 2.1918 2.1136 2.0483 1.9447 1.8326 1.7085 1.6402 1.566 1.484 1.388 1.268 1
𝛼 =0.01 superior
𝒏𝟏 ⁄𝒏𝟐 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 4052.18 4999.5 5403.35 5624.58 5763.65 5858.98 5928.35 5981.07 6022.47 6055.84 6106.32 6157.28 6208.73 6234.63 6260.64 6286.78 6313.03 6339.39 6365.86
2 98.503 99 99.166 99.249 99.299 99.333 99.356 99.374 99.388 99.399 99.416 99.433 99.449 99.458 99.466 99.474 99.482 99.491 99.499
3 34.116 30.817 29.457 28.71 28.237 27.911 27.672 27.489 27.345 27.229 27.052 26.872 26.69 26.598 26.505 26.411 26.316 26.221 26.125
4 21.198 18 16.694 15.977 15.522 15.207 14.976 14.799 14.659 14.546 14.374 14.198 14.02 13.929 13.838 13.745 13.652 13.558 13.463
5 16.258 13.274 12.06 11.392 10.967 10.672 10.456 10.289 10.158 10.051 9.888 9.722 9.553 9.466 9.379 9.291 9.202 9.112 9.02
6 13.745 10.925 9.78 9.148 8.746 8.466 8.26 8.102 7.976 7.874 7.718 7.559 7.396 7.313 7.229 7.143 7.057 6.969 6.88
7 12.246 9.547 8.451 7.847 7.46 7.191 6.993 6.84 6.719 6.62 6.469 6.314 6.155 6.074 5.992 5.908 5.824 5.737 5.65
8 11.259 8.649 7.591 7.006 6.632 6.371 6.178 6.029 5.911 5.814 5.667 5.515 5.359 5.279 5.198 5.116 5.032 4.946 4.859
9 10.561 8.022 6.992 6.422 6.057 5.802 5.613 5.467 5.351 5.257 5.111 4.962 4.808 4.729 4.649 4.567 4.483 4.398 4.311
10 10.044 7.559 6.552 5.994 5.636 5.386 5.2 5.057 4.942 4.849 4.706 4.558 4.405 4.327 4.247 4.165 4.082 3.996 3.909
11 9.646 7.206 6.217 5.668 5.316 5.069 4.886 4.744 4.632 4.539 4.397 4.251 4.099 4.021 3.941 3.86 3.776 3.69 3.602
12 9.33 6.927 5.953 5.412 5.064 4.821 4.64 4.499 4.388 4.296 4.155 4.01 3.858 3.78 3.701 3.619 3.535 3.449 3.361
13 9.074 6.701 5.739 5.205 4.862 4.62 4.441 4.302 4.191 4.1 3.96 3.815 3.665 3.587 3.507 3.425 3.341 3.255 3.165
14 8.862 6.515 5.564 5.035 4.695 4.456 4.278 4.14 4.03 3.939 3.8 3.656 3.505 3.427 3.348 3.266 3.181 3.094 3.004
15 8.683 6.359 5.417 4.893 4.556 4.318 4.142 4.004 3.895 3.805 3.666 3.522 3.372 3.294 3.214 3.132 3.047 2.959 2.868
16 8.531 6.226 5.292 4.773 4.437 4.202 4.026 3.89 3.78 3.691 3.553 3.409 3.259 3.181 3.101 3.018 2.933 2.845 2.753
17 8.4 6.112 5.185 4.669 4.336 4.102 3.927 3.791 3.682 3.593 3.455 3.312 3.162 3.084 3.003 2.92 2.835 2.746 2.653
18 8.285 6.013 5.092 4.579 4.248 4.015 3.841 3.705 3.597 3.508 3.371 3.227 3.077 2.999 2.919 2.835 2.749 2.66 2.566
19 8.185 5.926 5.01 4.5 4.171 3.939 3.765 3.631 3.523 3.434 3.297 3.153 3.003 2.925 2.844 2.761 2.674 2.584 2.489
20 8.096 5.849 4.938 4.431 4.103 3.871 3.699 3.564 3.457 3.368 3.231 3.088 2.938 2.859 2.778 2.695 2.608 2.517 2.421
22 7.945 5.719 4.817 4.313 3.988 3.758 3.587 3.453 3.346 3.258 3.121 2.978 2.827 2.749 2.667 2.583 2.495 2.403 2.305
23 7.881 5.664 4.765 4.264 3.939 3.71 3.539 3.406 3.299 3.211 3.074 2.931 2.781 2.702 2.62 2.535 2.447 2.354 2.256
24 7.823 5.614 4.718 4.218 3.895 3.667 3.496 3.363 3.256 3.168 3.032 2.889 2.738 2.659 2.577 2.492 2.403 2.31 2.211
25 7.77 5.568 4.675 4.177 3.855 3.627 3.457 3.324 3.217 3.129 2.993 2.85 2.699 2.62 2.538 2.453 2.364 2.27 2.169
26 7.721 5.526 4.637 4.14 3.818 3.591 3.421 3.288 3.182 3.094 2.958 2.815 2.664 2.585 2.503 2.417 2.327 2.233 2.131
27 7.677 5.488 4.601 4.106 3.785 3.558 3.388 3.256 3.149 3.062 2.926 2.783 2.632 2.552 2.47 2.384 2.294 2.198 2.097
28 7.636 5.453 4.568 4.074 3.754 3.528 3.358 3.226 3.12 3.032 2.896 2.753 2.602 2.522 2.44 2.354 2.263 2.167 2.064
29 7.598 5.42 4.538 4.045 3.725 3.499 3.33 3.198 3.092 3.005 2.868 2.726 2.574 2.495 2.412 2.325 2.234 2.138 2.034
30 7.562 5.39 4.51 4.018 3.699 3.473 3.304 3.173 3.067 2.979 2.843 2.7 2.549 2.469 2.386 2.299 2.208 2.111 2.006
40 7.314 5.179 4.313 3.828 3.514 3.291 3.124 2.993 2.888 2.801 2.665 2.522 2.369 2.288 2.203 2.114 2.019 1.917 1.805
60 7.077 4.977 4.126 3.649 3.339 3.119 2.953 2.823 2.718 2.632 2.496 2.352 2.198 2.115 2.028 1.936 1.836 1.726 1.601
120 6.851 4.787 3.949 3.48 3.174 2.956 2.792 2.663 2.559 2.472 2.336 2.192 2.035 1.95 1.86 1.763 1.656 1.533 1.381
∞ 6.635 4.605 3.782 3.319 3.017 2.802 2.639 2.511 2.407 2.321 2.185 2.039 1.878 1.791 1.696 1.592 1.473 1.325 1
Lincoln L., C. (1984). Estadística para las ciencias Administrativas. (Vol. Tercera edición).
Colombia: Editorial McGraw Hill.
Martínez, C., Levin, R., & David, R. (2011). Estadística Aplicada (Primera ed.). México: Pearson
Educación.
Ritchey, F. J. (2008). Estadística para las ciencias sociales. México, D.F.: Mc Graw Hill
.
• FUENTES DE INTERNET
http://es.wikipedia.org/wiki/Probabilidad
http://www.slideshare.net/milit/muestreo-aleatorio-simple
http://es.wikipedia.org/wiki/Muestreo_en_estad%C3%ADstica
http://es.wikipedia.org/wiki/Contraste_de_hip%C3%B3tesis