Estadistica Inferencial
Estadistica Inferencial
Estadistica Inferencial
MUESTRALES
SEMANA 2
[ ESTADSTICA INFERENCIAL ]
DISTRIBUCIONES
MUESTRALES
CONTENIDO
SEMANA
DOS:
Palabras
clave:
Distribucin
muestral,
error
estndar
de
la
media,
error
estndar
de
la
proporcin,
factor
de
correccin.
INTRODUCCIN
El
propsito
del
muestreo
es
indagar
algo
sobre
la
poblacin
de
estudio.
Cuando
se
disea
una
muestra,
es
importante
considerar
la
informacin
que
se
va
a
obtener
y
el
grado
de
exactitud
de
lo
que
se
encuentre
acerca
de
la
poblacin.
Con
este
propsito
es
importante
que
se
analice
claramente
la
obtencin
de
la
muestra
y
los
resultados
obtenidos
a
partir
de
ella,
utilizando
los
conceptos
probabilsticos
ya
vistos.
Una
distribucin
muestral
es
una
distribucin
de
probabilidad
de
un
estadstico
muestral
calculado
a
partir
de
todas
las
muestras
posibles
de
tamao
n,
elegidas
al
azar
en
una
poblacin
determinada.
En
trminos
generales
estamos
interesados
en
conocer
una
o
ms
de
las
siguientes
caractersticas:
Su
forma
funcional
Su
media
Su
desviacin
estndar.
Antes
de
comprender
la
inferencia
estadstica,
tenemos
que
entender
claramente
el
concepto
de
distribucin
muestral.
Con
esto
se
pretende
dar
a
conocer
la
naturaleza
de
tales
distribuciones
y
su
papel
en
la
inferencia
estadstica,
sin
detenernos
mucho
en
este
tema,
ya
que
por
regla
general
en
las
aplicaciones
estadsticas
no
se
construyen
distribuciones
muestrales.
Para
emplear
los
mtodos
de
la
inferencia
estadstica,
necesitamos
conocer
[ POLITCNICO GRANCOLOMBIANO ]
Poblacin
Muestra
n
!
S2
P
Vamos
a
construir
una
distribucin
muestral
experimental
de
medias
calculadas
a
partir
de
todas
las
muestras
posibles
que
se
pueden
obtener
de
una
poblacin
pequea,
con
el
fin
de
comprender
la
naturaleza
de
la
distribucin
muestral
y
esto
lo
haremos
con
el
siguiente
ejemplo:
Consideremos
una
poblacin
conformada
por
cuatro
personas
(N=4).
La
variable
de
inters
es
el
gasto
mensual
en
transporte
(en
miles
de
pesos).
Los
datos
de
la
poblacin
son:
{78,
67,
83,
56}
y
vamos
a
responder
a
cada
literal
teniendo
en
cuenta
la
notacin
utilizada:
a. Calcular
la
media
y
la
desviacin
estndar
de
la
poblacin
La
media
poblacional
se
obtiene
con:
!=
Y
la
desviacin
estndar
es:! =
!"
!
78 + 67 + 83 + 56 284
=
= 71
4
4
(!!!)!
!
[ ESTADSTICA INFERENCIAL ]
4
4!
= 6
=
2 2!(4 2)!
Es
decir
que
podemos
formar
seis
grupos
de
dos
elementos
cada
uno.
Observmoslos:
X 1 : (78,67)
X 2 : (78,83)
X 4 : (67,83)
X 5 : (67,56)
X 3 : (78,56)
X 6 : (83,56) .
c. Dichas
muestras
son
de
tipo
aleatorio
simple
para
poblacin
finita
o
infinita?
Como
cada
una
de
estas
muestras
tiene
la
misma
probabilidad
de
ser
elegida
entonces
la
probabilidad
de
escoger
una
muestra
estara
dada
por:
Muestra
X 1
X 2
X 3
X 4
X 5
X 6
Probabilidad
1
1
1
1
1
1
6
6
6
6
6
6
Y
por
ende
estamos
en
presencia
de
muestreo
aleatorio
simple
para
poblacin
finita.
Como
X
es
una
variable
aleatoria,
vamos
a
calcular
la
media
en
cada
muestra,
entonces
X 1 :
el
promedio
de
la
primera
muestra, X 2 :
el
promedio
de
la
segunda
muestra,
etc.,
Veamos:
78 + 67
= 72.5
2
67 + 83
X4 =
= 75
2
X1 =
78 + 83
= 80.5
2
67 + 56
X5 =
= 61.5
2
X2 =
78 + 56
= 67
2
83 + 56
X6 =
= 69.5
2
X3 =
! ! =!
[ POLITCNICO GRANCOLOMBIANO ]
(72.5 71) 2 + (80.5 71) 2 + (67 71) 2 + (75 71) 2 + (61.5 71) 2 + (69.5 71) 2
X =
6
6.013
Observamos
que
la
varianza
poblacional
es
diferente
a
la
varianza
de
!,
por
lo
tanto
es
necesario
trabajar
con
una
varianza
corregida,
esto
se
logra
de
la
siguiente
forma:
!!!
!! ! !
! !1
(10,4163)! 4 2
2
41
!!! = 36,1664
!! = 6,013
Podemos
decir
entonces
que
si
se
seleccionan
todas
las
muestras
posibles
de
tamao
n
de
una
poblacin
dada
entonces
se
tiene:
!(!)=
!! ! !
!!! =
y
!
! 1
!!!
El
factor
!!!
se
denomina
factor
de
correccin
por
finitud
y
en
los
casos
de
poblaciones
infinitas
este
factor
se
hace
igual
a
1
es
decir
que
queda
como:
!!! =
!!
!
[ ESTADSTICA INFERENCIAL ]
Si
son
un
conjunto
de
variables
aleatorias
independientes
que
se
distribuyen
idnticamente
con
media
y
varianza
,
entonces
la
variable
aleatoria:
!! =
!!
!!
!
Para
la
cual
es el promedio
Con
lo
anterior
estamos
preparados
para
estudiar
las
distribuciones
muestrales
y
las
caractersticas
de
los
estimadores
puntuales
ms
usados
en
la
inferencia
estadstica.
A
continuacin
se
expondrn
las
variables
aleatorias
(con
sus
distribuciones
de
probabilidad)
que
ms
se
utilizan
para
estimar
los
parmetros
poblacionales
media,
varianza
y
proporcin
y
hacer
inferencias
de
los
mismos.
X
Si
es
la
media
de
una
muestra
aleatoria
de
tamao
n
sacada
de
una
poblacin
distribuida
normalmente
con
media
y
desviacin
X =
estandarizacin
!!
es:
!! =
[ POLITCNICO GRANCOLOMBIANO ]
!!
!!
y por lo tanto la
Ejemplo:
Se
realiz
una
prueba
a
un
grupo
de
ochenta
aspirantes
al
cargo
de
administrador
de
cierta
empresa
y
se
obtuvo
que
las
calificaciones
siguen
una
distribucin
normal
con
calificacin
promedio
de
300
puntos
y
desviacin
estndar
de
20.
Cuando
se
toma
una
muestra
de
diez
y
seis
calificaciones
de
las
pruebas:
a. Cul
es
el
error
tpico
de
la
media
de
muestral?
b. Cul
es
la
probabilidad
de
que
la
media
muestral
sea
superior
a
280
puntos?
Para
responder
cada
literal
utilizaremos
la
teora
dada:
a. La
varianza
muestral
es
( X )2 ,
luego
el
error
tpico
de
la
media
muestral
es:
!
!! =
!
!! =
20
16
= 5
b. Con
base
al
enunciado
debemos
calcular
P ( X > 280)
y
esto
lo
logramos
estandarizando
la
variable
aleatoria
X :
X 280
280
280 300
20
P
>
= P Z >
= P Z >
= P Z >
= P ( Z > 4 )
5
5
X
X
Cabe
resaltar
que
como
la
normal
estndar
es
una
distribucin
para
la
cual
los
valores
de
la
probabilidad
de
una
cantidad
negativa
son
igual
al
valor
de
la
probabilidad
de
la
cantidad
pero
positiva,
es
decir:
[ ESTADSTICA INFERENCIAL ]
Con
lo
cual
decimos
que
la
probabilidad
de
que
la
media
muestral
sea
superior
a
280
en
una
muestra
de
tamao
16
es
casi
nula.
En
otras
palabras
no
es
muy
probable
que
en
una
muestra
de
diez
y
seis
calificaciones
la
media
muestral
sea
mayor
a
280
puntos.
Ejemplo
En
cierta
ciudad
los
gastos
semanales
en
transporte
para
los
habitantes,
estn
distribuidos
normalmente
con
media
de
$16.500
y
una
desviacin
estndar
de
$1.500.
Cul
es
la
probabilidad
de
que
una
muestra
de
veinticinco
personas
tengan
un
gasto
promedio
semanal
superior
a
$15.750.
Vamos
a
identificar
los
datos
que
nos
dan
en
el
problema
y
a
plantear
la
probabilidad
X:
Gastos
semanales
en
transporte:
=$16.500
=$1.500
n
=
25
P
(!>15760)
=
P
!! !
!
!
>
!"#$%!!"#$$
!"##
!"
[ POLITCNICO GRANCOLOMBIANO ]
Ejemplo:
La
duracin
de
cierta
marca
de
bombillas
tiene
una
media
de
900
horas
y
la
desviacin
estndar
de
setenta
horas.
Si
se
selecciona
una
muestra
de
36
bombillas,
determine
la
probabilidad
de
que
dure
entre
870
y
925
horas.
Observe
que
no
se
hace
ninguna
mencin
de
la
forma
funcional
de
la
distribucin,
pero
como
el
tamao
de
muestra
es
grande
(n30),
por
el
teorema
del
lmite
central
entonces
la
distribucin
es
aproximadamente
normal:
X:
tiempo
de
duracin
de
las
bombillas
=900
=
70
n
=
36
P
(870! 925)
=
P
!"#!!""
!"
!"
!! !
!
!
!"#!!""
!"
!"
poblacional desconocida.
Es
muy
comn
el
hecho
de
que
en
la
prctica
de
que
la
varianza
de
la
poblacin
! !
es
desconocida.
En
estos
casos
se
trabaja
con
la
varianza
de
la
muestra
! !
como
una
estimacin
de
! ! ,
dando
lugar
a
una
variable
T
tal
que:
!=
!!
!/ !
[ ESTADSTICA INFERENCIAL ]
El
rea
total
bajo
la
distribucin
t
es
igual
a
1
y
esta
distribucin
se
encuentra
tabulada
para
cada
valor
(n-1)
o
grados
de
libertad
denominados
gl:
La
tabla
de
la
distribucin
t
tiene
la
siguiente
tabla:
La
columna
de
la
izquierda
de
la
tabla
contiene
diversos
valores
de
(n
1)
grados
de
libertad.
Cada
encabezamiento
en
las
columnas
indica
la
proporcin
del
rea
superior
bajo
la
curva
de
la
distribucin
t.
Si
estamos
interesados
por
ejemplo,
en
la
distribucin
t
para
10
grados
de
libertad,
para
un
rea
superior
de
0,05
el
valor
es
t
=
1,8125.
En
la
prctica,
son
muy
utilizadas
las
inferencias
sobre
proporciones
poblacionales.
Por
lo
tanto
la
distribucin
muestral
de
una
proporcin
es
de
gran
inters.
En
un
estudio
de
mercados
se
puede
estar
interesado
en
la
proporcin
o
porcentaje
de
consumidores
que
estaran
dispuestos
a
comprar
algn
producto
nuevo
que
se
piensa
lanzar
al
mercado.
El
jefe
de
personal
puede
estar
interesado
en
conocer
el
porcentaje
de
empleados
que
se
ausentan
en
horas
de
trabajo.
10
[ POLITCNICO GRANCOLOMBIANO ]
Sea
A
el
nmero
total
de
elementos
que
presentan
cierta
caracterstica
en
una
poblacin,
entonces
la
proporcin
de
aquellos
que
cumplen
y
no
cumplen
con
dicha
caracterstica
est
A
NA
dada
por
la
expresin
P =
y
1 P =
respectivamente.
N
N
Si
P
es
la
variable
aleatoria
proporcin
de
individuos
de
una
poblacin
que
presentan
determinada
caracterstica,
entonces
la
proporcin
muestral
se
distribuye
de
la
siguiente
manera:
!(1 !)
!~! !!, !
!
!
proporcin
poblacional
y
!
!(!!!)
!
Obsrvese
que
cada
observacin
de
este
experimento
es
de
tipo
Bernoulli
xito
(cumple
con
la
caracterstica)
y
fracaso
(no
cumple
con
la
caracterstica)
y
como
se
repite
cierto
nmero
de
veces
se
convierte
en
una
Binomial
para
la
cual
el
valor
esperado
de
la
variable
aleatoria
proporcin
de
individuos
con
la
caracterstica
es
P
y
la
varianza
es
P (1 P ) .
Si
el
tamao
de
muestra
es
grande
por
el
teorema
del
lmite
central
esta
binomial
puede
aproximarse
a
una
normal
con
media
P
y
varianza
P (1 P ) .
Para
tamao
de
muestra
pequeo
es
decir
que
cumpla
que
np < 5
o
n(1 p ) < 5
se
tiene
que
la
varianza
y
desviacin
estndar
estn
definidas
de
la
siguiente
manera
) = N n P(1 P)
respectivamente
a
N n
se
le
) = N n P(1 P)
y
Var ( P
Var ( P
N 1
n
N 1
n
N 1
conoce
como
factor
de
correccin
de
poblaciones
finitas:
Ejemplo
Se
sabe
que
el
60%
de
los
adultos
de
una
zona
del
pas
compran
determinado
producto.
Se
obtiene
una
muestra
de
150
adultos
de
esta
rea.
Cul
es
la
probabilidad
de
que
la
proporcin
muestral
este
entre
el
50%
y
el
70%?
[ ESTADSTICA INFERENCIAL ]
11
!! = ! = 0,6 !! =
(!,!)(!,!)
!"#
= 0,04
!,!"!!,!
!,!"
<
!!!
!!
<
!,!!!,!
!,!"
Muchas
veces
el
inters
se
centra
en
dos
poblaciones
de
las
cuales
vamos
a
ver
si
las
medias
poblacionales
no
son
iguales,
o
podemos
estar
interesados
en
la
magnitud
de
cualquier
diferencia
que
se
pueda
presentar,
por
ejemplo
se
podra
estar
interesado
en
conocer
si
dos
lneas
de
produccin
sacan
en
promedio
el
mismo
nmero
de
unidades,
o
si
son
diferentes
dos
mtodos
de
entrenamiento
utilizados
en
el
personal
de
produccin.
Como
una
generalizacin
de
la
distribucin
muestral
para
la
media
se
puede
decir
lo
siguiente:
1.
La
diferencia
muestral
para
la
diferencia
entre
dos
medias
muestrales
a
partir
de
muestras
independientes
de
tamao
n1
y
n2,
extradas
de
dos
poblaciones
distribuidas
normalmente,
estar
distribuida
normalmente
y
tendr
una
media
igual
a
(1
-
2)
y
una
varianza
igual
a
!!
!!
(!! + !! ).
2.
Si
n1y
n2
son
grandes
la
distribucin
muestral
de
la
diferencia
entre
las
dos
medias
muestrales
ser
aproximadamente
normal
sin
tener
en
cuenta
la
forma
funcional
de
las
poblaciones
originales.
Para
encontrar
las
posibilidades
asociadas
a
(!! !! )
se
deben
transformar
los
valores
de
(!! !! )
en
los
valores
de
la
distribucin
normal
estandarizada,
mediante
la
frmula:
!=
!! !! (! ! )
!!!
!!!
!! + !!
12
[ POLITCNICO GRANCOLOMBIANO ]
EJEMPLOS:
1.
La
produccin
diaria
de
una
primera
fbrica
de
envases
de
plstico
tiene
una
distribucin
normal
con
una
media
de
50
unidades
y
una
desviacin
estndar
de
8
unidades.
La
produccin
de
una
segunda
fbrica
esta
distribuida
normalmente
con
una
media
de
cuarenta
unidades
y
una
desviacin
estndar
de
doce.
Para
comparar
el
rendimiento
en
el
trabajo
en
dos
fbricas
de
envases
plsticos
se
saca
de
la
primera
fbrica,
una
muestra
aleatoria
de
100
obreros
y
de
la
segunda
una
muestra
de
400.
Encontrar
la
probabilidad
de
que
los
obreros
de
la
primera
fbrica
produzcan
ocho
unidades
ms
que
los
de
la
segunda.
Solucin:
Primera
Fbrica.
Segunda
Fbrica.
n1 = 10
! = 50
!! = !
n2 = 400 ! = 40 !! = !"
! !! !! > 8 =?
!=
!! !! (! ! )
!!!
!!!
!! + !!
!=
8 (50 40 )
64
144
100 + 400
! = 2
P[Z
>
-2]
=
1
P[Z
-2]
=
1
0,0228
=
0,9772
2.
El
rendimiento
de
los
autos
la
marca.
A
es
de
20
kilmetros
por
galn
de
gasolina
(k.p.g.),
con
una
desviacin
estn
darde
6k.p.g.
las
cifras
comparables
para
los
autos
Bsonde
25
y5,5k.
p.g.
respectivamentes
supone
que
el
rendimiento
dcada
una
de
[ ESTADSTICA INFERENCIAL ]
13
MARCA A MARCA B
Muestra.
n1 = 10
n2 = 9
Media.
1 = 20
2 = 25
Desviacin Estndar.
1 = 6
2 = 5,5
La
probabilidad
que
se
busca
se
plantea
de
la
siguiente
forma:
! !! !! > 0 =?
!=
!! !! (! ! )
!!! !!!
!! + !!
!=
0 (20 25 )
36
30,25
10 + 9
! = 1,81
P
[Z
>
1,81]
=
1
P
[Z
1,81]
=
1
0,9649
=
0,0351
14
[ POLITCNICO GRANCOLOMBIANO ]
La
probabilidad
de
que
el
rendimiento
medio
para
10
autos
de
la
marca
A
sea
mayor
que
el
de
9
autos
de
la
marca
B
es
de
0,0351
BIBLIOGRAFA
FREUND,
John
E.,
MILLER,
Irwin
y
MILLER,
Marylees.
Estadstica
Matemtica
con
aplicaciones.
6ed.
Madrid
Prentice
Hall,
2000.
GUTIERREZ,
Humberto
y
DE
LA
VARA,
Romn.
Control
estadstico
de
Calidad
y
Seis
Sigma
(6s).
Mxico:
McGraw-Hill,
2005.
KENNET,
Ron
S.,
y
ZACKS,
Shelemyahu.
Estadstica
Industrial
Moderna.
Barcelona,
Thomson,
2000.
MONTGOMERY,
Douglas
C.
y
RUNGER,
George
C.
Probabilidad
y
Estadstica
aplicadas
a
la
Ingeniera.
2ed.
Mxico:
Limusa,
2002.
NEWBOLD.
Paul.
Estadstica
para
los
Negocios
y
la
Economa.
4ed.
Madrid
Prentice
Hall,
1988.
WALPOLE
Ronal,
E.,
MYERS,
Raymond
H.
y
MYERS,
Sharon
L.
Probabilidad
y
Estadstica
para
Ingenieros.
6ed.
Madrid
Prentice
Hall,
1998.
[ ESTADSTICA INFERENCIAL ]
15