Conceptos Estadísticos

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 36

EXPERIMENTOS

COMPARATIVOS
SIMPLES
CAPITULO 2
Diseo y Anlisis de Experimentos
Montgomery

INTRODUCCION
Aqu se examinaran los experimentos para
comprobar dos condiciones (llamadas en
ocasiones tratamientos), a las cuales es
comn denominar experimentos
comparativos simples.
A travs del anlisis de un experimento
para determinar si dos formulaciones
diferentes de un producto, producen
resultados equivalentes, se revisarn
varios conceptos bsicos de la estadstica.
Experimentos
Comparativos Simples

Formulacin del Experimento

La fuerza de la tensin de la adhesin del mortero de cemento


portland es una caracterstica importante del producto. Un ingeniero
est interesado en comparar la fuerza de una formulacin
modificada en la que se han agregado emulsiones de ltex de
polmeros durante el mezclado, con la fuerza del mortero sin
modificar. El experimentador ha reunido 10 observaciones de la
fuerza de la formulacin modificada y otras 10 observaciones de la
formulacin sin modificar. Los datos se muestran a continuacin.
Podra hacerse referencia a las dos formulaciones diferentes como
dos tratamientos o como dos niveles del factor formulaciones.

Experimentos
Comparativos Simples

Conceptos Estadsticos Bsicos


Descripcin grfica de la variabilidad diagrama de puntos.
Es frecuente usar grficos simples como ayuda para
analizar los datos de un experimento. El diagrama de
puntos que se muestra a continuacin es un recurso
muy til para representar un cuerpo reducido de
datos (digamos hasta unas 20 observaciones).
El diagrama de punto le permite al experimentador
ver de inmediato la localizacin o tendencia central
de las observaciones y su dispersin.
15

16

17
y1=16.76

18
y2=17.92

Fuerza (kgf/cm2)

19

20

Mortero Modificado
Mortero sin modificar

Diagrama de puntos de los datos de la fuerza de la tensin de adhesin del experimento


Experimentos
Comparativos Simples

Conceptos Estadsticos Bsicos (continuacin)


Descripcin grfica de la variabilidad histograma.
Cuando los datos son muy numerosos, es difcil distinguir las
observaciones graficadas en un diagrama de puntos, y en tal caso
sera preferible un histograma.
El histograma muestra la tendencia central, la dispersin y la forma
general de la distribucin de los datos.
20
18
16
14
12
10
8
6
4
2
0

Experimentos
Comparativos Simples

Conceptos Estadsticos Bsicos (continuacin)


Descripcin grfica de la variabilidad Diagrama de Caja (o
diagrama de caja y bigotes)

Fuerza de la Tensin de Adhesin (kgf/cm2)

En un diagrama de caja se muestra el mnimo, el mximo, los cuartiles


inferior y superior (el percentil 25 y el percentil 75, respectivamente) y la
mediana (el percentil 50) en una caja rectangular alineada horizontal o
verticalmente.
La caja se extiende del cuartil inferior al cuartil superior y se traza una
lnea por la mediana que atraviesa la caja.
Se trazan dos lneas o bigotes que se extienden de los extremos de la
caja hasta los valores mnimo y mximo.
Box-and-Whisker Plot (Diagramas de Caja y Bigotes)
18.4
18
17.6
17.2
16.8
16.4
16
Modificado
Sin Modificar
Formulacin del Mortero

Experimentos
Comparativos Simples

Conceptos Estadsticos Bsicos (continuacin)


Distribucin de Probabilidad
La estructura de la probabilidad de una variable aleatoria, por
ejemplo y, se describe mediante una distribucin de
probabilidades.
Cuando es discreta, la distribucin de probabilidad se designa por
p(y) y se denomina como funcin de probabilidad de y.
Cuando es continua, la distribucin de probabilidad se designa por
f(y) y se denomina como la funcin de densidad de y.
p(y)

f(y)
P(y = yj) = p(yj)

y1 y3 y5 y7 y9 y11 y13
y2 y4 y6 y8 y10 y12 y14
Distribucin discreta

P ( a y b)

a b
Distribucin continua

Conceptos Estadsticos Bsicos (continuacin)

Media, Varianza y Valor Esperado

A continuacin, se define el operador de la


Varianza V:

V ( y) E y
2

Experimentos
Comparativos Simples

Muestreo y Distribuciones de muestreo


Media Muestral, Varianza muestral y Desviacin
estndar muestral. El objetivo de la inferencia estadstica es
sacar conclusiones acerca de una poblacin utilizando una
muestra de la misma.
n

y
i 1

S
2

( y y)
i 1

n 1

S S

Suma de cuadrados de las observaciones Yi

SS y y
n

i 1

Grados de libertad; v

v n 1

Experimentos Comparativos
Simples

Muestreo y Distribuciones de Muestreo


La distribucin Normal y otras distribuciones de muestreo.

1
f ( y)
e 1/ 2 ( y ) /
2

Un caso especialmente importante de la distribucin


normal es la Distribucin Normal Estndar; es decir, = 0
y 2 = 1. Se observa que si Y~N(,), la variable aleatoria

y
z

sigue la distribucin normal estndar, denotada z~N(0,1).


Experimentos Comparativos
Simples

Muestreo y Distribuciones de muestreo


Teorema del lmite central
Si y1,y2,.,yn es una sucesin de n variables aleatorias
independientes que tienen una distribucin idntica con
E(yi) = y V(yi) = y x = y1+y2..+yn, entonces:

zn

x n
n

tiene una distribucin N(0,1) aproximada en el sentido de


que, si Fn(z) es la funcin de la distribucin de zn y (z)
es la funcin de la distribucin de la variable aleatoria
N(0,1), entonces lmn--> [Fn (z)/ (z)] =1
Experimentos Comparativos
Simples

Muestreo y Distribuciones de muestreo


Teorema del lmite central (continuacin)
Este resultado establece en esencia que la suma de n
variables aleatorias independientes que tiene una
distribucin idntica sigue una distribucin
aproximadamente normal.
En muchos casos esta aproximacin es adecuada para
valores muy pequeos de n, digamos n<10, mientras
que en otros casos se necesita un valor grande de n,
digamos n>100.
Frecuentemente se considera que el error de un
experimento surge de una manera aditiva de varias
fuentes independientes; por consiguiente, la
distribucin normal se convierte en un modelo
recomendable para el error experimental combinado.
Experimentos Comparativos
Simples

Conceptos Estadsticos Bsicos (continuacin)


Distribucin Ji-cuadrada: Si z1,z2 ,...,zk son variables
aleatorias con distribucin normal NID(0,1), entonces
x = z21 + z22 + ...+ z2k
sigue una distribucin ji-cuadrada con k grados de libertad.
Su funcin de densidad es:

1
f ( x)
e
x>0
k
2
2
En la siguiente figura se ilustran varias distribuciones
ji-cuadrada.
K=1 K=3
K=5
La distribucin es
K=10
asimtrica o sesgada
con media y varianza
=k
2 = 2k
k / 2 1

k /2

x / 2

Conceptos Estadsticos Bsicos (continuacin)


Como un ejemplo de una variable aleatoria que sigue la
distribucin ji-cuadrada, suponga que y1, y2,,yn es
una muestra aleatoria de una distribucin N(2).
Entonces:

Es decir, SS/2 sigue una distribucin ji-cuadrada con n


-1 grados de libertad.

Conceptos Estadsticos Bsicos (continuacin)


Distribucin F
Si

son dos variable aleatorias ji-cuadrada

independientes con grados de libertad u y v,


entonces la relacin

Sigue una distribucin F con u gdl en el numerador y


gdl en el denominador.

Luego
Done S21 y S22 son las dos varianzas muestrales.
Experimentos
Comparativos Simples

Inferencias acerca de las diferencias en


las medias, diseos aleatorizados
Prueba de Hiptesis

Hiptesis Estadstica: Es un enunciado o


afirmacin ya sea acerca de los parmetros de
una distribucin de probabilidad o de los
parmetros de un modelo.
La hiptesis refleja alguna conjetura acerca de la
situacin del problema.
Por ejemplo, en el experimento del cemento
portland puede pensarse que las fuerzas de la
tensin de adhesin promedio de las dos
formulaciones del mortero son iguales.
Esto puede enunciarse formalmente como:
H0: 1 = 2
H1: 1 2
Experimentos
Comparativos Simples

Inferencias acerca de las diferencias en las


medias, diseos aleatorizados (continuacin)
Tipos de Error
= P (Error Tipo I) = P (Rechazar H0 | H0 es
verdadera)
= P (Error Tipo II) = P (No rechazar H0 | H0 es
falsa)
En ocasiones es ms conveniente trabajar con la
potencia de la prueba, donde
Potencia = 1 = P (Rechazar H0 | H0 es falsa)
El procedimiento general en la prueba de hiptesis es:

especificar un valor de la probabilidad del error tipo I,


llamada con frecuencia el nivel de significacin de la
prueba, y
despus disear el procedimiento de prueba de tal
modo que la probabilidad del error tipo IIExperimentos
tenga un valor
convenientemente pequeo.
Comparativos Simples

Inferencias acerca de las diferencias en las


medias, diseos aleatorizados (continuacin)
La prueba t de dos muestras. Considere que puede suponer que las
varianzas de las fuerzas de la tensin de adhesin fueron idnticas para ambas
formulaciones del mortero. En este caso el estadstico de prueba que deber
usarse para comparar las medias de los tratamientos en el diseo
completamente aleatorizado es
y1 y 2

t
0

1
1

n n
1

Sp es una estimacin de la varianza comn 1


calculada a partir de:
(n 1) S 2 (n 1) S 2

S p2

22 2

n1 n2 2

S21 y S22 son las dos varianzas muestrales individuales. Para determinar si
deber rechazarse H0: 1 = 2, se comparar t0 con la distribucin t con n1 + n2 2
t
0 t / 2 , n1 n2 2
grados de libertad. Si
, donde / 2 , n1 n2 2 es el punto porcentual
/2 superior de la distribucin t con n1 + n2 2 grados de libertad, entonces se
rechazara H0. A este procedimiento se le llama prueba t de dos
muestras.
Experimentos
Comparativos

Simples

Inferencias acerca de las diferencias en las


medias, diseos aleatorizados (continuacin)
Para ilustrar el procedimiento, considere los datos del
cemento portland y con base en ellos se encuentra que:

Puesto que las desviaciones estndar muestrales son


razonablemente similares, no es improcedente concluir que
las desviaciones estndar (o las varianzas) poblacionales
son iguales.
Experimentos Comparativos
Simples

Inferencias acerca de las diferencias en las medias,


diseos aleatorizados (continuacin)
Se tiene que n1 + n2 2 = 10 + 10 - 2 = 18, y si se elige
= 0.05 entonces la hiptesis nula se rechazara si el
valor del estadstico de prueba t > t
= 2.101, o si
t
< -t
= -2,101.
0

0.025,18

0.025,18

(n1 1) S12 (n2 1) S 22


S
n1 n2 2

2
p

y y
1
1

S
n n
1

Aplicando la frmula de Sp anterior, el resultado es 0.284


y el estadstico de prueba to es igual a -9.13.
Puesto que t = -9.13 < -t
= -2,101, se rechazara la
hiptesis nula y se concluye que las fuerzas de tensin
de adhesin promedio de las dos formulaciones del
Experimentos Comparativos
Simples
mortero son diferentes.
0

0.025,18

Inferencias acerca de las diferencias en las


medias, diseos aleatorizados (continuacin)
Eleccin del tamao de muestra: Curva de
operacin caracterstica Curva OC.
d

| 1 2 | | | Parmetro del eje horizontal de la curva OC

2
2 El eje vertical en la probabilidad de aceptar H
0

Para tener en cuenta

1. Entre ms grande sea la diferencia en las medias, 1 2 , menor ser


la probabilidad del error tipo II para un tamao de la muestra y un valor de
dados.
2. Cuando el tamao de la muestra se hace ms grande, la probabilidad del
error tipo II se hace mas pequea para una diferencia en las medias y un
valor dados.

Experimentos Comparativos
Simples

Inferencias acerca de las diferencias en las medias,


diseos
aleatorizados
(continuacin)
Intervalos
de confianza
Supongamos que es un parmetro. Para obtener
una estimacin de es necesario encontrar dos
estadsticos L y U tales que:
P( L U ) 1

Sea verdadera. Al intervalo:

L U

Se le llama intervalo de confianza de 100(1 - ) por


ciento para el parmetro .
La estimacin real del intervalo de confianza de 95%
para la diferencia en la fuerza de la tensin de
adhesin del mortero es:

y y t
1

/ 2 , n1 n2 2

1 1
y y t
n n
1

/ 2 , n1 n2 2

1 1

n n
1

Experimentos Comparativos

Inferencias acerca de las diferencias en las


medias, diseos aleatorizados (continuacin)
16,76 17,92 (2,101)0,284

1 1
1 1
1 2 16,76 17,92 (2,101)0,284

10 10
10 10

Desarrollando la formula:

1,43 1 2 0,89

Por tanto, el intervalo de confianza de 95% estimado para la


diferencia en las medias se extiende de
-1.43kgf/cm a -0.89kgf/cm.
Caso en que 12 22
H O : 1 2
Si se est probando
y no hay bases para
H 1 : 1 2
suponer que las varianzas son iguales. El estadstico de
y1 y 2
prueba es:
t
o

S
S

n
n
2

2
2

Experimentos Comparativos
Simples

Inferencias acerca de las diferencias en las medias,


diseos aleatorizados (continuacin)
2

S
S

n
n
v
S

Con

n
n

n 1
n 1
2

grados libertad.

Caso en que se conocen 12 y 22


Si las varianzas se conocen, entonces las hiptesis
H O : 1 2
H 1 : 1 2

Z
O

se prueban con el estadstico:

y y
1

2
1

y y Z
1

y y Z
n
n
1

/2

/2

2
2

n
n
2

Y su intervalo2de confianza
es:
2

Experimentos Comparativos

Grados de Libertad
En estadstica,
grados de libertad es un
estimador
del
nmero
de
categoras
independientes en un test particular o
experimento estadstico. Se encuentran mediante
la frmula n-r, donde n=nmero de sujetos en la
muestra (tambin pueden ser representados por
k-r donde k=nmero de grupos, cuando se
realizan operaciones con grupos y no con sujetos
individuales) y r es el nmero de sujetos o grupos
estadsticamente dependientes.

Grados de Libertad
Cuando se trata de ajustar modelos
estadsticos a un conjunto de datos, los
residuos -expresados en forma de vectorse encuentran habitualmente en un
espacio de menor dimensin que aqul en
el que se encontraban los datos originales.
Los grados de libertad del error los
determina, precisamente, el valor de esta
menor dimensin.

Inferencias acerca de las diferencias en las medias,


diseos aleatorizados (continuacin)
Comparacin de una sola media con un valor
especificado por o. Las hiptesis son:
H O : 1 2
H 1 : 1 2

El estadstico de prueba es:


Y O
ZO
/ n

Con un intervalo de confianza:

yZ / n yZ / n
/2

/2

Experimentos Comparativos
Simples

EJEMPLO
Un proveedor ofrece lotes de tela a un fabricante de
textiles. El fabricante desea saber si la resistencia a la
ruptura promedio excede 200 psi. De ser as, el
fabricante aceptar el lote. La experiencia pasada
indica que un valor razonable para la varianza de la
resistencia a la ruptura es 100 (psi). Las hiptesis que
debern probarse son:
H0: = 200
H1: > 200
Experimentos Comparativos
Simples

SOLUCIN
Se observa que la hiptesis alternativa es de una cola,
por tanto, el lote se aceptar solo si la hiptesis nula
H0: = 200 pudiera rechazarse, es decir si Zo > Z.
Se seleccionan cuatro ejemplares aleatoriamente, y la
resistencia a la ruptura promedio observada es y 214 psi
El valor del estadstico
prueba
y 0 de214
200es:
Z0

2.80

10
n

Experimentos Comparativos
Simples

SOLUCIN
Si se especifica un nivel de significancia o
error tipo I de = 0.05, se encuentra en la
tabla de la distribucin normal que
Z = Z0.05 = 1.645. Por tanto, se rechaza Ho
y se concluye que la resistencia a la
ruptura promedio del lote excede 200 psi.
Experimentos Comparativos
Simples

Inferencias acerca de las diferencias en las medias,


diseos de comparaciones pareadas

El problema de las comparacin


pareadas
En el experimento de dureza se toma una
sola barra y se realizar en cada punta el
ensayo, esto para evitar la variabilidad del
material (metal).
La dureza promedio de las dos muestras
podra compararse utilizando la prueba t.
Experimentos Comparativos
Simples

Probar H0: u1 = u2 es equivalente aprobar


Ho: ud = 0
H1: ud = 0
Con un = 0.05 entonces para tomar una
decisin se calculara to, y se rechazara
Ho si |to| > t0.025, 9 = 2.262

to

~
d

sd

0.10

0.26
n 1.20 10

La hiptesis Ho no se puede rechazar


Experimentos Comparativos
Simples

Desviacion muestral de las diferencias

1
d

j
1
j
n 1
n 1
n

sd

to

sd

~
d

2 1/ 2

1/ 2

1
2
13 1
10

10 1

1.20

~ 1 n
0.10
1

0.26 donde d d j 1 0.10


n 1
10
n 1.20 10
Experimentos Comparativos
Simples

Inferencias acerca de las varianzas de


distribuciones normales
En algunos experimentos es importante la
comparacin de la variabilidad en los datos.
Por ejemplo en la industria de alimentos y
bebidas, es importante que la variabilidad del
equipo de llenado sea pequea para garantizar
que todos los empaques estn cerca del peso
neto nominal o el volumen del contenido neto
nominal.
Experimentos Comparativos
Simples

A diferencia de las pruebas paras las medias, los


procedimientos para las pruebas de varianza son
bastante mas sensibles.
Para cuando se quiere probar la hiptesis de que la
varianza de una poblacin normal es igual a una
2
constante, por ejemplo, 2 se tiene:
2

( n 1) S
H :

si
H :

Y su intervalo de confianza es:


o

/ 2 , n 1

(n 1) S
(n 1) S

1 / 2 , n 1

/ 2 , n 1

1 / 2 , n 1

Experimentos Comparativos
Simples

Para cuando se quiere probar la hiptesis de


igualdad de las varianza de dos poblaciones
normales se tiene:
Ho : 2
2
1

H1 : 2
2
1

F0 F / 2,n1 1, n

2
1

S
F0 2
S 2

2 1

F0 F1 / 2,n1 1, n

2 1

Y su intervalo de confianza es:


S1
1 S1
F
2 2 F / 2,n2 1,n1 1
2 1 / 2 , n2 1, n1 1
S2
2 S2
2

Experimentos Comparativos
Simples

También podría gustarte