Pruebas Atipicidad-Consistencia
Pruebas Atipicidad-Consistencia
Pruebas Atipicidad-Consistencia
VALORES ATPICOS
Se definen como observaciones tan separadas en valor del resto ( universo del
valores) que sugieren que pueden ser parte de un grupo diferente , el resultado de
un error de medicin o la exactitud no conseguida por el procedimiento de prueba.
Un dato atpico (outlier) es un registro mayor o menor de lo esperado que se
detecta por tener un residuo que es un valor inusual, muy grande o muy pequeo
en relacin con la distribucin asociada a los residuos.
Sea : x1, x2, x3, , xn, una muestra aleatoria de n observaciones de una poblacin
univariante, siendo la media muestral
y s la desviacin estndar muestral
Se sospecha que una de sus observaciones , la mayor o la menor de la muestra,
es un dato atpico, en otras palabras, el valor registrado es anormalmente grande o
pequeo.
Se debe realizar una prueba de contraste para detectar el dato atpico.
La presencia de un valor anmalo puede alterar sensiblemente las conclusiones de
un anlisis estadstico.
Como ayuda a la decisin sobre si un dato es o no atpico , se dispone de :
la prueba de Cochran
la prueba de Grubbs
Prueba de Cochran
El criterio de Cochran aplica solamente cuando todas las desviaciones estndar se
obtiene del mismo nmero (n) de resultados de prueba obtenidos bajo condiciones
de repetibilidad.
Evala el valor ms alto en un grupo de desviaciones estndar y es por lo tanto
una prueba sesgada.
La prueba estadstica de Cochran se realiza mediante el estadstico Ci que es
calculado segn la expresin:
2
C =
i
L max
s
i =1
2
L ,i
donde :
2
L max
2
L ,i
s L2,i =
( xk x i ) 2
k =1
n 1
max | x x |
G=
s
i
sr =
1 p 2
s L ,i
p i =1
Pr(t > k ) =
n2
2n
laboratorio
1
nivel
j
q-1
q-1
1
2
i
yijk
Tabla B
laboratorio
1
nivel
j
1
2
i
y ij
Tabla C
laboratorio
1
nivel
j
q-1
1
2
i
sij
hij =
y ij y j
p
j
_
1
( y ij y j ) 2
p j 1 i =1
Donde :
La media de la celda se calcula mediante la expresin:
_
y ij =
La media para el nivel j se calcula mediante la expresin:
1
nij
nij
y
k =1
ijk
yj =
n
i =1
ij
y ij
n
i =1
ij
Para la evaluacin se compara el valor de h calculado para cada laboratorio por nivel
con el correspondiente valor de h crtico obtenido de tablas para el nivel de
significacin establecido. Ver Tablas 1 y Tabla 2
En forma prctica se realiza la evaluacin al graficar los valores de hij para cada celda
por laboratorio, en grupos para cada nivel.
Evaluacin de k de Mandel
Se calcula el estadstico k para dentro del laboratorio
Se calcula la desviacin estndar combinada dentro de la celda
pj
s
i =1
2
ij
pj
para cada nivel , y luego se calcula
k ij =
s ij
pj
sij2
i =1
s ij p j
pj
s
i =1
2
ij
pj
para cada laboratorio dentro de cada nivel
Para la evaluacin se compara el valor de k calculado para cada laboratorio por nivel
con el correspondiente valor de h crtico obtenido de tablas para el nivel de
significacin establecido. Ver Tabla 1 y Tabla 2
En forma prctica se realiza la evaluacin al graficar los valores de kij para cada celda
en orden de laboratorio, en grupos para cada nivel.