Tema6 EstadII Profesor2021

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 20

ASIGNATURA: ESTADÍSTICA II

TEMA 6: CONTRASTES NO PARAMÉTRICOS

6.1. Contrastes de bondad de ajuste


6.1.1. Contraste Chi-cuadrado
6.1.2. Contraste de Kolmogorov-Smirnov
6.2. Tablas de contingencia. Contraste de independencia χ2

6.3. Contraste para comparar dos distribuciones independientes:


Contraste de Kolmogorov-Smirnov
OBJETIVOS:

Al finalizar este tema, el alumno será capaz de:

 identificar el método más adecuado para realizar un contraste de bondad de ajuste


dependiendo de la naturaleza de los datos

 realizar un contraste de bondad de ajuste utilizando métodos diferentes en función del tipo
de información disponible

 realizar un contraste de igualdad de dos distribuciones basado en muestras independientes

 decidir, en base a la información muestral, si dos variables cualitativas son independientes


6.1. CONTRASTES DE BONDAD DE AJUSTE
Unos datos (x1,...,xn) de una m.a.s. de una v.a. X ⇒ H 0 : X →F(x;θ)
H 1 : X →F(x;θ)
(1º) H 0 especifica completamente la distribución⇒ejemplo:H 0 :X →N(0,1)
(2º) H 0 especifica forma de la distribución, pero no parámetros⇒ejemplo: H 0 :X→N(µ,σ)

6.1.1. CONTRASTE CHI-CUADRADO (Pearson,1900)


15 12 16 18
12 10 15
12
frequency

frequency

frequency

frequency
8 12
9
6 8 9
6
4 6
3 4
2 3
0 0 0 0
19 29 39 49 59 0 100 200 300 400 0 2 4 6 8 10 12 -10 20 50 80 110 140 170
Precio Superficie Impuestos Años

 Agrupar los datos en k clases excluyentes y exhaustivas A 1 ,...,A k ⇒Ω=UAi, Ai∩Aj=∅


 ni= {nº observaciones en la clase Ai } =frec.observada (Oi) , i=1,…,k ⇒ ∑ik=1 ni =n
 pi= pH 0 (A i ) =p(X∈Ai/H0 es cierta) ⇒ ∑ik=1 pi =1

 Ei=frecuencia esperada de la clase Ai si H0 cierta = E(B(n,pi))=npi ⇒ ∑ik=1 Ei =n ∑ik=1 pi =n


(Oi − E i ) 2 k (ni − npi ) 2
k
 Discrepancias entre lo observado y lo esperado: χ = ∑ 2
=∑
i =1 Ei i =1 npi
k ( n − np ) 2
 Región crítica: C={ χ = ∑ i
2 i
≥λα}
i =1 npi
 Calcular λα tal que pHo(C)=α ⇒ ¿Distribución del estadístico χ2?
k ( n − np ) 2
(1º) H0 especifica completamente la distribución ⇒ χ =∑ i
2 i
~ χ2k −1
i =1 npi n →∞
k ( n − np ˆ i )2
(2º) En H0 hay r parámetros desconocidos (estimarlos) ⇒ χ = ∑
2 i
~ χ2k − r −1
i =1 npˆ i n →∞

¡¡ Buena aproximación si n>30, npi≥5 (algunos autores exigen npi≥1) !!


Si esto no se cumple: reagrupar las clases para que npi≥5
χ2

1-α

λα
Región crítica

OBSERVACIÓN. El nº de clases y la forma de definirlas pueden condicionar los resultados


Ejemplo 1: Casas (1997, p. 530)
En una empresa constructora se ha observado el nº accidentes diarios
ocurridos durante 130 días obteniéndose los siguientes datos (1ª-2ª columnas)
¿ H0 : X→℘(0,9) ?
X= Nº Nº días pi Frec.esp. (ni − npi ) 2
accidentes (ni) npi npi
X=0 69 0,4066 52,9 4,9
X=1 42 0,3659 47,6 0,66
X=2 15 0,1647 21,4 1,91
X=3 4 0,0494 6,4
0 0,0134 1,7 8,1 2,08
X≥4
TOTAL 130 1 130 χ2obs=9,55

 pi= pH 0 (X=i)=p(℘(0,9)=i)=e-0,9 (0,9)i/i!, i=0,1,2,…


 Grados de libertad = k- 1=4-1=3⇒ χ32
 α=0,05 ⇒ χ32 (0,95)=…7,81 ⇒ C={χ2≥ 7,81.} ⇒ ¿Se rechaza H0 al 5%? SI
 α=0,01 ⇒ χ32 (0,99)= 11,3 ⇒ C={χ2≥11,3.} ⇒ ¿Se rechaza H0 al 1%? NO
 p-valor=p( χ32 ≥9,55)=… 0.0228045….
Ejemplo 1: Solución Statgraphics (utiliza parámetros estimados a partir de la muestra)

Ajuste de Distribuciones (Ajuste de Datos No Censurados) - Accidentes


Datos/Variable: Accidentes

130 valores con rango desde 0,0 a 3,0

Distribuciones Ajustadas
Poisson
media = 0,646154

El StatAdvisor
Este análisis muestra los resultados de ajustar una distribución Poisson a los datos de Accidentes.
Los parámetros estimados para la
distribución ajustada se muestran arriba.

Pruebas de Bondad-de-Ajuste para Accidentes


Prueba Chi-Cuadrada
Límite Límite Frecuencia Frecuencia
Inferior Superior Observada Esperada Chi-Cuadrada
menor o igual 0,0 69 68,13 0,01
1,0 1,0 42 44,02 0,09
2,0 2,0 15 14,22 0,04
3,0 4 3,63 0,04
Chi-Cuadrada = 0,184296 con 2 g.l. Valor-P = 0,91197
Ejemplo 2: El servicio de maternidad de un hospital dispone de los pesos al nacer de los últimos
1000 varones nacidos vivos. ¿Se ajustan estos datos a una distribución normal? α=0.01
¿ H0: X→N(µ, σ) ?
 Estimar parámetros ⇒ = X = 3.5; σ
�=Sc= 0.4
X= peso Nº niños p̂i Frec.esp. (ni − npˆ i )
2

ni n p̂i npˆ i
X≤2.5 11 0,0062 6,21 3,695
2.5<X≤3 111 0,0994 99,44 1,344
3<X≤3.5 382 0,3943 394,35 0,387
3.5<X≤3.75 244 0,2340 234,02 0,426
3.75<X≤4 137 0,1603 160,34 3,396
4<X≤4.5 105 0,0994 99,44 0,311
X>4.5 10 0,0062 6,2 2,314
TOTAL 1000 1 1000 χ2obs=11,873
2.5 − 3.5
 p1= pH 0 (X≤2.5)=Φ( 0.4
)=Φ(-2.5)=1-0,9938 = 0,0062…………….
 p2= pH 0 (2.5<X≤3)= Φ(-1.25) - Φ(-2.5)= 0,1056-0,0062 = 0,0994……….
 Grados de libertad = k- r- 1=7-2-1=4⇒ χ 42
 α=0,01 ⇒ χ 42 (0,99)= …13,3 ⇒ C={χ2≥ 13,3….} ⇒ ¿Se rechaza H0 al 1%? NO
 Calcular el p-valor=p( χ 42 ≥11,85)=1-p( χ 42 <11,85)∈(0.01,0.025). STATG: p-valor=0.0185
6.1.2. CONTRASTE DE KOLMOGOROV-SMIRNOV
Compara la función de distribución empírica de la muestra con la función de
distribución teórica bajo H0 (F(x) continua y totalmente especificada)
 Ordenar los datos (x1,x2...,xn) en orden creciente: (x(1) ≤x(2) ≤...≤x(n))
0 si x <x(1)
 Función de distribución empírica: Fn(x) = {n º xi que son ≤ x} = k si x(k)≤x<x(k+1)
n n
Fn(x) es un estimador consistente de F(x) 1 si x > x(n)

 Máxima discrepancia entre distribución empírica y teórica:


Dn=max |Fn(x) – F(x)|
 Región crítica: C={ Dn ≥ λα } ⇒ calcular λα ⇒
Si la distribución está totalmente especificada existen valores críticos exactos. Normalmente la
distribución no está especificada por lo que los valores críticos tienen sólo validez asintótica. Para
algunas distribuciones concretas, como por ejemplo la Normal, existen tablas específicas con valores
críticos válidos para pequeñas muestras.
Cálculo de Dn:
Ejemplo 3: En una m.a.s. sobre la cantidad demandada de un determinado producto, en número de unidades, se
han obtenido los siguientes resultados: 154, 127, 176, 132, 173, 123, 185, 124. ¿Podemos admitir que la cantidad
demandada sigue una distribución Normal? (α=0,05) ⇒ H0: X→N(µ,σ)
Ajuste de Distribuciones (Ajuste de Datos No Censurados) -
Demanda
Histograma para Demanda

Datos/Variable: Demanda 2 Distribución


Normal

8 valores con rango desde 123,0 a 185,0 1,6

frecuencia
1,2
Distribuciones Ajustadas
Normal 0,8

media = 149,25
0,4
desviación estándar = 25,9106
0
110 130 150 170 190
Demanda
Pruebas de Normalidad para Demanda
Prueba Estadístico Valor-P
Chi-Cuadrado 10,0 0,124652
Estadístico W de Shapiro-Wilk 0,853326 0,105233 Gráfico de Cuantiles

1 Distribución
Normal

Pruebas de Bondad-de-Ajuste para Demanda

probabilidad acumulada
0,8

Prueba Chi-Cuadrada
0,6
Límite Límite Frecuencia Frecuencia
Inferior Superior Observada Esperada Chi-Cuadrada 0,4

menor o igual 138,09 4 2,67 0,67


0,2
138,09 160,41 1 2,67 1,04
mayor 160,41 3 2,67 0,04 0

Datos insuficientes para realizar prueba Chi-Cuadrada. 120 140 160


Demanda
180 200

Prueba de Kolmogorov-Smirnov
Normal
DMAS 0,247216
DMENOS 0,195329
DN 0,247216
Valor-P 0,712511

D de Kolmogorov-Smirnov Modificada
Normal
D 0,247216
Forma Modificada 0,771055
Valor-P >=0.10*
*Indica que el Valor-P se ha comparado con tablas de valores críticos especialmente
construidas para ajustar la distribución seleccionada.
6.2. TABLAS DE CONTINGENCIA. CONTRASTE DE INDEPENDENCIA χ2
H0: las características A y B son independientes
Notación:
 A tiene r clases: A1,...,Ar (Ω=UAi,Ai∩Aj=∅)
H0 :p(AiBj)= p(Ai)p(Bj)
 B tiene s clases: B1,...,Bs (Ω=UBj,Bi∩Bj=∅)

Metodología:
 Clasificar las n observaciones en función de A y B⇒tabla de contingencia
A
B
B1 B2 … Bj … Bs
A1 n11 n12 … n1j … n1s n1.
: : : : : :
Ai ni1 ni2 … nij … nis ni.
: : : : : :
Ar nr1 nr2 … nrj … nrs nr.
n.1 n.2 … n.j … n.s n
¡¡ sólo n es fijo, las demás cantidades: nij, ni., n.j son aleatorias !!
( O ij − E ij r s
) 2
 Estadístico: Chi-cuadrado: χ2= ∑ ∑
i =1 j=1 Eij
 Oij =frecuencia observada de AiBj=nij⇒Σnij=n
 pij=p(AiBj/H0 es cierta)= p(Ai)p(Bj)=pi.p.j⇒Σpij=1

 Eij=frecuencia esperada de AiBj=E(B(n,pij))=npij=npi.p.j


n n nn
⇒ Estimar pi., p.j⇒ pˆ i.= ni. , p̂.j = n. j ⇒Eij= n pˆ i pˆ j = i.n . j
n n
r s 2
(Oij − Eij ) r s (nij − i.n . j )2
 Discrepancias observado y esperado: χ2= ∑ ∑ =∑ ∑ ni.n. j
i =1 j=1 E ij i=1 j=1
n
 Región crítica: C={χ2≥λα} tal que α= pH 0 (C)⇒ ¿ distribución de χ2 ?

ni.n . j 2 χ(2r −1)( s −1)


2 r s (n ij −
n
)
χ =∑ ∑ ni.n . j ~ χ 2
( r −1)( s −1)
i=1 j=1 n →∞
n α
1-α

Región Aceptación λα Región crítica


Ejemplo 4: Canavos (2001) Una empresa evalúa una propuesta de fusión con una
corporación. El consejo de dirección desea conocer la opinión de los accionistas al
respecto para ver si ésta es independiente del nº de acciones que cada uno posee.
Una m.a.s. de 250 accionistas proporciona esta información:
Nº acciones A favor En contra Indecisos Total
<200 38 29 9 76
(30,4) (39,52) (6,08)
200-1000 30 42 7 79
(31,60) (41,08) (6,32)
32 59 4
>1000 95
(38) (49,4) (7,60)
100 130 20 250
2
3 3 (O − E )
χ2obs= ∑ ∑ ij ij =…..+ (59 −4949,4,4) + (4 −77,6,6) =10,8
2 2

i =1 j=1 Eij
 Grados de libertad=(r-1)(s-1)=4 ⇒ Distribución χ 24

 Si α=0,1 ⇒ χ 24 (0,9)=7,78 ⇒ C={χ2≥7,78} ⇒ ¿Se Rechaza H0 al 10%? SI


Ejemplo 4:

Tabla de Frecuencias
A favor En contra Indecisos Total por Fila
<200 38 29 9 76
30,40 39,52 6,08 30,40%
200-1000 30 42 7 79
31,60 41,08 6,32 31,60%
>1000 32 59 4 95
38,00 49,40 7,60 38,00%
Total por Columna 100 130 20 250
40,00% 52,00% 8,00% 100,00%
Contenido de las celdas:
Frecuencia Observada
Fecuencia Esperada

Pruebas de Independencia
Prueba Estadístico Gl Valor-P
Chi-Cuadrada 10,796 4 0,0290
6.3. CONTRASTE PARA COMPARAR DOS DISTRIBUCIONES
INDEPENDIENTES: CONTRASTE DE KOLMOGOROV-SMIRNOV
(X1,..., X n1 ) m.a.s. de una distribución FX continua
independientes
(Y1,... ,Yn2 ) m.a.s. de una distribución FY continua
H0 : FX(x)=FY(x)
H1 : FX(x)≠FY(x)
 Comparar funciones de distribución empíricas
𝐹𝐹𝑛𝑛1 = Función de distribución empírica de X
𝐹𝐹𝑛𝑛2 = Función de distribución empírica de Y
 Estadístico de contraste: Dn1, n2 =max |Fn1 (x) - Fn2 (x)|
 Región crítica: C={𝐷𝐷𝑛𝑛1, 𝑛𝑛2 ≥λα}⇒Calcular λα/ pH 0 (C)=α
Existen tablas que proporcionan los valores críticos.
Ejemplo 5: ventas diarias de dos vendedores durante 8 días elegidos al azar:
A: 10, 7,12, 15, 4, 2, 7, 10 X: Ventas diarias vendedor A
B: 3, 5, 16, 9, 9, 13, 6, 5 Y: Ventas diarias vendedor B
¿Son ambos vendedores igualmente eficientes?
H0 : FX(x)=FY(x)
H1 : FX(x)≠FY(x)
Muestra Valores Fn1 (x) Fn2 (x) |Fn1 (x) - Fn2 (x)|
A 2 1/8 0 1/8
B 3 1/8 1/8 0
A 4 2/8 1/8 1/8
B,B 5 2/8 3/8 1/8
B 6 2/8 4/8 2/8
A,A 7 4/8 4/8 0
B,B 9 4/8 6/8 2/8
A,A 10 6/8 6/8 0
A 12 7/8 6/8 1/8
B 13 7/8 7/8 0
A 15 1 7/8 1/8
B 16 1 1 0

α=5%: C={𝐷𝐷𝑛𝑛1 ,𝑛𝑛2 ≥0,75}. 𝐷𝐷𝑛𝑛1 ,𝑛𝑛2 =0,25∉C ⇒ No Rechazo H0


Ejemplo 5: Solución Statgraphics
Prueba de Kolmogorov-Smirnov
Estadístico DN estimado = 0,25
Estadístico K-S bilateral para muestras grandes = 0,5
Valor P aproximado = 0,963945

Gráfico Caja y Bigotes

0 4 8 12 16

Gráfico de Cuantiles

1 Variables
A
B
0,8

proporción
0,6

0,4

0,2

0
0 4 8 12 16
BIBLIOGRAFÍA BÁSICA
Canavos, G.C. (2001), Probabilidad y estadística: aplicaciones y
métodos, Madrid: McGraw-Hill.
Capítulo 10
Casas, J.M. y P. Gutiérrez (2011), Estadística II. Inferencia Estadística.
Edición revisada. Madrid: Centro de Estudios Ramón Areces.
Capítulo 7

BIBLIOGRAFÍA COMPLEMENTARIA:
Casas, J.M. (1997), Inferencia estadística (incluye ejercicios resueltos).
2ª ed. Madrid: Centro de Estudios Ramón Areces.
Capítulo 7
Peña, D. (2008), Fundamentos de estadística, Madrid : Alianza.
Sección 12.2

*También pueden consultarse las ediciones de años anteriores de los mismos libros

También podría gustarte