La Prueba Chi-Cuadrado
La Prueba Chi-Cuadrado
La Prueba Chi-Cuadrado
TABLA DE CONTENIDO
INTRODUCCION_______________________________________________________________2
OBJETIVOS____________________________________________________________________3
MARCO TEORICO______________________________________________________________4
DISTRIBUCION CHI- CUADRADO. (χ ²)___________________________________________5
PRUEBAS DE BONDAD DE AJUSTE.______________________________________________5
Definición..................................................................................................................................................5
Prueba para un ajuste uniforme..............................................................................................................8
Prueba de ajuste a un patrón especifico................................................................................................10
Prueba de Normalidad...........................................................................................................................11
Utilizando la formula (1.1) se tiene que:...............................................................................................16
(20-22.8)2 (142-135.9)2 (310-341.3) 2 (370-341.3) 2 (128-135.9) 2 (40-22.8 ) 2 ........................16
χ 2=---------- + ----------- + ------------ + ------------- + ----------- + ----------...........................................16
22.8 135.9 341.3 341.3 135.9 22.8..............................................16
Tablas de Contingencia..........................................................................................................................17
Atributo B – Ubicación...........................................................................................................................................18
Atributo B - Ubicación...........................................................................................................................................19
CONCLUSION_________________________________________________________________20
BIBLIOGRAFIA_______________________________________________________________21
ANEXOS______________________________________________________________________22
TABLA E – DISTRIBUCION NORMAL............................................................................................22
TABLA H – DISTRIBUCION CHI-CUADRADO..............................................................................23
2
INTRODUCCION
OBJETIVOS
2
2. Aprender a aplicar la prueba χ para diferentes supuestos o
hipótesis de acuerdo a los datos obtenidos.
MARCO TEORICO
Definición.
Medidas sobre que tan cerca se ajustan los datos muestrales observados a
una forma de distribución particular planteada como hipótesis. Si el ajuste es
razonablemente cercano, puede concluirse que si existe la forma de distribución
planteada como hipótesis.
Las tomas de decisiones en los negocios muchas veces requiere que se pruebe
alguna hipótesis sobre una distribución poblacional desconocida. Por ejemplo, se
puede plantear la hipótesis que la distribución poblacional es uniforme y que todos
los valores posibles tienen la misma probabilidad de ocurrir. Las hipótesis que se
probarían son:
6
k (Oi - Ei)²
χ ²= Σ --------------- (1.1)
i=1 Ei
en donde
2
El valor 1.17 se compara con un valor critico de χ tomando de la tabla H
(ver anexo). Debido a que no existen parámetros que tengan que estimarse, m=0 y
entonces los grados de libertad según su formula es igual a 4-0-1 = 3 grados de
2
libertad. Si Chris deseara probar al nivel del 5%, se encontraría que χ 0.05,3 > 7.815
En el ejemplo anterior, Chris asumió que la demanda de los cuatro tipos era la
misma. Los valores para la frecuencia esperada eran por ende las mismas. Sin
embargo, si los valores de los cuatro tipos de botes deben probarse contra un patrón
determinado, en el cual las frecuencias esperadas vienen dadas por un patrón
individual para cada categoría, tendríamos que realizar la prueba para un patrón
especifico dado. En este caso Ei se determina por Ei = npi, en donde pi es la
probabilidad individual de cada categoría y n es el tamaño de la muestra. Si
deseamos probar que las ventas reales se ajustan a las probabilidades dadas en la
tabla 1.2, teniendo probabilidades de 30%, 20%, 40% y 10% para cada una de las
categorías respectivamente, entonces debemos proceder como sigue:
TABLA 1.2
Tipo de Bote Ventas Observadas(Oi) Ventas Esperadas(Ei)
Pirate's Revenge 15 14.40
Jolly Roger 11 9.60
Bluebeard's Treasure 10 19.20
Ahab's Quest 12 4.80
48 48
2
El valor 15.41 se compara con el valor critico de χ tomado de la tabla H (Ver
anexo). De nuevo no existen parámetros que tengan que estimarse, m = 0 y
entonces los grados de libertad según su formula es igual a 4-0-1=3 grados de
libertad. De la misma manera deseamos probar al nivel del 5%, se encontraría que
2
χ 0.05,3 > 7.815
Prueba de Normalidad
TABLA 1.3
PSI Frecuencia Real
0 y por debajo de 580 20
580 y por debajo de 590 142
590 y por debajo de 600 310
600 y por debajo de 610 370
610 y por debajo de 620 128
620 y por encima 30
Total 1,000
Igual que antes, la prueba requiere comparar estas observaciones reales con
las que esperaríamos encontrar si prevaleciera la normalidad. Para encontrar las
frecuencias esperadas debemos calcular las probabilidades de que los tanques
seleccionados aleatoriamente tengan los niveles de contenido en los intervalos
presentados en la tabla 1.3.
X-µ
Z=---------
σ
-2 0
580 – 600
Z=------------ = -2 O UN AREA DE 0.4772 (a)
10
b) La probabilidad de (580<X<590)
13
X-µ
Z=---------
σ
-2 -1 0
590 - 600
Z=------------- = -1 O UN AREA DE 0.3413 (b)
10
Entonces:
c) La probabilidad de P(590<X<600)
-1 0
14
d) La probabilidad de P(600<X<610)
X-µ
Z=----------
σ
610 – 600 0 1
Z=--------------- = 1 O UN AREA DE 0.3413
10
e) La probabilidad de (610<X<620)
X-µ
Z=----------
σ
610 – 600 0 1 2
Z=------------ = 1 O UN AREA DE 0.1359
10
Dado que P(620) = P(580) y P(610) = P(590) por que están a la misma distancia de
la media z=0. Entonces por simetría podemos usar los mismos valores de z y las
mismas probabilidades dados en (2).
P(610<X<620) = P(X<610) – P(X<620) = 0.4772 – 0.1359 = 0.3413 (5)
15
f) La probabilidad de P(X>620)
X-µ
Z=----------
σ
620 – 600 0 2
Z=------------- = 2 O UN AREA DE 0.4772
10
Se desea probar la hipótesis al nivel del 5%. Debido a que tanto la media como la
desviación estándar son dadas y no tienen que estimarse, m=0. Existen k=6 clases,
de manera que los grados de libertad son k-0-1=5. El valor critico de χ 2
en χ 2
0.05,5
=11.07
Completamos los datos en la tabla 1.4 con los resultados anteriores y calculamos los
valores esperados Ei = npi.
16
TABLA 1.4
PSI Frecuencia Probabilidades Frecuencia esperada
Real (pi) (Ei)
0 y por debajo de 580 20 0.0228 22.8
580 y por debajo de 590 142 0.1359 135.9
590 y por debajo de 600 310 0.3413 341.3
600 y por debajo de 610 370 0.3413 341.3
610 y por debajo de 620 128 0.1359 135.9
620 y por encima 30 0.0228 22.8
1000 1.000 1000
χ 2
=8.63
2
muestreo por debajo del nivel elegido, ya que el valor de χ es inferior con respecto
al valor maximo esperado para una muestra distribuida de acuerdo a la distribucion
normal.
17
Tablas de Contingencia
Cuando estamos ante una tabla en la que las frecuencias que observamos
ocupan una sola fila, entonces decimos que estamos ante una tabla de clasificación
de entrada única o tabla 1 x c (Se lee 1 por c).
SUCESO E1 E2 E3 .... EK
Frecuencia observada o1 o2 o3 ok
Frecuencia esperada e1 e2 e3 ek
k (Oi - Ei)²
χ ²= Σ ---------------
i=1 Ei
Como antes, el estadístico (1.1) tiene una distribución muestral dada. El numero
de grados de libertad, v, de esta distribución Chi-cuadrado viene dado por c>1 y k>1
por:
Una hipótesis común es suponer que las dos clasificaciones son mutuamente
independientes.
18
TABLA 1.5
Atribut
Atributo A - Clasificación Urbano
o Rural Total
Oi Ei Oi Ei
Por encima del Promedio 20 23.3 11 7.75 31
Promedio 40 36.0 8 12.0 48
Por debajo del Promedio 15 15.8 6 5.25 21
Total 75 25 100
CONCLUSION
Después de haber cumplido con los objetivos trazados al inicio de este trabajo,
podemos comprender mejor el alcance que tiene la prueba Chi-cuadrado en la
comparación de los resultados muestrales obtenidos y los esperados. La prueba por
su nombre indica erróneamente una complejidad que no tiene, ya que su desarrollo
es bastante sencillo. Esperamos poder hacer uso de esta herramienta estadística
para tomar mejores decisiones de negocios.
21
BIBLIOGRAFIA
ANEXOS
TABLA E – DISTRIBUCION NORMAL
23