NT4 Jicuadrada
NT4 Jicuadrada
Jicuadrada
Elaborado por:
Mtro. Efraín Nava Álvarez
Catedrático del IPN
Los valores críticos de la distribución ji cuadrada se obtienen de forma muy sencilla como
se muestra a continuación.
Ejemplos
Obtener los valores críticos para los grados de libertad (g. l.) y el área en el extremo
derecho ( ) que se da en cada uno de los siguientes ejercicios:
Solución
En la tabla anexa, en la columna del extremo izquierdo (color amarillo, se busca el grado
de libertad igual a 24; en primer renglón (color verde) se busca el área igual a 0.10. Se
localiza la intersección perpendicular entre el renglón y la columna buscada, y se obtiene
el valor crítico; por lo tanto: 2 (24,0.01) 42.9798 .
2. Obtener 2 (15,0.025)
Solución
De igual manera, en la tabla anexa, en la columna del extremo izquierdo (color amarillo,
se busca el grado de libertad igual a 15; en primer renglón (color verde) se busca el área
igual a 0.025. Se localiza la intersección perpendicular entre el renglón y la columna
Observaciones
1. Los valores críticos cercanos a cero, es decir los del lado izquierdo, se utilizan
cuando se estiman intervalos de confianza para la varianza o la desviación
estándar; sin embargo, estos temas no forman parte del curso.
2. La tabla anexa contiene solo grados de libertad hasta el valor de 39. Puede
parecer que esto es muy limitado, al tener una mayor número de datos, 100, 150,
300, 1000, etc. Sin embargo, los grados de libertad están asociados al número de
celdas que se emplean en las tablas de contingencia, por lo cual para la gran
mayoría de las aplicaciones esta tabla contiene los valores suficientes.
Pruebas de independencia
¿Qué relación existe entre la zona geográfica en que viven las personas y su preferencia
política?
¿Qué relación existe entre la formación profesional de los padres y la carrera universitaria
que eligen los hijos?
La estadística provee herramientas para estudiar la relación entre dos variable; si ambas
son cuantitativas, se puede utilizarla regresión y correlación lineal; en cambio si
ambas son cualitativas se emplean tablas de contingencia.
Los dos primeros casos se pueden analizar con la regresión lineal y los dos últimos con
las tablas de contingencia, en específico con las pruebas de independencia.
El valor crítico, a una nivel dado de significancia, se busca en la tabla con un número de
grados de libertad gl en(rel 1)(c 1)
cual:
r número de renglones
c número de columnas
Ejemplo
Una cervecera desea saber si sus diferentes productos tiene igual aceptación entre
mujeres y hombres, para ello lleva a cabo una encuesta, la cual arroja los siguientes
resultados:
HOMBRES 30 15 45 90
MUJERES 10 40 33 83
40 55 78
TOTALES
Los datos de la encuesta corresponden a las frecuencias observadas, para calcular las
frecuencias esperadas de la ij-ésima celdas, se utiliza la siguiente relación:
Como se observa, la estadística de prueba cae en la región crítica, por lo que se rechaza
la hipótesis nula, por tanto, los datos arrojan una fuerte evidencia para afirmar que el sexo
de una persona y el tipo de cerveza preferida no son variables independientes, es decir, el
tipo de cerveza preferida depende del sexo de las personas.
Introducción
Bondad de Ajuste
Es necesario construir una tabla de frecuencias para agrupar las frecuencias observadas.
Para el valor crítico, los grados de libertad a utilizar son gl k p 1
En la cual: k Número de clases
70 58 55 75 72 58 44 80 88 77
55 70 70 64 31 77 90 66 56 54
84 90 80 55 56 64 85 75 74 72
75 45 90 50 74 75 70 50 61 80
60 80 40 50 47 50 50 46 50 49
Probar con un nivel de significancia del 5% si estos datos tienen distribución normal.
Solución
Se calcula la media y la desviación estándar de los 50 datos (se anotan únicamente los
resultados, esto corresponde a la estadística descriptiva y no debes tener problemas para
calcularlos. Al final se incluye un apéndice de cómo realizar estos cálculos utilizando
excel).
x
x 3287 65.74 s
(x x) 2
9823.24
14.16
n 50 n 1 49
Estos valores permiten construir las clases para agrupar los datos. De la fórmula
x
z se despeja “ x ” y resulta x z
Para agrupar los datos es necesario construir las clases para congregar los datos, como
50
se tienen 50 datos, conviene utilizar 10 clases 5 , ya que con esto se asegura que
10
cada clase tenga 5 datos, los cuales representarían las frecuencias esperadas y con ello
se cumple el supuesto de la distribución ji-cuadrada.
Para construir 10 clases, es necesario obtener 9 valores de la variable aleatoria, cada uno
de los cuales concentra a un 10% de datos.
Determinación de Z1 y Z9
La primera clase contendrá el 10% de los datos al igual que la décima clase, pero ésta
tendrá 90% de datos acumulados a la izquierda. Por tanto, en ambos casos se busca 0.40
que es el área al centro.
Determinación de Z2 y Z8
Determinación de Z3 y Z7
x5 0
Menos De 48 4 5
De 48 a menos de 53 8 5
De 53 a menos de 58 6 5
De 58 a menos de 62 4 5
De 62 a menos de 65 2 5
De 65 a menos de 69 1 5
De 69 a menos de 73 5 5
De 73 a menos de 78 7 5
De 73 a menos de 83 7 5
83 o más 6 5
2
( fo fe) 2
Menos De 48 4 5 (4 5) 2 1
De 48 a menos de 53 8 5 (8 5) 2 9
De 53 a menos de 58 6 5 (6 5) 2 1
De 58 a menos de 62 4 5 (4 5) 2 1
De 62 a menos de 65 2 5 (2 3) 2 1
De 65 a menos de 69 1 5 (1 5) 2 16
De 69 a menos de 73 5 5 (5 5) 2 0
De 73 a menos de 78 7 5 (7 5) 2 4
De 73 a menos de 83 7 5 (7 5) 2 4
83 o más 6 5 (6 5) 2 1
( fo fe) 2
46
Por lo tanto 2
( fo fe) 2
46
9.2
fe 5
Valor critico
k Número de celdas = 5
gl k p 1 5 2 1 2
0 15
1 31
2 20
3 15
4 13
5 4
6 2
Hipótesis nula:
e 2 2 x
P( x)
x!
e 2 2 x Frecuencia esperada
x P( x) n p = 100 P(x)
x!
0 0.1353 13.53
1 0.2706 27.06
2 0.2706 27.06
3 0.1804 18.04
4 0.0902 9.02
5 0.0360 3.60
6 0.0120 1.20
Observación
Notamos que las dos últimas clases no cumplen con esta condición, por lo que se deben
agrupar las clases para cumplir este requisito. Se agrupan las 3 últimas clases y se tiene
la siguiente distribución:
X e 2 2 x Frecuencia
P( x) esperada
x! n p = 100 P(x)
0 0.1353 13.53
1 0.2706 27.06
2 0.2706 27.06
3 0.1804 18.04
4 o más 0.1382 13.82
Para que se conserve la correspondencia, también se deben agrupar las tres últimas
clases de la frecuencia observada.
1 31
2 20
3 15
4 o más 19
Estadística de prueba
fe
(15 13.53) 2 (31 27.06) 2 (20 27.06) 2 (15 18.04) 2 (19 13.82) 2
2 5.028
13.53 27.06 27.06 18.04 13.82
Valor critico
Donde:
k Número de celdas = 5
gl k p 1 5 1 1 3
Como la estadística de prueba cae no cae en la región crítica, no se rechaza Ho, por lo
tanto los datos si tienen una distribución del tipo poisson.
GRADOS
DE
LIBERTAD
= área en el extremo derecho
Fuentes de información
http://www.edustatspr.com/Materiales/tablas/tabx2(df,a).php