Estadistica No Parametrica
Estadistica No Parametrica
Estadistica No Parametrica
UNIVERSIDAD NACIONAL
SAN LUIS GONZAGA
ESTADISTICA NO PARAMETRICA,
TAMAÑO DE PRUEBAS Y PRUEBA DE
HIPOTESIS
DOCENTE:
ECOS QUINTANILLA VICENTE HIPOLITO
ALUMNA :
Alely Caroline Antezana Antezana
ESTADISTICA NO PARAMETRICA
DEFINICIÓN TECNICA
Test binomial
Prueba de Anderson-Darling
Prueba de Cochran
Prueba de Cohen kappa
Prueba de Fisher
Prueba de Friedman
Prueba de Kendall
Prueba de Kolmogórov-Smirnov
Prueba de Kuiper
Prueba de Mann-Whitney o prueba de Wilcoxon
Prueba de McNemar
Prueba de la mediana
Prueba de Siegel-Tukey
Prueba de los signos
Coeficiente de correlación de Spearman
Tablas de contingencia
Prueba de Wald-Wolfowitz
Prueba de los rangos con signo de Wilcoxon
Todo sea dicho, los resultados no son infalibles. Para realizar pruebas no
paramétricas debemos tener muestras estadísticas. Por tanto, los resultados
pueden ser fiables pero no tienen por qué ser 100% perfectos.
CARACTERISTICAS
Es frecuente encontrar descrito que, el Wilcoxon signed-rank test, compara la
mediana de las diferencias, sin embargo, esto solo es correcto bajo
determinadas condiciones. A modo general, el Wilcoxon signed-rank test
compara si las diferencias entre pares de datos siguen una distribución
simétrica entorno a un valor. Si dos muestras proceden de la misma población,
es de esperar que las diferencias entre cada par de observaciones se
distribuyan de forma simétrica entorno al cero.
Trabaja sobre rangos de orden, es decir, utilizan las posiciones que ocupan los
datos una vez ordenados. Por lo tanto, solo es aplicable a variables cuyos
valores se pueden ordenar.
EJEMPLOS:
EJEMPLO1
Se seleccionan aleatoriamente diez pares de niños de una estancia infantil, cada par
formado de acuerdo con su fecha de nacimiento. Se dividen en dos grupos, un niño de
cada par se coloca en el grupo I y el otro en el grupo II. Se emplean dos dietas
diferentes para alimentar a los dos grupos y después de cierto tiempo se registran sus
aumentos de peso en gramos como se muestra en la siguiente tabla:
Tal información proporciona suficiente evidencia estadística para probar que la dieta
correspondiente al grupo I es menos efectiva, en cuanto al aumento de peso, que la
dieta del grupo II. Utilice un nivel de significación del 5%.
GRUPO DE PESO CON LAS DOS DIETAS
Numero de pares de niño
X (GRUPO I) Y (GRUPO II)
1 15 12
2 16 20
3 19 34
4 20 22
5 14 21
6 18 16
7 17 26
8 21 20
9 17 22
10 13 21
SOLUCIÓN:
u 47.5−7.5
r w=¿ =27.5 ¿
2
σr =
w
√ 10 ( 10+ 1 ) (2 ( 10+1 )) =9.81
24
El valor crítico, al establecer una prueba de extremo izquierdo, con un nivel de significación del
5%, es decir, α=.05 por tablas correspondientes a la normal estándar, se tiene que es z c = −
1.645
H o : X -Y =0
H 1: X -Y <0
-1.64
Cálculo del valor de prueba por el modelo correspondiente, con diferencias sin valor
absoluto :
−47.5−27.5
z p= =−7.64
9.811
Como Zp = − .64 1 < − .645 , entonces se localiza en la región de rechazo ⇒ H0 se rechaza luego
H1 se acepta
EJEMPLO 2
Se desea averiguar si un grupo de estudiantes se sienten mas relajado cuando
escuchan música.
8 + 9/ 2 = 8 .5
POSITIVAS NEGATIVAS
5
2 2
2 8.5
7
∑= 4 5
8.5
5
∑=41
EJEMPLO 3
Un grupo de investigadores realizo un estudio en la prisión, en el cual tenia un
propósito disminuir los niveles de estrés de los presos. Empleando una muestra de 12
presos. A ellos se le administro una escala de estrés, que arrojo los siguientes puntajes,
luego se les aplico el tratamiento, el cual consistió en adoptar ciertas técnicas de
relajación impartida por un experto en el área. Finalmente, se repite la administración
de la escala de estrés. El grupo de investigadores pretende conocer si las técnicas de
relajación tuvieron efectos positivos en los niveles de estrés de los presos que
participaron en el estudio.
RESOLUCIÓN
POSITIVOS NEGATIVOS
∑= 6 ∑=14
VALOR CRITICO = 14
RESPUESTA= rechazamos la hipótesis nula, las cual afirman que las técnicas de
relajación producen cambios significativos en los niveles de estrés de los presos
PRUEBA DEL COEFICIENTE DE CORRELACIÓN POR ORDEN DE RANGO
6 ( 47.5 )
r s=1− =0.7841
11 ( 11 −1 )
2
0.7841
T prueba =
√ =3.790
2
1−0.7841
11−2
Como el valor critico del estadístico de prueba es t= ± 2.262 con 9 grados de libertad.
Por lo tanto si existe correlación entre las calificaciones de los 2 supervisores.
EJEMPLO 2
Se requiere analizar si existe correlación entre las calificaciones obtenidas en
matemática e historia. Para ello, se han seleccionado a 6 alumnos, a los que se
clasifico ordenadamente, en función de su calificación académica en ambas
asignaturas.
MATEMATICA HISTORIA
1° 3°
3° 2°
6° 5°
2° 1°
4° 4°
5° 6°
SOLUCIÓN:
MATEMATICA HISTORIA d d v2
1° 3° -2 4
3° 2° 1 1
6° 5° 1 1
2° 1° 1 1
4° 4° 0 0
5° 6° -1 1
SUMA 8
6∗8
r s=1− =0.77
63 −6
EJEMPLO 3
Un psicólogo organizacional esta interesado en conocer la influencia del clima
organizacional sobre el estrés de los trabajadores de una empresa. Para saberlo,
administro dos escalas, una que mide el clima organizacional y otra que mide el estrés,
aun grupo de 10 trabajadores. El psicólogo se plantea que ambas variables están
relacionadas.
SOLUCIÓN:
6∗330
r s=1− = -1
103−10
H 0=no existe relacion significactiva entre clima organizacinal y estres
TAMAÑO DE MUESTRAS
EJERCICIO 1
Se desea estimar el tiempo de duración de pilas Duracell producidos por la empresa
DURACELL. Que sigue una distribución normal con una desviación estándar de del
tiempo de duración es 12 meses . De que tamaño debe ser la muestra para estimar el
tiempo medio de duración con un error máximo de 4 meses y con una confianza del
95%
Z= 1.96
No= (1.96)2 ¿ ¿ = 31
RESPUESTA :La empresa debería tomar una muestra 31 pilas Duracell
Suponga que en el ejercicio anterior se tenia una población de 250 pilas Duracell y se
desea saber de que tamaño será la muestra.
HACIENDO USO DE LA FORMULA DE CORRELACIÓN
31
n= =28
31
1+¿
250
RESPUESTA: En vez de tomar una muestra de 31 pilas debería tomar la muestra de 28
pilas DURACELL
EJERCICIO 2
Se desea estimar la prevalencia de Diabetes en la ciudad de Ica. Siguiendo una
distribución normal con una desviación estándar de 20kg .¿A cuantas personas se debe
estudiar? Si se desea tener un nivel de confianza del 90 % de que la media poblacional
este dentro de 5 kg
0.9/2 = 0.45 = z=1.65
n o=(1.65) ¿ ¿ =44
2
EJERCICIO 3
Se desea conocer el nivel de glucosa de los alumnos de la facultad de administración
de la universidad nacional san Luis Gonzaga de ica. Con una desviación de 100 md/dl,
con un nivel de confianza del 94%, con una precisión de 3.
(1.88¿¿ 2)(250)
n 0= 2
¿ =8825
3
RESPUESTA: el nivel de glucosa de los alumnos de la facultad de administración es de
8825 md/dl
EJERCICIO 4
El dueño de una granja desea hacer una investigación. El peso promedio de las ovejas
según un estudio anterior en una muestra aleatoria d 12 ovejas mostro que la
desviación estándar de sus pesos es de 11.4 libras ¿Qué tan grande debe ser una
muestra para que tenga un nivel de confianza del 95% de que el error de estimación es
de 3 libras.
n=¿ = 56
RESPUESTA: La muestra debe ser de 56 para tener un nivel de confianza del 95%
EJERCICIO 5
Se quiere realizar una investigación entre los docentes de la universidad san Luis
Gonzaga, acerca del manejo de medios virtuales. En el cual se esta trabajando
400.Como dato se tiene que ya se realizo una investigación similar, arrojando como
dato que el 60% utilizan los medios virtuales, al nivel de confianza del 95% con un error
del 5%
RESPUESTA: Tendría que estudiarse a 1684 estudiantes para saber cual es la tendencia
máxima de votos entre los alumnos
EJERCICIO 7
Se desea conocer la prevalencia de glucosa en la ciudad de ica ¿ A cuantas personas se
debe estudiar? Se debe tener en cuenta la prevalencia aproximada en la población es
alrededor del 6. Se desea tener una precisión del 4% y un nivel de confianza del 95%
DATOS:
2
(1.96) 0.06∗0.94
Z=1.96 n¿ 2 = 135
0.04
P= 0.06
q=0.94
E=0.04
RESPUESTA: Se debe estudiar a 135 personas
EJERCICIO 8
(1.96)2 0.40∗0.60∗10000
n= = 1873
0.022 ( 10000−1 ) +1.96 2∗0.40∗0.60
RESPUESTA: Tendría que estudiarse a 1873 mujeres para conocer el promedio de horas
semanales trabajadas por las mujeres del servicio domestico
PRUEBA DE HIPOTESIS
EJERCICIO 1
PASO 1:
H 0=¿¿ µ= 26 años
PASO 2
α= 5%
PASO 3
22.5−26
Z=
3.5 = - 4.24 1.64
√18
Decisión: Se rechaza la Ho
EJERCICIO 2
Una maquina express de café instantáneo vierte 230 ml por unidad. Una
muestra aleatoria de 35 café tiene un contenido promedio de 225 ml con
una desviación estándar de 15 ml. Pruebe la hipótesis del promedio sea
igual a 230 ml en contraposición a la hipótesis alternativa de que es menor
a 230 ml en el nivel de significancia del 5%.
PASO 1:
H 0=¿µ = 230
PASO 2: α = 5%
PASO 3:
225−230
Zp= 15 =-1.98
√35
PASO 4 : 1.64
Decisión: se rechaza la Ho
CONCLUISÓN: SE PUEDE AFIRMAR QUE EL CONTENIDO PROMEDIO DE
CADA CAFE ES MENOR DE 23 ML CON UNA SIGNIFICACIÓN DEL 5 %
EJERCICIO 3
Una empresa fabrica y muebles para el hogar. La producción semanal del
escritorio modelo tiene una distribución normal, con una media de 250 y
una desviación estándar de 14. El gerente de la empresa pretende
investigar si hubo algún cambio en la producción de los muebles . ¿La
cantidad media de muebles que se produjeron es diferente de 200
muebles semanales? Utilice un nivel de significancia de 0.01. en una
muestra de 60 semanas, la cantidad media de muebles que se produjeron
fue de 206
PASO 1
H 0=¿µ = 200
H 1=¿ µ ≠ 200
PASO 2
α=0.01
PASO 3
206−200
z=
14 = 3.31 -2.58 2.58
√ 60
PASO 4:
Decisión: Se rechaza la Ho
CONCLUSIÓN: La cantidad media de muebles que se produjeron es
diferente de 200 muebles semanales
EJERCICIO 4
H 1=¿ µ<269
PASO 2
α=0.05
PASO 3
229−269
Z=
5.12 = - 39
√25
-1.64
Decisión: Se rechaza la Ho
CONCLUSIÓN: Se puede afirmar que el precio promedio al menudeo a
disminuido
EJERCICIO 5
PASO 1
H 0=µ=1 LITRO
H 1=μ ≠ 1 LITRO
PASO 2
α=5 %
PASO 3
-2.06 2.06
1.009−1
t=
0.12 =0.38
√25
Decisión: Se acepta la Ho
CONCLUSIÓN: Se puede decir que las bombas están funcionando
correctamente
EJERCICIO 6
PASO 2 = α=5%
PASO 3
5,30
15,9 ±(0.025)
√ 10
12.11 15.9 19.69
15,9 ±3,79
EJERCICIO 7
PASO 2 = α=5%
PASO 3
220−225
t=
15 =-2.0 -1.65
√36
DECISIÓN: Se rechaza la Ho porque cae en zona de rechazo
CONCLUSIÓN: Se puede afirmar que el contenido promedio de cada
botella o unidad es menor de 225 ml con una significación del 5% de alfa
EJERCICIO 8
La empre QUIA de autoservicios, genera su propia tarjeta de crédito, el gerente desea
averiguar si el saldo medio adeudado por los clientes es mayor a s/400, el nivel de
significación es de 5%. Una revisión aleatoria de 172 saldos deudores revelo que la
media muestral es de s/407 y la desviación estándar de s/ 38 ¿debería concluir el
gerente que la media poblacional es mayor que s/400 o es razonable suponer que la
diferencia de s/ 7 se debe al azar de la selección?
PASO 1
H o =μ=400
H 1=μ> 400
PASO 2 = α=5%
PASO 3
407−400
t=
38 =2-41
√ 172
1.64
Decisión: Se rechaza la Ho
CONCLUSIÓN: Los datos muestrales permiten que el promedio adecuado por los
clientes de la tarjeta de crédito es mayor de s/400