Práctico 2 Bioestadística

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 50

-UNIVERSIDAD CATÓLICA DE CUENCA SEDE AZOGUES

UNIDAD ACADÉMICA DE SALUD Y BIENESTAR

FACULTAD DE MEDICINA

TRABAJO PRÁCTICO

ASIGNATURA:

BIOESTADÍSTICA

TÍTULO:

ANÁLISIS DE LOS EJERCICIOS ESTADÍSTICOS PARAMÉTRICOS Y NO PARAMÉTRICOS


CON LA APLICACIÓN DE LOS PROGRAMA EXCEL Y SPSS DURANTE EL PERIODO
MARZO-AGOSTO 2022
INTEGRANTES:

PABLO ANDRES MARCA VENEGAS


EDISON ISRAEL ORTIZ PADILLA
YARITZA JAMILETH PÉREZ GUIJARRO
KEVIN ROBINSON PERUGACHI MARCILLO
ANDREA DANIELA QUIROZ LANDI
OSCAR OMAR URGILES GUAMAN

CATEDRÁTICO:

ECON. FROILÁN MÉNDEZ

CICLO:

SEXTO “A”
Objetivo general

 Analizar los ejercicios paramétricos y no paramétricos de Chi cuadrado y T student


mediante la aplicación en el programa de Excel y SPSS

Objetivos específicos

 Identificar la importancia de los ejercicios paramétricos y no paramétricos mediante los

ejercicios planteados con su respectivo proceso.

 Aplicar los ejercicios paramétricos y no paramétricos mediante los programas de Excel y


SPSS

 Establecer una comparación de los resultados obtenidos de los ejercicios ejercicios


paramétricos y no paramétricos realizados en los programas de Excel y SPSS.
INTRODUCCIÓN

La bioestadística cumple un rol fundamental en todas las disciplinas, de manera especial en las

ciencias de la salud, esta se considera como una rama de la estadística encargada de recoger,

analizar e interpretar los datos obtenidos a partir de una muestra o de una población. Estos son

obtenidos mediante procesos estadísticos como las medidas de probabilidad y la estadística

inferencial.

La T Student es una herramienta que nos ayuda a evaluar las medias de uno o dos grupos

mediante pruebas de hipótesis. Por otra parte, el chi cuadrado será una prueba no paramétrica

utilizada para obtener una diferencia significativa entre resultados esperados y observados en

una o varias muestras. Las pruebas no paramétricas se van a encargar del análisis de datos

que no tienen una distribución particular y se guían en una hipótesis, pero sus datos no se

encuentran organizados con normalidad, mientras que las pruebas paramétricas se ocupan del

análisis de los factores de una población.

El trabajo fue realizado con la finalidad de evaluar la efectividad de la T Student y el chi

cuadrado utilizando estas pruebas en diversos ejercicios, empleando el programa SPSS y

Excel, que se efectuó en la cátedra de bioestadística en el periodo Marzo 2022 - Agosto 2022.
PRUEBAS PARAMÉTRICAS Y NO PARAMÉTRICAS

Las pruebas paramétricas están diseñadas para estimar la distribución de la muestra de una

población para su estudio, presenta variables cuantitativas continuas. Estas pruebas son más

eficientes los errores serán mínimos, serán más sensibles y a su vez serán complicadas de

calcular. Mientras más grande sea la muestra será más exacto y mientras más pequeña será

más distorsionado la muestra de la población. Entre estas pruebas tenemos la prueba de valor

Z de la distribución normal, las distintas pruebas de T Student y la prueba F. (Saino, 2016)

Las pruebas no paramétricas estas nos permiten realizar un análisis de datos en escala

nominal u ordinal, estas pruebas pueden ser utilizadas, aunque no existan datos o se

desconozcan parámetros de la población para realizar un estudio. Estas pruebas son más

fáciles de utilizar, se pueden utilizar así los datos vengas diferentes poblaciones. Existen

diferentes pruebas como la prueba X2 de Pearson o Chi Cuadrado, prueba de Friedman,

McNemar, U de Mann, entre otras más. (Saino, 2016)

T-STUDENT

Una de las pruebas de hipótesis que se utilizan es la T student es utilizada en un gran

porcentaje en la medicina, esta maneja la distribución de probabilidades con el fin de evaluar si

existe una diferencia entre las medias de dos muestras, para el cálculo debe considerarse que

la muestra debe ser siempre menor a 30, se necesita una distribución normal de datos y la

ausencia de la desviación estándar. (Flores-Ruiz et al., 2017)


PRUEBA T STUDENT PARA DATOS RELACIONADOS

Se determina una comparación entre dos grupos de medidas y determinar su diferencia. Con

los datos distributivos las variables dependientes serán normales, tendrán una homogeneidad

en sus varianzas, al escoger los grupos será de manera aleatoria, en el procedimiento su

cálculo de las diferencias entre los valores de las dos variables contrasta si la medida difiere de

0. (Medina-Toro et al., 2022

Ejemplo

Se requiere saber si el promedio de 12 estudiantes del 6to A de la carrera de medicina

aumento con las tutorías impartidas por el Docente después de clases.

Nivel de significancia del 5% = 0.0

Paso 1: Hipótesis

Ho: Se expresa que no existe cambios en las calificaciones en el antes y después de recibir las

tutorías

Ha: Se expresa que las calificaciones aumentaron después de las tutorías

Paso 2 Tabulación

Estudiantes Antes Después d d-X (d-X)˄2


1 8 10 -2 -3.25 10.563
2 6 8 -2 -3.25 10.563
3 7 8 -1 -2.25 5.063
4 10 4 6 4.75 22.563
5 5 6 -1 -2.25 5.063
6 4 7 -3 -4.25 18.063
7 6 2 4 2.75 7.563
8 8 5 3 1.75 3.063
9 8 2 6 4.75 22.563
10 5 3 2 0.75 0.563
11 8 7 1 -0.25 0.063
12 7 5 2 0.75 0.563
12 82 67 15 Σ 106.250
Media aritmetica:6.83 5.583 1.25

X1=6.83 X2=5.58

Paso3: Desviación estándar

S=√Σ(d-X)˄2/(n-1)

S= 9.66

S= 3.108

Paso 4: t=X-u/(S/√n)

t= 1.34

Paso 4: T student

t=X-u/(S/√n)

t=1.34

Paso 5: Nivel de significancia

gl=n-1

gl=11

X1= ±1.796

X2=1.34

Grafica de notas antes y después de tutorías


Notas de los estudiantes
12
10
8
Calficacion

6
4
2
0
1 2 3 4 5 6 7 8 9 10 11 12
Antes y Despues

Antes Despues
Elaborado por:Grupo 4
Fuente: Notas de antes y despues de tutorias

T-TEST PAIRS=Nota1 WITH Nota2 (PAIRED)


/CRITERIA=CI(.9500)
/MISSING=ANALYSIS.

Prueba T Student

Estadísticos de muestras relacionadas


Media N Desviación Error típ. de
típ. la media
Notas Antes de tutorias 6.83 12 1.697 .490
Par 1 Notas despues de 5.58 12 2.539 .733
tutorias
Correlaciones de muestras relacionadas
N Correlación Sig.
Notas Antes de tutorias 12 -.039 .905
Par 1 y Notas despues de
tutorias

Prueba de muestras relacionadas


Diferencias relacionadas
Media Desviación Error típ. de 95% Intervalo
típ. la media de confianza
para la
diferencia
Inferior
Notas Antes de tutorias 1.250 3.108 .897 -.725
Par 1 - Notas despues de
tutorias

Prueba de muestras relacionadas


Diferencias t gl Sig. (bilateral)
relacionadas
95% Intervalo
de confianza
para la
diferencia
Superior
Notas Antes de tutorias - 3.225 1.393 11 .191
Par 1
Notas despues de tutorias

Pruebas no paramétricas
[Conjunto_de_datos0] C:\Users\pc\Documents\datos independientes 1.sav

EXAMINE VARIABLES=Nota1 Nota2


/PLOT BOXPLOT HISTOGRAM NPPLOT
/COMPARE VARIABLES
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Estadístico gl Sig. Estadístico gl Sig.
*
Notas Antes de tutorias .171 12 .200 .951 12 .656
Notas despues de .128 12 .200* .957 12 .745
tutorias

*. Este es un límite inferior de la significación verdadera.


a. Corrección de la significación de Lilliefors

Histograma
Interpretación: Como t se encuentra dentro de la zona de aceptación se va a aceptar la

hipótesis alternativa y se rechaza la hipótesis nula

Ejercicio 2: Comparar los niveles de ansiedad en 10 jóvenes no asertivos antes y después de

un entrenamiento de una habilidad social. Justificación de la prueba estadística T de student.

Paso1: Desarrollo de Hipótesis

Ha: El nivel de ansiedad en los jóvenes no asertivos disminuye después del entrenamiento

Ho: No existe cambios observados en el antes y el después del entrenamiento, y no hay

diferencia entre ambos periodos


Paso2: Tabulación de Datos

Sujetos Antes Despues d d-X (d-X)2


1 35 12 23 6,9 47,61
2 28 27 1 -15,1 228,01
3 38 14 24 7,9 62,41
4 45 25 20 3,9 15,21
5 32 13 19 2,9 8,41
6 25 20 5 -11,1 123,21
7 39 12 27 10,9 118,81
8 52 45 7 -9,1 82,81
9 29 10 19 2,9 8,41
10 38 22 16 -0,1 0,01
Σ Σ Σ 161 144,9 694,9

Media aritmética: X=16.1

Paso: 3 Calculo de Desviación Estándar

S= √Σ(d-X)2/(n-1)

S=√694.7/9

S=8.78

Paso 4: Calculo de T student

t=X-u/S/√n

t=16.1-0.05/8.78/√10

t=5.79

Gráfico de los niveles de ansiedad en jóvenes antes y después

Niveles de ansiedad
9
7
Jovenes

5
3
1
0 10 20 30 40 50 60
Antes y Despues

Despues Antes Sujetos


Elaborado por: Grupo 4

PRUEBA SPSS

Fuente: SPPS
Elaborado: Grupo 4

Prueba T Student

Estadísticos de muestras relacionadas


Media N Desviación Error típ. de
típ. la media
Antes del 36.10 10 8.198 2.593
entrenamiento
Par 1
Despues del 20.00 10 10.625 3.360
entrenamiento

Correlaciones de muestras relacionadas


N Correlación Sig.
Antes del 10 .591 .072
entrenamiento y
Par 1
Despues del
entrenamiento

Prueba de muestras relacionadas


Diferencias relacionadas
Media Desviación Error típ. de 95% Intervalo
típ. la media de confianza
para la
diferencia
Inferior
Antes del 16.100 8.787 2.779 9.814
entrenamiento -
Par 1
Despues del
entrenamiento

Prueba de muestras relacionadas


Diferencias t gl Sig. (bilateral)
relacionadas
95% Intervalo
de confianza
para la
diferencia
Superior
Antes del entrenamiento - 22.386 5.794 9 .000
Par 1
Despues del entrenamiento

Pruebas no paramétricas
Histograma

Interpretación: El nivel de ansiedad en los jóvenes no asertivos disminuye después de


participar en un entrenamiento en las habilidades sociales, existen diferencias significativas
entre el antes y después

PRUEBA T DE STUDENT PARA DATOS NO RELACIONADOS (MUESTRAS


INDEPENDIENTES)

La prueba t de student es una prueba de hipótesis dónde:

La hipótesis nula supone la igualdad de los promedios de la muestra 1 y la muestra 2.

H0: µ1=µ2

Y la hipótesis alterna la hipótesis alterna significa que los promedios que los promedios son

distintos en este podemos utilizar que el promedio de la muestra uno sea mayor o sea menor al

promedio de la muestra 2 en este caso estamos utilizando la prueba de hipótesis bilateral o de

dos colas. (Molina, Ochoa, & Ortega, 2020)

H1: µ1≠µ2

Estadístico de prueba:

X 1−X 2


2
T= S C S2C
+
N1 N2

Donde la varianza común se va a calcular con la fórmula.


2 2
2 ( N 1−1 ) S C + ( N 2−1 ) SC
SC
N 1 + N 2−2

Este estadístico va a seguir una distribución con N 1 + N 2−2 con dos grados de libertad.

Y se rechaza la hipótesis nula siempre que el valor absoluto calculado sea mayor que el valor

crítico. Que su fórmula es: gl=(n1+n2-2) que se somete a la condición:

t=¿)*(n1+n2-2)

Ejemplo
Dos antibióticos a y b que fueron administrados a 22 y 20 pacientes con diagnóstico de la

misma enfermedad y se han medido los tiempos del tratamiento en días de ambas medicinas.

Tabla 7. Ejemplo T-student

N pacientes A B
1 6 7
2 5 6
3 6 7
4 7 9
5 5 5
6 7 8
7 6 7
8 4 6
9 3 7
10 6 9
11 6 8
12 5 7
13 7 8
14 8 7
15 6 6
16 5 8
17 8 7
18 4 6
19 6 5
20 6 5
21 7
22 6

Fuente: Archivo Universidad Católica de Cuenca

Elaborado por: Grupo4

Tabla. Ejemplo T-student


Fuente: Archivo Universidad Católica de Cuenca

Elaborado por: Grupo 4

Elaboración en SPSS.

Paso 1: Planteamiento de hipótesis

a) Hipótesis alternativa (Hi): El antibiótico A y el antibiótico B en cuanto a su promedio de

administración va a ser diferente.

b) Hipótesis nula (Ho): El tiempo promedio del antibiótico A es igual al tiempo promedio del

antibiótico B.

Paso 2: Nivel de significación

a) Para todo valor de probabilidad igual o menor que 0.05 se acepta Hi y se rechaza Ho.

Paso 3: Lectura de P-valor

a) P-valor = > α acepta Ho = los datos provienen de una distribución normal

b) P-valor < α acepta Hi = los datos no provienen de una distribución normal


Vamos a encontrar que los datos estudiados van a ser menores o iguales a 30 individuos, por
lo mismo se va a utilizar la prueba de Shapiro-Wilk para poder corroborar la normalidad, de
esta manera nos va a indicar el nivel de significancia de los antibióticos A en un valor de .206
así mismo como de los antibióticos B con un valor de .122, en donde vamos a poder observar
que son mayores a 0.05, por lo mismo se deduce que los datos provienen de una distribución
normal.
Observamos que los datos analizados van a ser menores o iguales a 30 individuos, por esto se
utiliza la prueba de Shapiro-Wilk para poder corroborar la normalidad, de esta manera nos va a
indicar el nivel de significancia de los antibióticos A en un valor de .206 así mismo como de los
antibióticos B con un valor de .122, en donde vamos a poder observar que son mayores a 0.05,
por lo mismo se deduce que los datos provienen de una distribución normal.
Paso 4: igualdad de varianzas
Prueba de Levene
P-valor = > α acepta Ho = las varianzas son iguales
P-valor < α acepta Hi = existe diferencia significativa entre las varianzas
Vamos a observar que la igualdad de varianza es de .928 y va a estar contrastado 0.05
entonces el valor de p es mayor que alfa, por lo que tenemos que las varianzas son iguales.
Paso 5: Decisión estadística

Como podemos observar el cálculo de p-valor se puede observar la prueba T para la igualdad

de medias, donde indica que el valor de significancia para la prueba T student es de 0.011, por

lo mismo se observa que el p-valor va a ser mayor que alfa. Por lo mismo no se rechaza la

hipótesis.

Ejercicio 3: Un investigador ha obtenido la talla de 20 niños de 5 años de edad, de dos

condiciones socioeconómicas contrastantes (alta y baja). Considere que ambos grupos de

población tienen estaturas diferentes.

Resolución del ejercicio con el programa Excel.

Primer paso: Plantear las hipótesis; tanto hipótesis nula, como hipótesis alternativa.

 Hipótesis alternativa (Hi): Las tallas de niños de las 2 muestras de condiciones

socioeconómicas contrastantes son distintas.

 Hipótesis nula (Ho): Las diferencias observadas en las tallas de niños de muestras de

condiciones socioeconómicas similar se deben al azar.

Segundo paso: Determinar el nivel de significación.

 Para todo valor de probabilidad igual o menor que 0.05 se acepta Hi y se rechaza Ho

Tercer paso: Cálculo.


Estatura (Clase Estatura (Clase
d - X1 (d - X1)² d - X2 (d - X2)²
social baja) social alta)
101 103 0,1 0,01 -2 4
102 105 1,1 1,21 0 0
100 104 -0,9 0,81 -1 1
104 106 3,1 9,61 1 1
102 108 1,1 1,21 3 9
99 100 -1,9 3,61 -5 25
102 108 1,1 1,21 3 9
103 104 2,1 4,41 -1 1
97 105 -3,9 15,21 0 0
99 107 -1,9 3,61 2 4
1009 1050 ∑ 40,9 ∑ 54

Cálculo de las medias aritméticas.

Media aritmética (estatura clase social baja):

∑ X1 1009
X= X= X =109
n 10

Media aritmética (estatura clase social alta):

∑X2 1050
X= X= X =105
n 10

Aplicar la prueba estadística T de Student para datos no relacionados (nuestras

independientes).

 Suma de los cuadrados.

Sc1 = (d – X1) ² = 40,9

Sc2 = (d – X2) ² = 54

 Cálculo de la desviación estándar ponderada.

S=
√ ( Sc 1+ Sc 2 )
( n 1+n 2 )−2 √
S=
( 4 0 .9+54 )
(10+ 10 )−2
S=2.296
 Cálculo de la ecuación t.

X 1− X 2 100.9−105
t= t= t=−3. 39
1+ 1 1+1
S√ 2.296 √
n 1+ n 2 10+10

 Cálculo de los grados de libertad.

𝑔𝑙 = n1 + n2 – 2 gl=10+10−2 gl=18

 Localización de la intercesión (0.05;18), en la tabla de distribución T de Student.

GRÁFICO DE LA TABLA

El valor de t se compara con los valores críticos de la tabla con 18 grados de libertad y se

obtiene que, en el valor más cercano al calculado, la probabilidad es de 0.001.

Cuarto paso: Decisión.

Como el valor de t es -3. 39 tiene un valor de probabilidad menor que 0.001; también, es menor

que 0.05 propuesto como nivel de significancia, por lo cual se acepta Ha y se rechaza Ho.

Quinto paso: Interpretación.

Las diferencias en talla de ambos grupos de niños en las distintas condiciones

socioeconómicas difieren notoriamente en el nivel de confianza de p menor que 0.001.

Sexto paso: Gráficos.

Estatura
(Clase
X1
social
baja)
1 101
2 102
3 100
4 104
5 102
6 99
7 102
8 103
9 97
10 99

Estatura (Clase social baja)


106
Estatura en centímrtros
104
102
100
98
96
94
92
0 2 4 6 8 10 12
XI

Estatura
(Clase
X1
social
alta)
1 103
2 105
3 104
4 106
5 108
6 100
7 108
8 104
9 105
10 107
Estatura (Clase social alta)
110

108

106

104
Axis Title

102

100

98

96
1 2 3 4 5 6 7 8 9 10

Resolución del ejercicio con el programa SPSS.


Primer paso: Prueba de normalidad.

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
Clase social de los Estadístic Estadístic
niños o gl Sig. o gl Sig.
*
Estura de los Baja ,197 10 ,200 ,958 10 ,767
niños Alta ,142 10 ,200 *
,940 10 ,549
Esto es un límite inferior de la significación verdadera.

a. Corrección de significación de Lilliefors

Como podemos observar se está trabajando con 20 distribuciones, por esto vamos hacer uso

de la prueba de Shapiro-Wilk, al realizar el análisis del nivel de significancia, vamos a poder

observar que las significancias calculadas van a ser iguales a 0.767 y 0.549 por esto se deduce

que son mayores a 0.05, por lo tanto, vamos a tener que se rechaza la hipótesis nula.

Segundo paso: Prueba de homocedasticidad


Estadísticas de grupo

Clase social de los Desv. Desv. Error

niños N Media Desviación promedio

Estura de los Baja 10 100,90 2,132 ,674

niños Alta 10 105,00 2,449 ,775

Prueba de muestras independientes

Prueba de

Levene de

igualdad de

varianzas prueba t para la igualdad de medias

Diferenci 95% de intervalo de

Sig. Diferen a de confianza de la

(bilat cia de error diferencia

F Sig. t gl eral) medias estándar Inferior Superior

Estura de los Se ,017 ,896 - 18 ,001 -4,100 1,027 -6,257 -1,943

niños asume 3,993

varianz

as

iguales
No se - 17,66 ,001 -4,100 1,027 -6,260 -1,940

asume 3,993 3

varianz

as

iguales

En la tabla anterior se observa que, la significancia calculada de 0.896 es mayor que 0.05 por

lo tanto, se cumple que las muestras provienen de poblaciones con similares varianzas.

Además, se observa que la significancia calculada (0.001), es menor que 0.05. Entonces, se

rechaza la hipótesis nula. Con un nivel de confianza del 95%, existe evidencia estadísticamente

significativa para afirmar que Las tallas de niños de las 2 muestras de condiciones

socioeconómicas contrastantes son distintas.

Como podemos observar que la significancia calculada va a ser igual a 0.896 es mayor que

0.05 por esto, se cumple que las muestras provienen de poblaciones con similares varianzas.

La significancia calculada es de 0.001 es menor que 0.05. Entonces se va a rechazar la

hipótesis.

Tercer paso: Análisis fiabilidad.

Estadísticas de fiabilidad

Alfa de Cronbach N de elementos

,365 2
Se puede observar que el Alfa de Cronbach es 0.365, es menor a 0.7. Por esto se deduce que

no es factible proceder con este estudio, dado que, o los datos no son correctos, o fueron más

ingresados. Aunque, tener un valor tan bajo en el Alfa de Cronbach, también puede deberse al

reducido número de observaciones.

Cuarto paso: Frecuencias.

Estura de los niños

Porcentaje Porcentaje

Frecuencia Porcentaje válido acumulado

Válido 97 1 5,0 5,0 5,0

99 2 10,0 10,0 15,0

100 2 10,0 10,0 25,0

101 1 5,0 5,0 30,0

102 3 15,0 15,0 45,0

103 2 10,0 10,0 55,0

104 3 15,0 15,0 70,0

105 2 10,0 10,0 80,0

106 1 5,0 5,0 85,0

107 1 5,0 5,0 90,0

108 2 10,0 10,0 100,0

Total 20 100,0 100,0

Clase social de los niños


Porcentaje Porcentaje

Frecuencia Porcentaje válido acumulado

Válido Baja 10 50,0 50,0 50,0

Alta 10 50,0 50,0 100,0

Total 20 100,0 100,0

Quinto paso: Estadísticos Descriptivos.

Estura de los Clase social

niños de los niños

N Válido 20 20

Perdidos 0 0

Media 102,95 1,50

Mediana 103,00 1,50

Moda 102a 1a

Desv. Desviación 3,069 ,513

Varianza 9,418 ,263

Asimetría -,045 ,000

Error estándar de ,512 ,512

asimetría

Curtosis -,604 -2,235

Error estándar de ,992 ,992

curtosis

Rango 11 1
Mínimo 97 1

Máximo 108 2

Percentiles 25 100,25 1,00

50 103,00 1,50

75 105,00 2,00

a. Existen múltiples modos. Se muestra el valor más

pequeño.

Sexto paso: Gráficos.


PRUEBA NO PARAMÉTRICA

En la estadística no paramétrica vamos a estudiar modelos y pruebas estadísticas, cuya

distribución no suele ajustarse a los criterios paramétricos. Estos métodos se utilizan cuando no

se puede suponer que los datos tengan una distribución conocida. Por tanto, se trata de los

contrastes que no hacen suposiciones sobre los parámetros y se limitan al análisis de las

propiedades nominales y ordinales de los datos. El término distribución libre indica una

varianza que no es necesario demostrar sobre las poblaciones de las que se tomaron las

muestras extraídas. (Gómez-Gómez et al., 2019)

CHI CUADRADO

El chi cuadrado es una muestra que permite averiguar la distribución de una variable

categórica, sirve para someter una prueba de hipótesis referida a la distribución, se lo utiliza

para comprobar la independencia entre dos variables, cual el valor de x2 es menos probable la

hipótesis nula y optaremos por la hipótesis alternativa. (Quevedo Ricardi, 2011)


Ejemplo

En el centro de salud del Cantón Azogues se analiza todas las historias clínicas (200 hombres

y 100 mujeres) de los cuales 12 hombres y 20 mujeres han acudido por COVID

Paso 1: Establecer la hipótesis existente entre las 2 variables (género y COVID).

Ho = género = COVID: Las dos variables no están relacionadas por lo tanto son

independientes.

H₁ = género ≠ COVID: Las dos variables sí están relacionadas es decir son dependientes.

Paso 2. Crear la tabla con los datos obtenidos, conocida también como tabla de 2x2.

Tabla 1. Datos obtenidos

Historias Clínicas COVID-19 NO COVID-19 TOTALTES


Mujeres 20 80 100
Hombre 12 188 200
TOTALES 32 268 300

Fuente: Centro de salud cantón Azogues

Elaborado: grupo 4.

Paso 3. Calcular los valores esperados, para ello se aplica la siguiente fórmula:

total de la fila∗total de la columna


Ve=
total de los totales

100∗32
Ve= =10 , 66 → Mujeres
300

200∗32
Ve= =21 , 33 → Hombres
300

Valores esperados:
Tabla 2. Datos esperados

Historias Clínicas COVID-19 NO COVID-19 TOTALTES


Mujeres 10,66 89,34 100
Hombre 21,33 178,67 200
TOTALES 31,99 268 300

Fuente: Centro de salud cantón Azogues

Elaborado: grupo 4.

Gráfico 1

Valores esperados de COVID-19


350

300

250

200

150

100

50

0
COVID-19 NO COVID-19 TOTALTES

Mujeres Hombre TOTALES

Fuente: Centro de salud cantón Azogues

Elaborado: grupo 4.

Paso 4. Aplicar la fórmula de chi cuadrado

[ ]
k 2
(Oi−Ei)
X =∑
2

i=1 Ei
2 ( 20−10.66 )2 ( 80−89.34 )2 ( 12−21.33 )2 ( 188−178 , 67 )2
X = + + + =13 ,71
10 ,66 89.34 21.33 178 ,67

Paso 5. Calcular los grados de libertad (gl)

Nivel de significación: 0.05

gl = (f-1) (c-1), donde:

F= filas

C= columnas

gl = (2-1) (2-1) = 1

Tabla 3. DISTRIBUCIÓN DE X2

DISTRIBUCIÓN DE X2

GRADOS PROBABILIDAD
DE
0,001
LIBERTA 0,002 0,005 0,01 0,025 0,05 0,01 0,15 0,20 0,25 0,30
D 5

1 10,83 9,14 7,87 6,63 5,02 3,84 2,70 2,07 1,64 1,32 1,07

2 13,82 11,98 10,59 9,21 7,37 5,99 4,60 3,79 3,21 2,77 2,40

3 16,26 14,32 12,83 11,34 9,34 7,81 6,25 5,31 4,64 4,10 3,66
4 18,46 16,42 14,86 13,27 11,14 9,48 7,77 6,74 5,98 5,38 4,87

5 20,51 18,38 16,74 15,08 12,83 11,07 9,23 8,11 7,28 6,62 6,06

6 22,45 20,24 18,54 16,81 14,44 12,59 10,6 9,44 8,55 7,84 7,23
4

7 24,32 22,04 20,27 18,47 16,01 14,06 12,0 10,7 9,80 9,03 8,38
1 4

8 26,12 23,77 21,95 21,09 17,53 15,50 13,3 12,0 11,0 10,21 9,52
6 2 3

9 27,87 25,46 23,58 21,66 19,02 16,91 14,6 13,2 12,2 11,38 10,6
8 8 4 5

10 29,58 27,11 25,18 23,20 20,48 18,30 15,9 14,5 13,4 12,54 11,7
8 3 4 8

Fuente: Datos obtenidos de Medwave, 2011

Elaborado: Grupo 4.

Paso 6. Interpretación

El punto crítico obtenido en chi cuadrado en (0.05; 1) es = 3,84.

Dado que la probabilidad de Chi cuadrado es de 13,71, concluimos que es mayor al punto

crítico con un nivel de confianza del 95%, por lo tanto, se acepta la hipótesis nula y por ende se

rechaza la hipótesis alternativa. (Quevedo Ricardi, 2011)


APLICACIÓN SPSS

Tablas de contingencia

Notas
Resultados creados 26-JUL-2022 19:39:11
Comentarios
Conjunto de datos Conjunto_de_datos0
activo
Filtro <ninguno>
Entrada Peso <ninguno>
Dividir archivo <ninguno>
Núm. de filas del 300
archivo de trabajo
Los valores perdidos definidos
Definición de los
por el usuario serán tratados
perdidos
como perdidos.
Tratamiento de los Los estadísticos de las tablas se
valores perdidos basan en todos los casos con
Casos utilizados datos válidos en los rangos
especificados para todas las
variables de las tablas.
CROSSTABS
/TABLES=Genero BY
Historiaclinica
/FORMAT=AVALUE TABLES
Sintaxis
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED
/COUNT ROUND CELL
/BARCHART.
Tiempo de procesador 00:00:01,11
Tiempo transcurrido 00:00:00,86
Recursos Dimensiones 2
solicitadas
Casillas disponibles 131029

[Conjunto_de_datos0]

Resumen del procesamiento de los casos


Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Genero * 200 66,7% 100 33,3% 300 100,0%
Historiaclinica

Tabla de contingencia Genero * Historiaclinica


Historiaclinica Total
Covid No covid
Recuento 20 80 100
Femenino Frecuencia 16,0 84,0 100,0
esperada
Genero
Recuento 12 88 100
Masculino Frecuencia 16,0 84,0 100,0
esperada
Total Recuento 32 168 200
Frecuencia 32,0 168,0 200,0
esperada

Pruebas de chi-cuadrado
Valor gl Sig. Sig. exacta Sig. exacta
asintótica (bilateral) (unilateral)
(bilateral)
Chi-cuadrado de 2,381a 1 ,123
Pearson
Corrección por 1,823 1 ,177
continuidadb
Razón de 2,402 1 ,121
verosimilitudes
Estadístico exacto de ,176 ,088
Fisher
Asociación lineal por 2,369 1 ,124
lineal
N de casos válidos 200

a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima


esperada es 16,00.
b. Calculado sólo para una tabla de 2x2.
Ejemplo 2

En un centro de salud se analiza todas las historias clínicas (229 hombres y 192 mujeres) de

los cuales 10 hombres y 24 mujeres han acudido por infecciones estomacales

Paso 1: Establecer la hipótesis existente entre las 2 variables (género y afección estomacal).

Ho = (género) = (afecciones estomacales): Las dos variables no están asociadas, son

independientes.

H₁ = (género) ≠ (afecciones estomacales): Las dos variables si están asociadas.

Paso 2: Construir una tabla (2 x 2) con la información brindada.

Valores observados:

TOTALES
Infecciones No infecciones
estomacales estomacales

Hombres 10 282 292

Mujeres 24 168 192

TOTALES 34 450 484

Paso 3: Calcular los valores esperados.

(total fila)×(total columna)


Ve=
total de lostotales

(292)×(34)
V e=
484

V e=20 , 51

Valores esperados:

Infecciones No infecciones TOTALES


estomacales estomacales

Hombres 20,5 271,5 292


Mujeres 13,5 178,5 192
TOTALES 34 450 484

Gráfico 2

Historias clínicas datos esperados


600

500

400
Totales

300

200

100

0
271,5 178,5 450
20,5 13,5 34
Infecciones/noinfeccciones
Fuente: Centro de salud cantón Azogues

Elaborado: grupo 4.

Paso 4: Ampliar la ecuación del Ji cuadrado.

( O−E )2
X 2 =∑
E

Como hay cuatro casillas se puede realizar Ji cuadrado.

( 10−20.5 )2 ( 282−271.5 )2 ( 24−13.5 )2 ( 168−178.5 )2


X2= + + + =14.57
20.5 271.5 13.5 178.5

Paso 5: Calcular los grados de libertad (gl).

Se tiene: (f) filas con (c) columnas; entonces, gl = (f-1) (c-1) = gl = (2-1) (2-1) = 1

Tabla 2. DISTRIBUCIÓN DE X2

DISTRIBUCIÓN DE X2

GRADOS PROBABILIDAD
DE
0,001
LIBERTAD 0,002 0,005 0,01 0,025 0,05 0,01 0,15 0,20 0,25 0,30
5

1 10,83 9,14 7,87 6,63 5,02 3,84 2,70 2,07 1,64 1,32 1,07

2 13,82 11,98 10,59 9,21 7,37 5,99 4,60 3,79 3,21 2,77 2,40

3 16,26 14,32 12,83 11,34 9,34 7,81 6,25 5,31 4,64 4,10 3,66

4 18,46 16,42 14,86 13,27 11,14 9,48 7,77 6,74 5,98 5,38 4,87
5 20,51 18,38 16,74 15,08 12,83 11,07 9,23 8,11 7,28 6,62 6,06

6 22,45 20,24 18,54 16,81 14,44 12,59 10,64 9,44 8,55 7,84 7,23

7 24,32 22,04 20,27 18,47 16,01 14,06 12,01 10,74 9,80 9,03 8,38

8 26,12 23,77 21,95 21,09 17,53 15,50 13,36 12,02 11,03 10,21 9,52

9 27,87 25,46 23,58 21,66 19,02 16,91 14,68 13,28 12,24 11,38 10,65

10 29,58 27,11 25,18 23,20 20,48 18,30 15,98 14,53 13,44 12,54 11,78

Fuente: Datos obtenidos de Medwave, 2011

Elaborado: Grupo 4.

Interpretación

El punto crítico obtenido en chi cuadrado en (0.05;1) es = 3,84. Por tanto, se afirma la relación

entre sexo e infecciones estomacales.

APLICACIÓN SPSS
FILE='C:\Users\Lenovo\Downloads\ji cuadrado de ejercicio de materia (1).sav'.
DATASET NAME Conjunto_de_datos1 WINDOW=FRONT.
CROSSTABS
/TABLES=Género BY HistoriaClínica
/FORMAT=AVALUE TABLES
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED
/COUNT ROUND CELL
/BARCHART.

Tablas de contingencia

Notas
Resultados creados 26-JUL-2022 20:51:09
Comentarios
Entrada C:\Users\Lenovo\Downloads\ji
Datos cuadrado de ejercicio de materia
(1).sav
Conjunto de datos Conjunto_de_datos1
activo
Filtro <ninguno>
Peso <ninguno>
Dividir archivo <ninguno>
Núm. de filas del 484
archivo de trabajo
Los valores perdidos definidos
Definición de los
por el usuario serán tratados
perdidos
como perdidos.
Tratamiento de los Los estadísticos de las tablas se
valores perdidos basan en todos los casos con
Casos utilizados datos válidos en los rangos
especificados para todas las
variables de las tablas.
CROSSTABS
/TABLES=Género BY
HistoriaClínica
/FORMAT=AVALUE TABLES
Sintaxis
/STATISTICS=CHISQ
/CELLS=COUNT EXPECTED
/COUNT ROUND CELL
/BARCHART.
Tiempo de procesador 00:00:00,31
Tiempo transcurrido 00:00:00,30
Recursos Dimensiones 2
solicitadas
Casillas disponibles 131029

[Conjunto_de_datos1] C:\Users\Lenovo\Downloads\ji cuadrado de ejercicio de materia (1).sav


Resumen del procesamiento de los casos
Casos
Válidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
Género * 484 100,0% 0 0,0% 484 100,0%
HistoriaClínica

Tabla de contingencia Género * HistoriaClínica


HistoriaClínica Total
Infecciones Infecciones
estomacales no
estomacales
Recuento 10 282 292
Masculino Frecuencia 20,5 271,5 292,0
esperada
Género
Recuento 24 168 192
Femenino Frecuencia 13,5 178,5 192,0
esperada
Recuento 34 450 484
Total Frecuencia 34,0 450,0 484,0
esperada

Pruebas de chi-cuadrado
Valor gl Sig. Sig. exacta Sig. exacta
asintótica (bilateral) (unilateral)
(bilateral)
Chi-cuadrado de 14,607a 1 ,000
Pearson
Corrección por 13,251 1 ,000
continuidadb
Razón de 14,326 1 ,000
verosimilitudes
Estadístico exacto de ,000 ,000
Fisher
Asociación lineal por 14,577 1 ,000
lineal
N de casos válidos 484

a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima


esperada es 13,49.

Pruebas de independencia condicional

Chi-cuadrado gl Sig. asintótica (bilateral)

De Cochran 14,607 1 ,000


Mantel-Haenszel 13,223 1 ,000

Bajo el supuesto de independencia condicional, el estadístico de Cochran se distribuye


asintóticamente según una distribución de chi-cuadrado con 1 gl, sólo si el número de
estratos es fijo, mientras que el estadístico de Mantel-Haenszel se distribuye siempre
asintóticamente según una distribución de chi-cuadrado con 1 gl. Tenga presente que se
suprime la corrección por continuidad del estadístico de Mantel-Haenszel cuando la suma de
las diferencias entre lo observado y lo esperado es igual a 0.

Pruebas de homogeneidad de la razón de las ventajas

Chi-cuadrado gl Sig. asintótica


(bilateral)
Breslow-Day ,000 0 .
De Tarone ,000 0 .

Estimación de la razón de las ventajas común de Mantel-Haenszel

Estimación ,248
ln(estimación) -1,393
Error típ. de ln(estimación) ,389
Sig. asintótica (bilateral) ,000
Límite inferior ,116
Razón de ventajas común
Intervalo de confianza Límite superior ,532
asintótico al 95% Límite inferior -2,155
ln(Razón de ventajas común)
Límite superior -,631
La estimación de la razón de las ventajas común de Mantel-Haenszel se
distribuye de manera asintóticamente normal bajo el supuesto de razón de
las ventajas común igual a 1,000. Lo mismo ocurre con el log natural de la
estimación.

Elaborado por: Grupo 4

Fuente: SPSS
MARCO CONCEPTUAL

BIOESTADÍSTICA: Ciencia en la que se obtienen y analizan datos biológicos o de salud por

medio de métodos estadísticos.

CHI CUADRADO: esta prueba contrasta frecuencias observadas con las frecuencias

esperadas de acuerdo con la hipótesis nula.

T STUDENT: Es un tipo de estadística deductiva. Se utiliza para determinar si hay una

diferencia significativa entre las medias de dos grupos.

EXCEL: Es una herramienta muy eficaz para obtener información con significado a partir de

grandes cantidades de datos. También funciona muy bien con cálculos sencillos y para realizar

el seguimiento de casi cualquier tipo de información.

SPSS: Este software proporciona a los investigadores herramientas que permiten consultar

datos y formular hipótesis de forma rápida, ejecutar procedimientos para aclarar las relaciones

entre variables, identificar tendencias y realizar predicciones.


CONCLUSIONES

 El programa SPSS facilita de manera óptima un correcto cálculo de los datos que se
dispongan a partir de una muestra, este programa no solo permite asegurar o consultar
varias cuestiones y características de la estadística actual, también permite funciones
avanzadas que asegurara un correcto manejo y respuestas independientemente de su
uso en los distintos modelos estadísticos que incluye.

 El SPSS es una herramienta que, debido a su facilidad de uso, nos proporcionó una
ayuda indispensable en el manejo de las pruebas paramétricas y no paramétricas,
mediante los pasos que permitirán plantear las hipótesis determinando así una
diferencia significativa de los resultados ya sea con la aplicación del T-student o el Chi-
cuadrado.
 Todos los profesionales de diferentes áreas necesitan aplicar análisis estadísticos de
datos y hacen uso del SPSS por su confiabilidad en el manejo, tabulación y obtención
de los resultados, en las ciencias médicas es elemental el uso de este programa para la
investigación de valores referentes a tasas de mortalidad, incidencia, prevalencia y
demás datos que no pueden ser calculados de forma manual ya que supondría un error
estadístico muy alto, ante ello el SPSS es importante y conocer su uso es aún más
necesario para obtener los resultados correctos.
RECOMENDACIONES

 Para el uso del SPSS es necesario determinar y asegurar que los datos que serán

utilizados hayan sido correctamente recopilados o extraídos mediante los diferentes

procesos que hemos visto hasta ahora para así evitar resultados que no vayan acorde a

una investigación independientemente del campo al cual se aplique.

 Una recomendación para el uso del SPSS en cualquiera de los modelos o cálculos

estadísticos en los que se puede aplicar, es necesario la utilización de un libro de

códigos, el cual no es más que una ficha en que se incluyen todos los valores

numéricos asignados a cada una de las variables, de manera que, al momento de

ingresar los datos a SPSS, el investigador, así como los digitadores sepan que rango de

valores debe usar cada una de las variables.

 Se recomienda realizar una correcta búsqueda e instalación del programa desde

servidores que no manejen herramientas de uso sospechoso que manejen virus o

programas piratas ya que aquello determinaría un grave peligro en el uso del programa

donde se podría perder los datos y generar resultados alterados relacionado a esta

problemática.
BIBLIOGRAFÍAS

1. Saino Marin. (2016). Procedimientos no paramétricos de prueba de hipótesis. Rev

Estadística II, 21(4), 175-223

2. Gómez-Gómez, M., Danglot-Banck, C., & Vega-Franco, L. (2019). Sinopsis de pruebas


estadísticas no paramétricas. Cuándo usarlas. 10.
3. Hernández, et al. (2017). Chi cuadrado. Rev. Medicentro bioestadística, 21(2), 123-136

4. Medina-Toro, Francys M., Jimenez-Ortiz, Jose L., Aragón-Castillo, Jason, Frutos-Najera,

Daniela G., & Muñoz-Palomeque, Manuel. (2022). Calidad de vida en estudiantes de

ciencias de la salud de una universidad privada en Nuevo León, México. Revista de la

Facultad de Medicina Humana, 22(1), 89-94. Epub 31 de diciembre de 2021.

https://dx.doi.org/10.25176/rfmh.v22i1.4119

5. Flores-Ruiz, Eric, Miranda-Novales, María Guadalupe, & Villasís-Keever, Miguel Ángel.

(2017). El protocolo de investigación VI: cómo elegir la prueba estadística adecuada.

Estadística inferencial. Revista alergia México, 64(3), 364-370.

https://doi.org/10.29262/ram.v64i3.304

6. Quevedo Ricardi, F. (2011). The chi-square. Medwave, 11(12), e5266-e5266.


https://doi.org/10.5867/medwave.2011.12.5266

También podría gustarte