Tema 6 - 5
Tema 6 - 5
Tema 6 - 5
El valor más frecuente, o sea el que más se repite, se denomina modo o moda.
En el ejemplo, observamos que lo más frecuente fueron períodos de incubación
de 16 días (4 veces). Este valor puede ser utilizado para representar el período
de incubación en este grupo; i.e., “el período de incubación de rubéola más
frecuente es de 16 días”.
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11)
15 15 15 16 16 16 16 19 20 32 37
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
15 15 15 16 17 18 19 20 32 37
Se puede constatar que en esta serie no hay un valor central. Para calcular la
mediana se suman los dos valores centrales (en el caso, 17 y 18) y se divide el
resultado entre dos:
El promedio de 19,7 días es mayor que los valores del modo y de la mediana
ya que, como toma en cuenta los valores de todos los casos, se ve afectado
por la influencia de los casos con 32 y 37 días de incubación, que son valores
extremos.
En muchas ocasiones los datos están disponibles como distribución de
frecuencias, en cuyo caso la serie se presentaría de la manera siguiente:
Las medidas de tendencia central son de gran utilidad también para comparar
grupos de valores. Por ejemplo, de las personas que participaron en un paseo,
un grupo se enfermó después de la comida y otro grupo no presentó ningún
síntoma. Las edades de las personas en los dos grupos fueron las siguientes:
Por lo tanto la enfermedad afectó más a los niños que a los adultos. Los niños
eran más susceptibles o se expusieron más (consumieron mayor cantidad del
alimento contaminado).
Series agrupadas
En donde:
• Li = Límite inferior del intervalo de la posición de la mediana.
• PM = Posición de la mediana.
• fIPM = Frecuencia acumulada del intervalo anterior a la posición de la
mediana.
• fPM = Frecuencia de la posición de la mediana.
• AIPM = Amplitud del intervalo de la posición de la mediana.
En donde:
• 2.228 = caso situado en el punto medio de la serie
• 1.565 = casos acumulados en el intervalo anterior al que contiene el caso
2.228
• 784 = casos del intervalo que contiene la mediana
• 10 = amplitud del intervalo
Medidas de dispersión
Cuando nuestros datos sobre una variable continua están agrupados también
podemos calcular la varianza y correspondiente desviación estándar
aproximadas. Para ello, al igual que para estimar la media en datos agrupados,
se parte de la columna con los puntos medios (x) de cada intervalo de clase.
Luego generamos tres columnas; una con las diferencias entre el punto medio
de cada intervalo de clase y la media de nuestros datos (x - ) llamada
desviación; otra con esta desviación elevada al cuadrado (x - )2 llamada
desviación cuadrática y, finalmente, otra columna (f (x - )2), resultado de
multiplicar la desviación cuadrática por el número de casos (f) del intervalo
correspondiente (Cuadro 3.4c). La suma de todos estos productos (Σf (x - )2)
dividida entre la suma de casos (Σf) nos da una razonable aproximación a la
varianza y extrayendo su raíz cuadrada obtendremos un estimado aceptable de
la desviación estándar de nuestros datos agrupados.
Y la
correspondiente desviación estándar (D.E., o “S”) para datos agrupados sería:
Mientras que si utilizáramos en el cálculo los 4.457 casos, uno a uno,
obtendríamos una desviación estándar de 15,3 años de edad.
Finalmente, otra forma útil de representar la dispersión de la distribución de una
serie de datos es usando cuartiles, que son los valores que ocupan una
determinada posición en función de la cantidad de partes iguales en que se ha
dividido una serie ordenada de datos. Si dividimos nuestra serie en 100 partes
iguales, hablamos de percentiles; si la dividimos en 10 partes iguales, deciles;
en cinco partes, quintiles; y en cuatro, cuartiles.
Como ejemplo, el Cuadro 3.5 presenta nueve percentiles de edad
correspondientes a la serie de casos de malaria del Cuadro 3.2: el percentil 25
de esta distribución es 33 años, que equivale a decir que 25% de los casos
tenían edad menor o igual a 33 años (y, en consecuencia, 75% de los casos
eran mayores de 33 años). Nótese que la mediana de la distribución
corresponde al percentil 50 (o cuartil 2).
Una vez que se ha revisado la forma de presentación de los datos, las medidas
de tendencia central y de dispersión de los mismos, se continúa con el estudio
de las distintas distribuciones o modelos teóricos. El más conocido de ellos es
la llamada Curva Normal (Gráfico 3.7) que acabamos de introducir. Existen
otros modelos teóricos que tienen aplicación en Epidemiología y Salud Pública,
pero que van más allá de los objetivos de este taller. Mencionaremos que la