0% encontró este documento útil (0 votos)
39 vistas

Medidas de Variabilidad O Dispersión

Este documento presenta diferentes medidas de variabilidad o dispersión de datos estadísticos, incluyendo el rango, rango intercuartílico, diagrama de caja y bigotes, varianza y desviación estándar. Explica que las medidas de variabilidad miden cuánto varían los datos respecto al promedio. Luego, define y da ejemplos de cada medida.

Cargado por

Cabau Dadelos
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
39 vistas

Medidas de Variabilidad O Dispersión

Este documento presenta diferentes medidas de variabilidad o dispersión de datos estadísticos, incluyendo el rango, rango intercuartílico, diagrama de caja y bigotes, varianza y desviación estándar. Explica que las medidas de variabilidad miden cuánto varían los datos respecto al promedio. Luego, define y da ejemplos de cada medida.

Cargado por

Cabau Dadelos
Derechos de autor
© © All Rights Reserved
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 15

UNIVERSIDAD MAYOR DE SAN ANDRES

FACULTAD DE MEDICINA, ENFERMERIA, NUTRICION Y TECNOLOGIA MÉDICA

CARRERA: MEDICINA

CATEDRA: SALUD PÚBLICA II

MEDIDAS DE
VARIABILIDAD O
DISPERSIÓN

DOCENTE: Dr. Guido Condarco


INTEGRANTES:
- Calle Bautista Soledad
- Calle Ramos Gisela
- Camasita Apaza Erika
- Caparicona Mamani Madelin Aracely
GRUPO: Lunes - Miércoles de 7:00 a 9:00 a.m.

LA PAZ – BOLIVIA
2023
INDICE:
INTRODUCCION
1. RANGO O AMPLITUD
2. RANGO MEDIO INTERCUARTILICO
3. DIAGRAMA DE TUKEY O DE (CAJA Y BIGOTES)
4. VARIANZA
5. DESVIACION ESTANDAR
6. COEFICIENTE DE VARIACION
7. BIBLIOGRAFIA
INTRODUCCION

Las medidas de dispersión se utilizan para medir la variabilidad de los datos con
relación a la media.
Las medidas de variabilidad o dispersión se clasifican en:
- MEDIDAS DE VARIABILIDAD ABSOLUTAS: Cuando su valor esta expresado
en la misma unidad de medida de los datos originales. Las principales medidas de
variabilidad absolutas son:
1. Rango
2. Variancia o varianza
3. Desviación estándar
- MEDIDAS DE VARIABILIDAD RELATIVA: Cuando su valor carece de unidad de
medida; la medida de variabilidad relativa que se usará es: El Coeficiente de
variación o variabilidad
1. EL RANGO O AMPLITUD
El rango es una medida de (distancia), a través de la cual se distribuyen todos los
datos de la muestra o población. Se calcula por la diferencia entre el dato mayor
(valor máximo) y dato menor (valor mínimo) que toma la variable.
Un valor del rango diferente de cero nos indica la presencia de variabilidad de los
datos.
Para datos sin agrupar: Rango = Dato mayor− Dato Rango
Para datos agrupados: Rango = LS k − LI1 menor
Donde:
LS k = límite superior de la última clase
LI1 = límite inferior de la primera clase
Ejemplo:
Se registraron las edades de los pacientes que fueron internados en el primer día
del mes de marzo en el hospital general de Singapur. Calcular el rango.
26 30 54 11 32

 Primero se debe ordenar: 11 26 30 32 54

 Para calcular el rango: R = 54 – 11

R = 43
El límite superior es 54 y el inferior 11, dando de rango 43 que indica la cantidad
de espacios entre los extremos.
Ejemplo: para datos agrupados:
En el centro de Salud Villa Dolores se registran las edades de 50 personas
atendidas por el personal de salud dentro de una semana en el mes de junio

38 15 10 12 2 46 25 56 27 24 23 21 20 25 38 27 48 35 50 65 59 58 47 42 37 35
32 40 28 14 12 24 66 73 72 70 68 65 54 48 34 33 21 19 61 59 47 46 30 30
Observando los datos de edades de personas, identificamos la edad mayor y la
edad menor para hallar el rango

38 15 10 12 2 46 25 56 27 24 23 21 20 25 38 27 48
35 50 65 59 58 47 42 37 35 32 40 28 14 12 24 66 73
72 70 68 65 54 48 34 33 21 19 61 59 47 46 30 30

Valor máximo: 73 años hallando el rango:


Valor mínimo: 10 años R = 73 – 10
R = 63 años
2. RANGO MEDIO INTERCUARTÍLICO
Es otra medida útil de la dispersión o difusión. Se utiliza cuando la mediana
se usa como la medida de tendencia central.
Se da el intervalo en el que la media se encuentra en el 50 % de la
distribución, para describir esto en detalle, primero necesitamos saber que
significa un cuartil. Supóngase que se comienza con un gran conjunto de
datos de las alturas de todos los varones adultos en México.

Se pueden representar estos


datos en un gráfico, que, si se
suavizan un poco, puede
parecerse a la figura 1

El segundo cuartil o mediana: Es fácil


ver cómo se divide el área en la figura 1
en dos partes iguales, ya que el gráfico
es simétrico. El punto que da 50 % de la
superficie a la izquierda de la misma y 50
% a la derecha a la que se le llama el
segundo cuartil o mediana. Esto se
ilustra en la Figura 2.
Esto corresponde exactamente a la idea
previa de la mediana como el valor
medio.
El primer cuartil: El primer cuartil es el
punto que nos da 25 % de la superficie
a la izquierda de la misma y 75 % a la
derecha del mismo. Esto significa que
25 % de las observaciones están a
menos de o igual al primer cuartil y 75
% de las observaciones superiores o
iguales al primera cuartil. El primer
cuartil es también llamado el percentil
25. Esto se ilustra en la Figura 4.

En resumen: El primero (Q1),


segundo (Q2) y tercero (Q3)
cuartiles dividen la distribución
en cuatro iguales partes. Esto
se ilustra en la Figura 5.

Ejemplo:
En un conjunto pequeño de datos de doce observaciones que se encuentran en
orden ascendente, es decir, donde un conjunto de datos, donde el número de
observaciones es un múltiplo de cuatro, ha sido elegido para evitar algunas
dificultades técnicas.

En este caso, se dividirán los datos en cuatro grupos iguales, por lo que hay un 25
% de las observaciones en cada uno. En primer lugar, se encuentran con la
mediana tal como se encuentra anteriormente:

La mediana es 20,5 (a
mitad de camino entre la 6ª y 7ª observación), y se dividen los datos en dos
conjuntos iguales con exactamente el 50 % de las 5 observaciones en cada uno:
de la 1ª a la 6ª observación en el primer conjunto y del 7ª a la 12ª observación en
el otro
Para encontrar el primer cuartil se tiene en cuenta las observaciones menos que la
mediana.
El primer cuartil es la mediana de estos datos. En
este caso, el primer cuartil es medio camino entre la 3ª y 4ª observaciones y es
igual a 19,5. Ahora, se tiene en cuenta las observaciones
que son mayores que la mediana.

El tercer cuartil es la mediana de estos datos y es igual a 23,5.


Por lo tanto, el pequeño conjunto de datos de 12 observaciones, los cuartiles
dividen el conjunto en cuatro subgrupos.

Entonces el rango medio intercuartílico es una medida de dispersión de un


conjunto de datos que expresa la diferencia o la distancia entre el primer y el
tercer cuartil, para este ejemplo debemos restar Q3 Y Q1
RIC = 23,5 - 19,5
RIC = 4
El rango medio intercuartílico de este conjunto de datos es 4. Cuanto mayor es el
rango intercuartílico, mayor la dispersión entre los datos.
Utilidad:
 Mirar la dispersión nos permite ver qué tanto varían los datos.
 El rango es una manera rápida de tener una idea de la dispersión.
 Lleva más tiempo encontrar el RIQ, pero a veces nos da información más
útil sobre la dispersión.

3. DIAGRAMA DE TUKEY o (CAJA Y BIGOTES)
El diagrama de cajas (“box plot” en inglés) es un gráfico que representa una
variable cuantitativa o cualitativa a través de los cuartiles.
Es una herramienta útil para representar conjuntos de datos tanto discretos como
continuos.
Es importante tener en cuenta que las variables cualitativas que pretenden
representar un orden o una categoría, siempre tienen que ir ligadas a un índice
numérico mayor que 0 para que puedan aparecer en el gráfico y se puedan
calcular los estadísticos correspondientes.
3.1. MORFOLOGÍA DE LA CAJA
En su forma más simple, el gráfico de caja representa cinco datos estadísticos en
una sola dimensión: el valor mínimo, el cuartil inferior Q1 (percentil 25), la
mediana = Q2, el cuartil superior Q3 (percentil 75) y el valor máximo.

• Caja: La longitud de la caja representa la distancia entre los cuartiles Q1- Q3


(percentiles 25 y 75): el tramo de la escala que va desde el primer cuartil al tercer
cuartil de la distribución (rango intercuartílico o rango intercuartil). Esto incluye el
50 % de las observaciones centrales.
• Punto interior de la caja: Representa la media.
• Línea interior de la caja: Representa la mediana que es igual al cuartil Q2
• Líneas verticales (bigotes): Representan los valores máximos (corte superior) y
mínimos (corte inferior) del conjunto de datos. Sirven como referencia para ubicar
las observaciones que están por fuera del 50% central de la distribución. Por tanto,
estos diagramas descriptivos son muy valiosos para observar los valores atípicos
(‘outliers’ observación anormal y extrema en una muestra estadística) y las
dispersiones de los puntos con respecto a los percentiles.

3.2. VENTAJAS Y DESVENTAJAS DEL DIAGRAMA DE CAJA


Ventajas
- Visión globalizada de la frecuencia absoluta de una variable cuantitativa o
cualitativa.
- Conocimiento del mínimo, máximo y cuartiles del conjunto de datos sin tener
que calcularlos.
- Reconocimiento de los valores extremos más rápido que con un histograma
debido a que los valores extremos están indicados con circunferencias fuera del
máximo y mínimo.
Desventajas
- Si el conjunto de datos es pequeño, hacer un diagrama de caja para
expresar esos datos hará más difícil su comprensión.
3.3. PRESENTACION DEL DIAGRAMA DE CAJA
La presentación del diagrama de caja será de forma vertical u horizontal sin las
etiquetas que corresponden a los cuartiles Q1, Q2 y Q3.

3.4. TIPOS DE DISTRUBUCION:

- Distribución Simétrica.- los


valores intercuartilicos están
igualmente dispersos.

- Distribucion Positivamente
Asimetrica.- los valores mas
grandes se encuentran mas
dispersos que los mas pequeños.

- Distribución
Negativamente Asimétrica.-
los valores más pequeños se
encuentran más dispersos
que los más grandes
4. VARIANZA:

Es una medida de dispersión que cuantifica la variabilidad de los valores (datos)


individuales con relación a la media o promedio.

Si los valores de las distancias son iguales, el valor de la varianza es cero.

Si los valores son diferentes pero cercanos entre sí, la varianza es pequeña.

Si los valores están muy distantes, la varianza es grande.

Se puede definir también como la sumatoria de las diferencias de cada uno de los
datos con respecto a la media dividida entre el número de elementos (si
queremos hallar la varianza de una población) o el número de elementos menos
uno (si queremos hallar la varianza de una muestra).

Se calcula restando de cada observación el valor de la media; las diferencias se


elevan al cuadrado, luego la sumatoria se divide entre el número de elementos o
el número de elementos menos uno.

Las diferencias se elevan al cuadrado para desaparecer los signos negativos que
se generan al restar la media a cada uno de los valores, de esta manera se evita
que la suma algebraica de estas diferencias den como resultado cero.

Cuando se trata de una población el símbolo de la varianza es: σ 2 (sigma


cuadrado)

Cuando corresponde a una muestra es: s2

Las fórmulas para obtener la varianza de población y muestra respectivamente,


son las siguientes:
Donde:

: Varianza poblacional.

: Varianza de la muestra.

: valor individual (dato individual).

Y : media poblacional y media muestral.

y : número de elementos de la población y número de elementos de la


muestra.

 (Sumatoria)

EJEMPLO:

Estas son las edades de una muestra de 10 escolares: 4, 5. 6. 7, 8, 10, 11, 13, 14,
16.

El promedio o media del grupo es igual a: x   xn  9410  9,4 años.

(Podemos elaborar una tabla en la que se resta los valores individuales de la


media y posteriormente elevar ese valor al cuadrado).
Por lo tanto, la varianza de una muestra de diez escolares es de: 16,5 años 2. Pero
no podemos tomar este valor de la varianza, ya que no existen años al cuadrado,
así que debemos obtener la raíz cuadrada, y así esta nueva medida, será la
desviación estándar o también llamada desviación típica.

USOS:

1. Se usa como elemento importante para realizar diferentes pruebas de inferencia


estadística.

2. Sirve para calcular la desviación estándar, medida muy utilizada en las ciencias
de la salud para analizar la variabilidad de los datos cuantitativos.

3. Sirve para calcular el tamaño de muestras cuando se requiere estudiar una


variable cuantitativa.

5. DESVÍO ESTANDAR
El desvío estándar es una medida de dispersión que mide la distancia de los datos
con relación a la media, y resulta de extraer la raíz cuadrada de la varianza
(sumatoria de las variables elevadas al cuadrado, sumadas y divididas entre su
universo “n”)
Es la medida de dispersión más utilizada en las investigaciones por ser la más
estable. Se le designa con la letra S cuando se trabaja con una muestra y con la
letra griega minúscula σ al trabajar con una población.
Su valor se encuentra en relación directa con la dispersión de datos, a mayor
dispersión mayor desviación típica, y a menor dispersión menor desviación típica,
durante muchos años la media y el desvío estándar fueron y tal vez sigan siendo
las medidas resumen más utilizadas

σ =√ σ s= √ s
2 2
La desviación estándar nos permite determinar, con un buen grado de precisión,
dónde están localizados los valores de una distribución de frecuencias con
relación a la media
CAMPANA DE GAUSS
Además de medir la dispersión de los datos en áreas precisas, nos permite
calcular el número de componentes en dichas áreas o probabilidad de encontrarlo
cuando trabajamos con el promedio, nos da argumentos para mirar el conjunto
hacia el centro en función de las áreas.
Cuando la distribución de la población o muestra sigue una distribución normal
en el área existente entre el promedio un 1 desvío positivo y 1 desvío negativo
(±1s), se concentrarán aproximadamente 68% de los datos, entre ±2s
encontraremos al 95% de los datos, y entre ±3s abarcaremos alrededor del 99%
de los datos. Podemos representar estos valores en una figura llamada campana
de Gauss con forma de campana, simétrica, donde la moda, la mediana y el
promedio coincidan en el centro
6. COEFICIENTE DE VARIACIÓN
El coeficiente de variación es una medida de dispersión relativa de los datos, se
obtiene dividiendo el desvío estándar entre el promedio y se multiplica por cien.

σ
Cv= ∗100
x

Para su interpretación usamos los siguientes parámetros:

< 10% Dispersión baja


10 - 33% Dispersión aceptable
34 - 50% Dispersión alta
> 50% Dispersión muy alta

El coeficiente de variación nos permite comparar dos distribuciones que no están


expresadas en las mismas unidades, pero deja de ser útil cuando la media o
promedio tiende a cero.
7. BIBLIOGRAFIA:

- UGTO1 ED. nodo.ugto.mx/wp-content/uploads/2016/07/Rango-


Intercuartil.pdf. [Online].; 2016 [cited 2023 febrero miércoles.
- kelmansky DM. estadística para todos- rango intercuatilico. primera ed.
kirschenbaun jm, editor. buenos aires: instituto nacional de educacion
tecnológica; 2009
- Alberto G., Pando R., Padilla m. y Pérez L. (2018). Manual de Investigación
en Salud. La Paz- Bolivia: MEDICON.
- Paula Rodo. (1 diciembre 2020). Economipedia.
https://economipedia.com/wp-login.php?redirect_to=https%3A%2F
%2Feconomipedia.com%2Fdefiniciones%2Fdiagrama-de-caja.html
- Juantxo Cruz.(5 septiembre 2017). Juantxocruz.
http://juantxocruz.com/charts-diagrama-caja-bigotes-john-w-tukey/
- Manuel Molina Arias. (18 noviembre 2015). Anestesiar.
https://anestesiar.org/2015/una-caja-con-bigotes-el-grafico-de-caja/

También podría gustarte