Esatdística Descriptiva 2.3
Esatdística Descriptiva 2.3
Esatdística Descriptiva 2.3
Informática Médica II
Tema: Estadística descriptiva.
Actividad Orientadora 4
8, 9, 3, 5, 2, 6, 4, 5
CONT.
Se requiere hallar el número medio de
accidentes por mes.
Solución: La suma de los 8 datos es
8+9+3+5+2+6+4+5 = 42.
Al dividir la suma entre el número de datos se
tiene 42/8 = 5.25
Interpretación: El número promedio de
accidentes por mes es 5.25.
MEDIA ARITMÉTICA
La media aritmética se representa por y no es
más que la suma de los datos que se quieren
promediar, dividida entre el número de datos y
se representa con equis testada. Su fórmula es:
CONT.
Ejemplo:
Calcular la media aritmética para el siguiente
conjunto de datos.
5 9 12 7 15 3
Solución:
(5+9+12+7+15+3)/6 = 51/6 = 8.5,
CONT.
Si n es par:
3 5 8 9 11 12 16
CONT.
Una vez ordenados, como el número de datos
es impar (7), se busca el que tiene la
posición (n+1)2, o sea (7+1)2 = 4. Este número
es el 9 y representa la mediana.
MODA.
La moda es el dato que más se repite en un
conjunto dado de observaciones (distribución).
Si dos datos se repiten con la misma frecuencia
se dice que la distribución es bimodal.
Ejemplo:
Se le preguntó a una muestra de 10 estudiantes
por el número de hermanos que tiene. Sus
respuestas fueron: 2, 1, 2, 0, 0, 1, 4, 5, 2, 3.
La moda es 2 porque se repite tres veces.
MEDIDAS DE DISPERSION
Hasta el momento hemos estudiado los
valores centrales de la distribución, pero
también es importante conocer si los valores
en general están cerca o alejados de estos
valores centrales, es por lo que surge la
necesidad de estudiar medidas de dispersión.
VARIANZA.
El cálculo es la suma de los cuadrados de la
diferencia de cada valor del conjunto de datos con
respecto a la media aritmética del conjunto de
datos total, dividido el número de observaciones
disminuido en uno. Se identifica por la letra S al
cuadrado. Se expresa en unidades cuadradas.
Su formula es :
CONT.
Amplitud o Rango .Es la diferencia entre el valor
máximo y mínimo en un conjunto de valores.
Indica el recorrido de los datos y resulta útil
cuando se va a confeccionar una tabla.
Ejemplo: Para el conjunto de valores 40 ; 60 ;
85 ; 72 ; 100
Amplitud = Valor Máximo – Valor Mínimo = 100
– 40 = 60
CONT.
Desviación Estándar.
Se define como la raíz cuadrada de la varianza.
Su formula es :
COEFICIENTE DE VARIACION
Indica qué por ciento de la media representa la
desviación estándar
Se identifica por la letra C y se calcula por la
relación de la varianza entre la media del
conjunto de datos multiplicado por cien.
Su formula :
CONT
Utilizando el coeficiente de variación, es posible
comparar las dispersiones de dos o más grupos de
datos que son expresados en unidades distintas.
Grupo de 11 años
• Peso Promedio = 40 kg
• Desviación estándar = 5 kg.
• CV Peso =5/40 x 100= 12.5%
Estos cálculos hacen concluir que hay
Más variabilidad en el peso de los integrantes
del grupo de 11 años que en el de 25 años.
MEDIDA DE POSICION RELATIVA
____________¡ ____________¡____________¡____________i
P1 P2 P3 … P99
EJEMPLO
Supongamos que tenemos 620 observaciones de
frecuencia cardiaca en pacientes portadores de
hipertiroidismo.
¿Qué medida podría servirnos para delimitar el 25%
de las frecuencias cardíacas más bajas y que
posición ocupará el elemento que separe ese 25%
del 75% restante?
frec. Cardiaca: .. 114, 116, 118, 120, 120, 120, ., 190
Posic. Dato ord. (154) (155) (156) (157) (158)
(159)....(620)
CONT.
Aquí se muestran algunos fragmentos de los
datos ordenados en cuestión.
Nos planteamos hallar por debajo de qué valor
se encuentra el 25% de los datos, o sea hallar el
25% de 620. Ese cálculo da 155 que es un
número entero por lo que es necesario hallar la
semisuma del valor que ocupa la posición 155
con el valor que ocupa la posición siguiente, la
156. El resultado no es más que el primer cuartil
Q1.
CONT.
En este caso la observación 155 tiene un
valor de 116 pulsaciones por minuto y la
observación 156 tiene un valor de 118
pulsaciones por minutos luego, el promedio
de los valores de las observaciones que
ocupan las posiciones:
(116+118)/2= 117
Valor de Q1=117 pulsaciones por minuto.
Como vemos el primer cuartil es un valor que
en este caso no pertenece al conjunto
original, eso es debido a que el total de
observaciones es par.
CONT.
Cuál sería la posición del primer cuartil si en
lugar de 620 observaciones hubieran sido 625
manteniéndose el fragmento anterior con la
misma numeración?
En esta nueva situación, al tener la sucesión
625 observaciones que es un número impar, el
cálculo de la posición que ocupa el cuartil Q1, o
sea 25% de 625 nos da un valor fraccionario
que se aproxima al entero inmediato superior
157. La posición del primer cuartil es la 157, en
la posición 157 aparece el valor 120.
CONT.
En dependencia de la variable de que se trate
se definen los rangos de normalidad que en
algunos casos pueden encontrarse entre los
percentiles 5 y 95 por ejemplo.
El uso de estas medidas de posición relativa en
las Ciencias Medicas es el de encontrar rangos
de normalidad.
Ejemplo: Tablas de percentiles para peso y talla
en Pediatría
Medidas resumen de variables
cualitativas
PROPORCIÓN ( p):
a
P=
n
donde: a es el total de elementos de un conjunto de n
elementos.
Así si de 400 personas hay 300 hombres entonces:
n = 400 y a = 300 y
300 3
P = = = 0,75
400 4
CONT.
La interpretación de esto es que la 0,75
parte de las personas del conjunto son
hombres. Esta interpretación es mucho
más fácil si se multiplica por 100, en este
caso estamos en presencia de un:
Porciento
PORCIENTO
Figura 1
Ingresos en la sala de Gastroenterología
600
400
200
0
1996 1997 1998
GRAFICO DE BARRAS
MULTIPLES
Figura 2
Ingresos
2000 GASTROENTEROLOGIA
RESPIRATORIO
1000 MISCELANEA
0
1996 1997 1998
GRAFICO DE BARRAS
PROPORCIONALES
Figura 3
Ingresos en el Servicio de Pediatría
100%
80%
MISCELANEA
60%
RESPIRATORIO
40% GASTROENTEROLOGIA
20%
0%
1996 1997 1998
GRAFICO DE PASTEL O
SECTOR
Figura 4
Ingresos en el Servicio de Pediatría
41% 15%
44%
GRÁFICO PARA REPRESENTAR
A LAS VARIABLES
CUANTITATIVAS CONTINUAS
Histograma
Las variables son representadas por rectángulos
al igual que en el gráfico de barras, pero a
diferencia de este, en el histograma las barras
se colocan siempre en posición vertical y sin
ningún espacio entre ellas. Aunque en la
primera columna de la tabla a partir de la cual se
confecciona el histograma se señalan los
intervalos de clase, al realizar el histograma se
reflejan para identificarlos solo los puntos
medios de dichos intervalos de clase.
CONT.
CONT.
Figura 5
Distribución de los ancianos
masculinos segun el peso.
16
14
12
10
0
1
53 58 63 68 73 78
Peso en
Kg
EL POLIGONO DE
FRECUENCIAS
Las variables son representadas en un
sistema de coordenadas por un trazo que une
los puntos en que se interceptan los puntos
medios de cada clase (eje X) con la frecuencia
correspondiente (eje Y). El polígono de
frecuencias también se puede confeccionar
uniendo los puntos medios superiores de cada
barra del histograma.
A manera de ejemplo le mostramos el
polígono de frecuencia correspondiente a la
Tabla 6.
CONT.Figura 6
Distribución de los ancianos segun el peso
16
14
12
10
0
53 58 63 68 73
78
Peso en Kg.
Construcción del gráfico
En la actualidad ya no se realizan gráficos
manuales sino mediante Graficadores de
las aplicaciones en computadoras. Una de
las más utilizadas es Excel de Windows.
A continuación se muestran algunas cajas
de diálogo de Excel en las que aparecen
algunos de los tipos de gráficos que
podemos construir.
EXCEL
EXCEL
EXCEL
Sistema estadístico profesional
GRACIAS