Esatdística Descriptiva 2.3

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 79

Medicina Integral Comunitaria

Informática Médica II
Tema: Estadística descriptiva.

Actividad Orientadora 4

Título: Resumen y presentación de la


Información.
INTRODUCCION
El resumen de la información es una
etapa del método estadístico en las cual
estudiaremos diferentes tipos de medidas
de resumen así como la presentación de
la información
Las medidas de resumen para las
variables cuantitativas y cualitativas
se dividen en los siguientes grupos:
• Medidas de tendencia central
• Medidas de dispersión
• Medidas de posición relativa
• Medidas para resumir datos cualitativos
MEDIDAS DE TENDENCIA
CENTRAL
• Las medidas de tendencia central son valores
numéricos localizados en el medio del conjunto
de datos y que los representan adecuadamente
para fines de análisis.
• Las medidas más utilizadas son la media, la
mediana y la moda
MEDIA
• Es el promedio más utilizado en cálculos
estadísticos. Se obtiene sumando todos los
datos y dividiendo el resultado entre el número
de éstos.
• Ejemplo
Los siguientes datos representan el número de
accidentes en un cruce peligroso de la ciudad
durante los últimos 8 meses.

8, 9, 3, 5, 2, 6, 4, 5
CONT.
Se requiere hallar el número medio de
accidentes por mes.
Solución: La suma de los 8 datos es
8+9+3+5+2+6+4+5 = 42.
Al dividir la suma entre el número de datos se
tiene 42/8 = 5.25
Interpretación: El número promedio de
accidentes por mes es 5.25.
MEDIA ARITMÉTICA
La media aritmética se representa por y no es
más que la suma de los datos que se quieren
promediar, dividida entre el número de datos y
se representa con equis testada. Su fórmula es:
 
CONT.
Ejemplo:
Calcular la media aritmética para el siguiente
conjunto de datos.
  5 9 12 7 15 3

Solución:
(5+9+12+7+15+3)/6 = 51/6 = 8.5,

8.5 es la media aritmética para este conjunto de


datos.
MEDIANA.
La mediana es el valor que se encuentra en el
medio de los datos ordenados. Por lo tanto, el
50% de los datos son menores que la mediana.

La mediana se utiliza cuando los datos


presentan valores muy extremos, cuando la
media aritmética no es muy representativa del
conjunto.
CONT.
Ejemplo:
Los siguientes datos representan el número de
accidentes en una intersección peligrosa de su
ciudad durante los últimos 8 meses.
8, 19, 7, 5, 2, 7, 4, 5.
Solución:
Primero se ordenan los datos de menor a
mayor.
2, 4, 5, 5, 7, 7, 8, 19
CONT.
Como el número de datos es par, los dos
valores del medio son 5 y 7, por tanto la
mediana es (5+7) / 2 = 6

Conclusión: El 50 % de los meses ocurrieron 6


accidentes o menos.
La mediana se representa con y, como ya se
dijo, es la observación o el dato que se
encuentra en el centro cuando los éstos están
ordenados; los divide en dos partes iguales.
CONT.
Si n es impar la mediana es la
observación que está en el lugar (n+1)/2,
esto es
 

 
CONT.
Si n es par:

  la mediana es el promedio de las observaciones


n/2 y (n/2)+1, esto es
 
CONT.
Ejemplo:

Encontrar la mediana para el siguiente conjunto


de datos:
  9 12 5 16 8 3 11
  
Solución:
Primero se ordenan los datos

3 5 8 9 11 12 16
CONT.
Una vez ordenados, como el número de datos
es impar (7), se busca el que tiene la
posición (n+1)2, o sea (7+1)2 = 4. Este número
es el 9 y representa la mediana.
MODA.
La moda es el dato que más se repite en un
conjunto dado de observaciones (distribución).
Si dos datos se repiten con la misma frecuencia
se dice que la distribución es bimodal.
Ejemplo:
Se le preguntó a una muestra de 10 estudiantes
por el número de hermanos que tiene. Sus
respuestas fueron: 2, 1, 2, 0, 0, 1, 4, 5, 2, 3.
La moda es 2 porque se repite tres veces.
MEDIDAS DE DISPERSION
Hasta el momento hemos estudiado los
valores centrales de la distribución, pero
también es importante conocer si los valores
en general están cerca o alejados de estos
valores centrales, es por lo que surge la
necesidad de estudiar medidas de dispersión.
VARIANZA.
El cálculo es la suma de los cuadrados de la
diferencia de cada valor del conjunto de datos con
respecto a la media aritmética del conjunto de
datos total, dividido el número de observaciones
disminuido en uno. Se identifica por la letra S al
cuadrado. Se expresa en unidades cuadradas.

Su formula es :
CONT.
Amplitud o Rango .Es la diferencia entre el valor
máximo y mínimo en un conjunto de valores.
Indica el recorrido de los datos y resulta útil
cuando se va a confeccionar una tabla.
Ejemplo: Para el conjunto de valores 40 ; 60 ;
85 ; 72 ; 100
Amplitud = Valor Máximo – Valor Mínimo = 100
– 40 = 60
CONT.
Desviación Estándar.
Se define como la raíz cuadrada de la varianza.

Su formula es :
COEFICIENTE DE VARIACION
Indica qué por ciento de la media representa la
desviación estándar
Se identifica por la letra C y se calcula por la
relación de la varianza entre la media del
conjunto de datos multiplicado por cien.

Su formula :
CONT
Utilizando el coeficiente de variación, es posible
comparar las dispersiones de dos o más grupos de
datos que son expresados en unidades distintas.

En vez de comparar, digamos, la variabilidad de


pesos en libras, largos en pulgadas y edades en
años, podemos comparar los respectivos
coeficientes de variación que son todos
porcentajes.
Veremos:
Grupo de 25 años
• Peso promedio = 72.5kg
• Desviación estándar = 5kg
• CV Peso = 5/72.5 x 100= 6.9%

Grupo de 11 años
• Peso Promedio = 40 kg
• Desviación estándar = 5 kg.
• CV Peso =5/40 x 100= 12.5%
Estos cálculos hacen concluir que hay
Más variabilidad en el peso de los integrantes
del grupo de 11 años que en el de 25 años.
MEDIDA DE POSICION RELATIVA

Ocasionalmente es necesario señalar otras


posiciones en la distribución, para ello se definen
medidas llamadas cuantiles: en particular
estudiaremos los percentiles.
MEDIDAS DE POSICION RELATIVA
CUARTILES
Para dividir el recorrido de una variable en 4
partes iguales necesitamos 3 valores y estos
son los cuartiles Q1, Q2, y Q3
DECILES
Para dividir el recorrido de la variable en 10
partes necesitamos 9 valores y estos son los
deciles D1, D2,..., D9
PERCENTILES

Para dividir en 100 partes necesitamos 99


valores que serían los percentiles P1,
P2,... P99.

____________¡ ____________¡____________¡____________i
P1 P2 P3 … P99
EJEMPLO
Supongamos que tenemos 620 observaciones de
frecuencia cardiaca en pacientes portadores de
hipertiroidismo.
¿Qué medida podría servirnos para delimitar el 25%
de las frecuencias cardíacas más bajas y que
posición ocupará el elemento que separe ese 25%
del 75% restante?
frec. Cardiaca: .. 114, 116, 118, 120, 120, 120, ., 190
Posic. Dato ord. (154) (155) (156) (157) (158)
(159)....(620)
CONT.
Aquí se muestran algunos fragmentos de los
datos ordenados en cuestión.
Nos planteamos hallar por debajo de qué valor
se encuentra el 25% de los datos, o sea hallar el
25% de 620. Ese cálculo da 155 que es un
número entero por lo que es necesario hallar la
semisuma del valor que ocupa la posición 155
con el valor que ocupa la posición siguiente, la
156. El resultado no es más que el primer cuartil
Q1.
CONT.
En este caso la observación 155 tiene un
valor de 116 pulsaciones por minuto y la
observación 156 tiene un valor de 118
pulsaciones por minutos luego, el promedio
de los valores de las observaciones que
ocupan las posiciones:
(116+118)/2= 117
Valor de Q1=117 pulsaciones por minuto.
Como vemos el primer cuartil es un valor que
en este caso no pertenece al conjunto
original, eso es debido a que el total de
observaciones es par.
CONT.
Cuál sería la posición del primer cuartil si en
lugar de 620 observaciones hubieran sido 625
manteniéndose el fragmento anterior con la
misma numeración?
En esta nueva situación, al tener la sucesión
625 observaciones que es un número impar, el
cálculo de la posición que ocupa el cuartil Q1, o
sea 25% de 625 nos da un valor fraccionario
que se aproxima al entero inmediato superior
157. La posición del primer cuartil es la 157, en
la posición 157 aparece el valor 120.
CONT.
En dependencia de la variable de que se trate
se definen los rangos de normalidad que en
algunos casos pueden encontrarse entre los
percentiles 5 y 95 por ejemplo.
El uso de estas medidas de posición relativa en
las Ciencias Medicas es el de encontrar rangos
de normalidad.
Ejemplo: Tablas de percentiles para peso y talla
en Pediatría
Medidas resumen de variables
cualitativas
PROPORCIÓN ( p):
a
P= 
n
donde: a es el total de elementos de un conjunto de n
elementos.
Así si de 400 personas hay 300 hombres entonces:
n = 400 y a = 300 y
300 3
P =  =  = 0,75
400 4
CONT.
La interpretación de esto es que la 0,75
parte de las personas del conjunto son
hombres. Esta interpretación es mucho
más fácil si se multiplica por 100, en este
caso estamos en presencia de un:
Porciento
PORCIENTO

El porciento no es más que p multiplicado por


100. Así en el caso anterior el porciento de
hombres es 75% y esto significa que por cada
100 personas hay 75 hombres.
RAZÓN (R)
En ocasiones no interesa conocer que parte
representa un grupo de elementos de un total
sino la relación que hay entre elementos con
distinta características por ejemplo la relación
que hay entre hombres y mujeres, en este caso
esta razón es:
300
R =  =3
100
Note que hemos usado R para denotar la razón.
CONT.
Esto significa que por cada mujer hay 3
hombres, esta razón se conoce con el nombre
de “razón de masculinidad” y es usada en
Demografía.
No todas las razones son enteras (calcule la
razón de mujer a hombre) y la interpretación se
hace difícil, por esto se suele usar el:
INDICE
INDICE
No es más que la razón multiplicada por 100, en
el ejemplo anterior el índice de masculinidad es:
I = R*100 = 300
Y esto significa que hay 300 hombres por cada
100 mujeres.
CONT.
Son muy usados en las ciencias médicas el
porciento de bajo peso al nacer que se conoce
como índice de bajo peso al nacer y que se
calcula dividiendo el número de niños con bajo
peso al nacer entre el total de recién nacidos por
100. Esta medida resume e ilustra el
comportamiento del bajo peso al nacer en un
lugar y momento dado y permite comparar este
problema de salud entre distintos lugares o
épocas.
CONT.
Una razón muy usada en el diagnóstico de la
situación de salud de un Consultorio o área de
salud es el llamado índice de hacinamiento que
se obtiene dividiendo el número de personas en
una vivienda entre el número de habitaciones de
esta.
Cómo ud interpreta este índice? Se considera
que en una vivienda con índice mayor de 3, hay
hacinamiento.
TASA (T)
Dado un determinado evento que puede
ser experimentado por los individuos de
una población, en un intervalo de tiempo
(un año, semestre, etc) la tasa del evento
en el período se define como:
CONT.
A: números de individuos que experimentaron el
evento en el período
N: número de individuos en la población
K: número entero cualquiera
Ejemplo: Si en un grupo de 100 000 personas
mueren 100 en un año la tasa de mortalidad en
esa población en ese año es:
CONT.
El objetivo que se persigue con multiplicar por
una potencia de 10 es convertir este número a
enteros para facilitar su interpretación, así en
este ejemplo pudiéramos multiplicarlo por 103
entonces:
T = 0,001 * 1000 = 1
Esto significa que en ese período en esa
población falleció una persona por cada 1000
habitantes.
CONT.
Esta tasa expresa el riesgo de morir en esa
población.
En general toda tasa expresa un evento
determinado en un periodo.
PRESENTACION DE LOS
RESULTADOS
Una vez recogida y procesada la información, es
necesario presentar los resultados de manera
adecuada, de forma tal que contribuya a una
mejor comprensión y exposición de dichos
resultados, en función de los objetivos del
trabajo. Existen tres tipos fundamentales de
presentación: Textual, Tabular (cuadro
estadístico) y Gráfica.
PRESENTACION TEXTUAL
La presentación de la información textual es la
forma escrita habitual de presentar un
documento o informe. Constituye la forma
principal de presentación de los resultados.
Atendiendo a que se trata de una comunicación
científica debe limitarse a lo estrictamente
necesario, cuidando de mantener una secuencia
lógica en la exposición y de no incurrir en
repeticiones innecesarias, citando todas y cada
una de las tablas y figuras a que se haga
referencia.
CUADRO O TABLA
ESTADISTICA
Los datos originales recopilados por el
investigador, directamente de la fuente, se les
llama datos primarios y una vez que son
sometidos a algún procesamiento estadístico
(como resumirlos en una tabla o gráfico) se les
llaman datos secundarios. Los datos primarios
contienen información más precisa que los
secundarios, pero son también más difíciles de
manipular porque generalmente son muy
voluminosos.
CONT.
Los cuadros estadísticos resultan de gran ayuda
tanto para el investigador como para el lector del
informe de su trabajo, ya que constituyen una
forma sintetizada y más comprensible de
mostrar los resultados sobre todo cuando la
información es de tipo repetitivo. Además
permite mostrar frecuencias, relaciones,
contrastes, variaciones y tendencias mediante
una presentación ordenada de la información.
CONT.
Las partes de una tabla son:
• Número de orden.
• Título
• Cuadro propiamente dicho o cuerpo de la
tabla
• Notas explicativas o calce, también se le
llama pie.
CONT.
Número de orden .- El mismo se emplea para
facilitar la referencia a la tabla en el texto. Debe
asignársele un número consecutivo a cada tabla
siguiendo el orden en que se citan por primera
vez en el texto. Este número la identifica y se
coloca precediendo al título.
Título.- Debe ser completo, claro y conciso, es
decir, debe reflejar claramente en qué consiste
el contenido y con qué criterios se clasificaron
los elementos a que se hace referencia,
ubicándolo además en tiempo y lugar.
CONT.
Cuadro o cuerpo de la tabla.- Esta constituido
por un grupo de casillas o celdas formadas por
el entrecruzamiento de filas y columnas. La
primera fila se reserva para indicar a qué se
refieren los datos subyacentes y que unidad de
medida se utilizó. En la primera columna se
reflejan las diferentes clases según la escala de
clasificación empleada.
CONT.
Notas explicativas, calce o pie.- Sirven
para indicar la fuente de donde se
obtuvieron los datos y, de ser pertinente,
la significación estadística o alguna breve
nota aclaratoria del contenido, que puede
indicarse por llamadas mediante símbolos
colocados como exponentes.
CONT.
Ejemplo:

Tabla 1 Hábito de Fumar según Sexo


CDI

Fuente: Historias Clínica. P< 0.05


PRESENTACION GRAFICA
La forma gráfica constituye un complemento
importante para la presentación de los
resultados ya que permite incrementar la
información científica que se trata de transmitir.
Aunque los gráficos se elaboran a partir de
tablas estadísticas es un error, al presentar los
resultados, pretender acompañar a cada tabla
por un gráfico, ello origina repeticiones en la
información y pérdida de espacio. El gráfico
debe agregar información, no duplicarla.
CONT.
El empleo del gráfico debe reservarse para
cuando se quiera mostrar algún patrón especial
en los resultados, destacar tendencias o ilustrar
comparaciones de forma clara y exacta.
El gráfico, al igual que las tablas, debe ser
autoexplicativo, sencillo y de fácil
comprensión.
CONT
Las partes del gráfico son:
Número de orden.
Título
Cuerpo o gráfico propiamente dicho
Leyenda
El Número de orden y el Título deben cumplir
los mismos requisitos señalados anteriormente
para la tabla estadística.
CONT
El Cuerpo o gráfico propiamente dicho, varía en
su configuración en dependencia del tipo de
dato que se representa, pero siempre debe
indicar claramente las coordenadas, las escalas
y las unidades de medida, reservando el eje de
las abscisas (eje X) para la variable
independiente y el eje de las ordenadas (eje Y)
para la variable dependiente. La leyenda
permite identificar claramente los diferentes
elementos del cuerpo del gráfico
GRÁFICOS PARA REPRESENTAR
VARIABLES CUALITATIVAS Y
CUANTITATIVAS DISCRETAS
Gráfico de Barras.- Las variables son
representadas por barras o rectángulos que
pueden colocarse en posición horizontal o vertical.
Para la construcción de este tipo de gráfico deben
tenerse en cuenta los siguientes requisitos:
– Todas las barras deben tener el mismo ancho.
– Los espacios entre las barras deben ser todos
iguales y nunca menores que la mitad del
ancho de las barras ni mayores que este.
– La escala de la frecuencia debe comenzar por
cero.
CONT
Los gráficos de barra presentan tres variedades:
• Barras simples.
• Barras múltiples.
• Barras proporcionales.

A partir de la siguiente tabla ejemplificaremos


estas variedades de gráficos de barras.
CONT
• Tabla 5 Ingresos en el Servicio de Pediatría
• CDI
GRAFICO DE BARRAS SIMPLES

Figura 1
Ingresos en la sala de Gastroenterología

600
400
200
0
1996 1997 1998
GRAFICO DE BARRAS
MULTIPLES
Figura 2
Ingresos

2000 GASTROENTEROLOGIA

RESPIRATORIO

1000 MISCELANEA

0
1996 1997 1998
GRAFICO DE BARRAS
PROPORCIONALES
Figura 3
Ingresos en el Servicio de Pediatría

100%

80%
MISCELANEA
60%
RESPIRATORIO
40% GASTROENTEROLOGIA

20%

0%
1996 1997 1998
GRAFICO DE PASTEL O
SECTOR

Figura 4
Ingresos en el Servicio de Pediatría

41% 15%

GAST ROENT EROLOGIA


RESPIRAT ORIO
MISCELANEA

44%
GRÁFICO PARA REPRESENTAR
A LAS VARIABLES
CUANTITATIVAS CONTINUAS
Histograma
Las variables son representadas por rectángulos
al igual que en el gráfico de barras, pero a
diferencia de este, en el histograma las barras
se colocan siempre en posición vertical y sin
ningún espacio entre ellas. Aunque en la
primera columna de la tabla a partir de la cual se
confecciona el histograma se señalan los
intervalos de clase, al realizar el histograma se
reflejan para identificarlos solo los puntos
medios de dichos intervalos de clase.
CONT.
CONT.
Figura 5
Distribución de los ancianos
masculinos segun el peso.

16

14

12

10

0
1

53 58 63 68 73 78

Peso en
Kg
EL POLIGONO DE
FRECUENCIAS
Las variables son representadas en un
sistema de coordenadas por un trazo que une
los puntos en que se interceptan los puntos
medios de cada clase (eje X) con la frecuencia
correspondiente (eje Y). El polígono de
frecuencias también se puede confeccionar
uniendo los puntos medios superiores de cada
barra del histograma.
A manera de ejemplo le mostramos el
polígono de frecuencia correspondiente a la
Tabla 6.
CONT.Figura 6
Distribución de los ancianos segun el peso

16

14

12

10

0
53 58 63 68 73
78
Peso en Kg.
Construcción del gráfico
En la actualidad ya no se realizan gráficos
manuales sino mediante Graficadores de
las aplicaciones en computadoras. Una de
las más utilizadas es Excel de Windows.
A continuación se muestran algunas cajas
de diálogo de Excel en las que aparecen
algunos de los tipos de gráficos que
podemos construir.
EXCEL
EXCEL
EXCEL
Sistema estadístico profesional

El sistema estadístico que estudiaran es el que


el indica la actividad orientadora y se encuentra
en el CD del estudiante con su manual
correspondiente
Para su instalación se procede se la
siguiente forma
Desde el CD, localizamos la carpeta del
sistema estadístico MEDCALC vamos a la
opción INSTALL y hacemos doble clic izquierdo

• Aparece una ventana con el siguiente mensaje:


• WELCOME TO THE MEDCALC INSTALLATION
PROGRAM (BIENVENIDO AL INSTALACION DEL
PROGRAMA MEDCALC)
• Hacemos clic izquierdo en OK
• Aparece otra ventana que te pide entrar tu nombre
( YOUR NAME)
• Hacemos clic izquierdo en OK
• .Aparece otra ventana que te pide el directorio
donde vas a ubicar el sistema. (DIRECTORY)
• Por ultimo aparece un mensaje que dice:
THANK YOU FOR USING MEDCALC
• (gracias por usar el MEDCALC)
Procedimiento para localizar el Sistema
Estadístico Medcalc:
• Ir por el botón inicio desde el escritorio hasta
programa y aquí localizar el icono del Medcalc y
hacer clic izquierdo sobre el mismo.
• Aparece una ventana que te muestra el Sistema
Estadístico Medcalc que contiene varias barras
• Primera barra de titulo
• Segunda barra de menú con varias opciones
• Tercera barra de herramientas con varias
opciones
CONTINUE EXPLORANDO EL PROGRAMA
ESTADÍSTICO MEDCALC EN MANUAL

GRACIAS

También podría gustarte