Organización de Datos
Organización de Datos
Organización de Datos
TULA-TEPEJI
CONTADURÍA
ORGANIZACIÓN DE DATOS Y
REPRESENTACIÓN GRAFICAS
2CD-G5
12 ENERO DE 2024
Organización de datos
Luego de tomar la información necesaria en la investigación que se sigue, se obtiene una
gran cantidad de datos que requieren ser interpretados y sobre los cuales se busca concluir
algo específico. Para esto se debe depurar y clasificar la información aplicando técnicas
adecuadas.
1. Tipo de variables
-Variables cualitativas: son características de un individuo u objeto, que se pueden expresar
con palabras. Algunos ejemplos son: el color de ojos, el color del cabello, el género, el
estado civil o la marca de un producto.
-Variables cuantitativas: son aquellas características de un objeto o individuo que se
pueden escribir en números. Por ejemplo: edad, ingresos, peso, altura, presión, humedad
o cantidad de hermanos.
2. Escalas de medida
Los datos también se pueden clasificar según la escala de medición o el procedimiento que
los generó. Cuatro tipos de escalas de medición usados en estadística son las escalas
nominales, ordinal, de intervalo y de razón (véase la imagen de abajo).
-Nominal: Consta de dos o más categorías mutuamente excluyentes. Si solo hay dos, se
llama escala nominal dicotómica. A cada categoría se le suele asignar un número de código
sin significado cuantitativo, lo que facilita su introducción en bases de datos. En cualquier
situación, si se usa una codificación propia, debe tenerse claro lo que significa cada código
para cada variable.
ejemplos:
Sexo: 1) masculino; 2) femenino.
Fumar: 0) no; 1) sí.
Estado civil: 1, casado; 2, soltero; 3, viudo; 4, divorciado,
Procedencia del ingreso: 1, urgencias; 2, consultas; 3, otro hospital.
camisetas deportivas, rangos académicos, estratos, números telefónicos, genero, raza, tipo
de sangre, etc.
-Ordinal: Consta de dos o más categorías mutuamente excluyentes. Si solo hay dos, se llama
escala nominal dicotómica. A cada categoría se le suele asignar un número de código sin
significado cuantitativo, lo que facilita su introducción en bases de datos. En cualquier
situación, si se usa una codificación propia, debe tenerse claro lo que significa cada código
para cada variable.
ejemplos:
Sexo: 1) masculino; 2) femenino.
Fumar: 0) no; 1) sí.
Estado civil: 1, casado; 2, soltero; 3, viudo; 4, divorciado,
Procedencia del ingreso: 1, urgencias; 2, consultas; 3, otro hospital.
Es una escala nominal ordenada (rangos académicos estratos, etc.)
-De intervalo: Las escalas de intervalos poseen la cualidad adicional de que los intervalos
entre sus clases son iguales. Diferencias iguales entre cualquier par de números de la escala
indican diferencias también iguales en el atributo sometido a medición. Veamos un
ejemplo: la diferencia de temperatura entre una habitación a 22 grados centígrados y otra
a 26 es la misma que la existente entre dos a 33 y 37 grados centígrados, respectivamente.
Es una escala ordinal en la cual se puede clasificar las distancias entre valores (puntajes de
las pruebas de inteligencia, temperatura Celsius, fechas, etc.)
-De razón: Su cualidad adicional es que el cero sí indica ausencia de atributo. En
consecuencia, la razón entre dos números de la escala es igual a la existente entre las
cantidades del atributo medido.
Ejemplos:
• Peso: medido en kilogramos.
• Concentración de glucosa en una muestra: medida en mg/dl.
• Tasa de mortalidad: muertes por 1000 personas en riesgo.
• Ingresos: medidos en euros.
Es una escala de intervalos con un punto cero que significa “ninguno” (dinero, peso, altura,
etc.)
3. Tablas de frecuencia
En general, hay dos tipos:
1. Datos no agrupados: Son datos individuales sin ninguna clasificación o agrupación. Por
ejemplo, una lista de edades de estudiantes.
2. Datos agrupados: Los datos se organizan en intervalos o clases. Esto es útil cuando se
trabaja con conjuntos de datos extensos. Por ejemplo, agrupar edades en rangos de 10
años.
Histograma.
Polígonos de frecuencias
Para construir polígonos
Para construir polígonos de frecuencias, se trazan las frecuencias absolutas o relativas de
los valores de la variable en un sistema de ejes cartesianos y se unen los puntos resultantes
mediante trazos rectos. Con ello se obtiene una forma de línea poligonal abierta.
Los polígonos de frecuencias se utilizan preferentemente en la presentación de caracteres
cuantitativos, y tienen especial interés cuando se indican frecuencias acumulativas. Se usan
en la expresión de fenómenos que varían con el tiempo, como la densidad de población, el
precio o la temperatura.
Gráficos de sectores
En los diagramas de sectores, también llamados circulares o de tarta, se muestra el valor de
la frecuencia de la variable señalada como un sector circular dentro de un círculo completo.
Por ello, resultan útiles particularmente para mostrar comparaciones entre datos, sobre
todo en forma de frecuencias relativas de las variables expresadas en forma de porcentaje.
Pictogramas y cartogramas
Para aligerar la presentación de datos estadísticos, con frecuencia se recurre a imágenes
pictóricas representativas del valor de las variables. Dos formas comunes de expresión
gráfica de los datos son:
Los pictogramas, que muestran diagramas figurativos con figuras o motivos que aluden a la
distribución estadística analizada (por ejemplo, una imagen antropomórfica para indicar
tamaños, alturas u otros).
Los cartogramas, basados en mapas geográficos que utilizan distintas tramas, colores o
intensidades para remarcar las diferencias entre los datos.
Pirámide de población
Otra forma corriente de presentación visual de datos estadísticos es la llamada pirámide de
población.
Las pirámides de población se utilizan en la expresión de informaciones demográficas,
económicas o sociales, y en ellas se clasifican comúnmente los datos de la población del
grupo de muestra considerado en diferentes escalas de edad y diferenciada por sexo.