Estadística Descriptiva
Estadística Descriptiva
Estadística Descriptiva
Organización de Datos
Unidad 1
Introducción
La Estadística
La Estadística es la ciencia que se encarga de recolectar,
organizar, analizar, interpretar información, tomar decisiones
basado en los análisis realizados.
El lenguaje de la Estadística
• Población es el conjunto de individuos o elementos que son
de interés para un estudio, a los cuales se les puede medir
una característica u observar un atributo.
• Muestra es cualquier subconjunto de una población.
• Parámetro es una medida usada para describir alguna
característica de una población (promedio, varianza, etc.).
• Estadístico es una medida usada para describir alguna
característica de una muestra (promedio, varianza, etc.).
Introducción
Introducción
El lenguaje de la Estadística
• Estadística Descriptiva: Conjunto de técnicas para organizar
y describir en forma concisa la información recolectada
mediante tablas, gráficos o medidas descriptivas de manera
informativa.
• Estadística Inferencial: Conjunto de técnicas para realizar
generalizaciones, predicciones, estimaciones sobre
poblaciones a partir de muestras.
Tipos de Datos
Cuando se analiza una población (o muestra), a cada elemento
dentro de ésta se le asigna un nombre o un número. A éstos le
denominaremos datos. Se pueden clasificar de la siguiente
manera:
1. Datos cualitativos: se refiere a categorías o atributos que
pueden clasificarse de acuerdo con determinado criterio.
2. Datos cuantitativos: se refieren a información numérica
(todo lo que se puede contar o medir).
• Datos discretos: obtenidos de un proceso de conteo
(conjunto de los enteros no negativos).
• Datos continuos: obtenidos de un proceso de
medición (conjunto de los números reales).
Organización de Datos
Tipos de Datos
• Algunos datos numéricos se pueden clasificar como
cualitativos, por ejemplo: los códigos de estudiantes, grados
de escolaridad, teléfonos, etc.
• Algunos datos se pueden representar de los dos tipos, por
ejemplo: estatura, calificación etc.
Organización de Datos
Tipos de tablas
Los datos se organizan en tablas de frecuencia, también
denominadas distribuciones de frecuencia, tales como:
Tipos de gráficos
La representación de un conjunto de datos se realiza a partir de
gráficos. Analizaremos los siguientes:
360𝑓ൗ
Máquina 𝑓 á𝑛𝑔𝑢𝑙𝑜 = 𝑛 % = 100𝑓𝑟
A 10 64,3 17,9
B 15 96,4 26,8
C 15 96,4 26,8
D 8 51,4 14,3
E 5 32,1 8,9
F 3 19,3 5,4
Total (n) 56 360 100
Donde: n: número de datos, 𝒇: frecuencia absoluta (número de
veces que aparece un dato), %: porcentaje.
Diagrama Circular
5%
A
9% 18%
B
14% C
D
27%
E
27%
F
Tabla o Distribución de Frecuencias no Agrupadas
# de fallas 𝑓 𝑓𝑟 % # de fallas 𝑓 𝑓𝑟 %
0 16 0,286 28,6 10 0 0,000 0,0
1 3 0,054 5,4 11 0 0,000 0,0
2 9 0,161 16,1 12 2 0,036 3,6
3 2 0,036 3,6 13 1 0,018 1,8
4 1 0,018 1,8 14 0 0,000 0,0
5 3 0,054 5,4 15 1 0,018 1,8
6 2 0,036 3,6 16 2 0,036 3,6
7 3 0,054 5,4 17 1 0,018 1,8
8 2 0,036 3,6 18 1 0,018 1,8
9 7 0,125 12,5 Total (n) 56 1 100
Diagrama de Barras
Ejemplo 3
Se analizó la productividad de un grupo de trabajadores, a partir
del número de ”piezas aceptables” producidas por cada uno de
ellos en un periodo de una semana. Los datos se resumen en la
tabla. Construya una tabla de frecuencias.
21 35 41 46 51 54 57 61 64 69 77
22 36 41 47 52 54 57 61 65 71 77
24 37 44 48 52 55 58 61 66 71 77
29 37 44 48 52 55 58 62 66 73 79
32 37 44 48 52 55 58 62 66 73 80
33 38 44 49 52 55 58 62 66 73 81
34 40 44 50 53 55 59 62 66 74 81
34 40 44 50 53 56 60 63 66 75 83
35 40 46 51 53 56 60 63 68 75 84
35 40 46 51 53 56 61 63 69 76 88
Tabla o Distribución de Frecuencias Agrupadas
Ejemplo 3
1. Se determina el número de clases 𝐶 a utilizar. Ley de Sturges:
𝐶 = 3,3 log 𝑛 + 1, donde 𝑛 es el número de datos a agrupar
(aproximar al entero más cercano).
2. Se calcula el rango 𝑅, 𝑅 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟.
3. Se determina la precisión (en la práctica la precisión es dada por
el instrumento de medición), lo cual es equivalente a seguir la
regla siguiente.
Ejemplo 3
5. Se calculan límites teóricos denominados límites de clase.
Los de la primera clase serán:
Para la clase 𝑖, 𝑖 = 1, … , 𝐶,
𝐿𝐼𝑖 = 𝐿𝐼𝑖−1 + 𝐴
𝐿𝑆𝑖 = 𝐿𝑆𝑖−1 + 𝐴
Tabla o Distribución de Frecuencias Agrupadas
Ejemplo 3
6. Se calculan límites prácticos denominados fronteras de
clase. Los de la primera clase serán:
Para la clase 𝑖, 𝑖 = 1, … , 𝐶,
𝐹𝐼𝑖 = 𝐹𝐼𝑖−1 + 𝐴
Ejemplo 3
𝑓
Clase Límites Fronteras 𝑓 𝑓𝑟 = ൗ𝑛 %
1 21 – 29 20,5 – 29,5 4 0,04 4
2 30 – 38 29,5 – 38,5 12 0,11 11
3 39 – 47 38,5 – 47,5 16 0,15 15
4 48 – 56 47,5 – 56,5 28 0,25 25
5 57 – 65 56,5 – 65,5 22 0,20 20
6 66 – 74 65,5 – 74,5 15 0,14 14
7 75 – 83 74,5 – 83,5 11 0,10 10
8 84 – 92 83,5 – 92,5 2 0,02 2
Total 110 1 100
Tabla o Distribución de Frecuencias Agrupadas
Características de las tablas agrupadas
• Uniformidad: Todas las clases deben tener la misma amplitud.
• Unicidad: Las clases no deben traslaparse.
• Completez: Cada dato debe pertenecer a alguna clase.
Notas
• Si la última clase queda sin datos, se puede eliminar.
• Si no se sigue el acuerdo para el cálculo de la amplitud, es
posible que los datos mayores no pertenezcan a ninguna
clase, en este caso anexe otra clase que cumpla con las tres
propiedades anteriores.
• Es posible crear la tabla de frecuencia sin tener en cuenta los
pasos del 1 al 6, pero se deben garantizar las tres
propiedades.
Histograma
Ejemplo 3
Polígono de Frecuencia
Ejemplo 3
Tabla o Distribución de Frecuencias Acumuladas
Ejemplo 5
Utilizando los datos del Ejemplo 1, construya una tabla de
frecuencias bivariada teniendo en cuenta la máquina y la
operación de desplazamiento.
Tabla o Distribución de Frecuencias Bivariadas
Ejemplo 5
Tabla bivariada teniendo en cuenta la máquina y la operación de
desplazamiento.
Máquina/Operación 1 2 3 Total
A 10 0 0 10
B 11 2 2 15
C 5 10 0 15
D 3 4 1 8
E 4 1 0 5
F 2 1 0 3
Total 35 18 3 56
Diagrama de Barras Bivariado
Ejemplo 5
Diagrama de Barras Bivariado
Ejemplo 5
Tabla o Distribución de Frecuencias Bivariadas
Ejemplo 5
Responder a partir de la tabla:
• ¿Qué porcentaje de los días se usó la máquina B?
• ¿Qué porcentaje de los días se realizó la operación de
desplazamiento 1?
• ¿Qué porcentaje de los días se usó la máquina B y se realizó
la operación de desplazamiento 1?
• ¿Qué porcentaje de los días en que se usó la máquina B se
hizo la operación de desplazamiento 1?
• ¿Qué porcentaje de los días en que se hizo la operación de
desplazamiento 1 se utilizó la máquina B?
Tabla o Distribución de Frecuencias Bivariadas
Ejercicio
Construya una tabla de frecuencias bivariada teniendo en
cuenta la máquina y la operación de desplazamiento, pero a
partir del número de fallas. Tome porcentajes de totales por fila,
columna, celdas, restringido a filas y columnas e interprete cada
uno de ellos.
Diagrama de Pareto
Ejemplo 6
La tabla siguiente representa las causas de los accidentes de
tránsito ocurridos en una intersección durante el último mes.
Realizar el diagrama de Pareto, a partir de los siguientes datos.
Causa Frecuencia
Exceso de velocidad (V) 11
Falta de señalización (S) 8
Estado de embriaguez (Z) 32
Problemas de frenos (R) 7
Animales (A) 6
Problemas de sueño (N) 15
Otros (O) 4
Diagrama de Pareto
Ejemplo 6
Ejemplo 6
D i a g ram a d e P a reto
100
100,00
95,18
80 87,95
79,52
69,88
60
Frecuencia
56,63
40 38,55
20
0
Z V R O
N S A
Unidad 1
Introducción y Estadística Descriptiva
Daniel Orlando Rivera Royero
Departamento de Ingeniería Industrial
Semana 1