Estadística Descriptiva

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 49

Introducción y Estadística Descriptiva

Organización de Datos

Daniel Orlando Rivera Royero


Departamento de Ingeniería Industrial

Unidad 1
Introducción

Material de Estudio – Unidad 1


Libro: Estadística.
Autor: Richard Weimer.
Código fotocopias: R15145
Introducción

La Estadística
La Estadística es la ciencia que se encarga de recolectar,
organizar, analizar, interpretar información, tomar decisiones
basado en los análisis realizados.

¿Por qué estudiar Estadística?


La estadística permite tomar decisiones frente a situaciones que
presentan incertidumbre y variabilidad:
• La incertidumbre se presenta debido al desconocimiento de
muchos de los factores que pueden intervenir en una
situación.
• La variabilidad se presenta por la variedad inherente que se
da en todo tipo de proceso.
Introducción
Introducción

¿Por qué estudiar Estadística?

1. La estadística permite evaluar y cuantificar resultados


estadísticos que se encuentra en todas partes.

2. La estadística permite aprender las reglas y métodos para


tratar información y tomar decisiones acertadas.

3. Entender nuestro entorno.


Introducción
Introducción

El lenguaje de la Estadística
• Población es el conjunto de individuos o elementos que son
de interés para un estudio, a los cuales se les puede medir
una característica u observar un atributo.
• Muestra es cualquier subconjunto de una población.
• Parámetro es una medida usada para describir alguna
característica de una población (promedio, varianza, etc.).
• Estadístico es una medida usada para describir alguna
característica de una muestra (promedio, varianza, etc.).
Introducción
Introducción

El lenguaje de la Estadística
• Estadística Descriptiva: Conjunto de técnicas para organizar
y describir en forma concisa la información recolectada
mediante tablas, gráficos o medidas descriptivas de manera
informativa.
• Estadística Inferencial: Conjunto de técnicas para realizar
generalizaciones, predicciones, estimaciones sobre
poblaciones a partir de muestras.

El uso del software


• Son necesarios.
• Son una herramienta de cálculo.
Organización de Datos

Tipos de Datos
Cuando se analiza una población (o muestra), a cada elemento
dentro de ésta se le asigna un nombre o un número. A éstos le
denominaremos datos. Se pueden clasificar de la siguiente
manera:
1. Datos cualitativos: se refiere a categorías o atributos que
pueden clasificarse de acuerdo con determinado criterio.
2. Datos cuantitativos: se refieren a información numérica
(todo lo que se puede contar o medir).
• Datos discretos: obtenidos de un proceso de conteo
(conjunto de los enteros no negativos).
• Datos continuos: obtenidos de un proceso de
medición (conjunto de los números reales).
Organización de Datos

Tipos de Datos
• Algunos datos numéricos se pueden clasificar como
cualitativos, por ejemplo: los códigos de estudiantes, grados
de escolaridad, teléfonos, etc.
• Algunos datos se pueden representar de los dos tipos, por
ejemplo: estatura, calificación etc.
Organización de Datos

Escalas de medición de los datos


Considere el siguiente ejemplo:

a) El número de la camiseta de futbol de Pedro es el 4.

b) Pedro está en 4° grado.

c) Pedro registró la temperatura como 4° Celsius.

d) Pedro cultivó un pepino que tiene 4 cm de largo.


Organización de Datos

Escalas de medición de los datos


Nominal. Se utilizan para datos cualitativos (clasificación de
productos, tipos de carros, género, números telefónicos,
códigos, etc.).

Características: no hay un orden particular, no se pueden


realizar cálculos numéricos. Las categorías deben ser
excluyentes (un elemento no puede asignársele más de una
categoría) y exhaustivas (todo elemento debe asignársele una
categoría).

Ejemplo: El número de la camiseta de futbol de Pedro es el 4.


Organización de Datos

Escalas de medición de los datos


Ordinal. Son datos medidos en una escala nominal, pero,
ordenada de alguna manera (calificaciones por letra,
clasificación de productos, grados de escuela, etc.). En esta
escala, la distancia entre o diferencia entre valores no tiene
significado.

Características: tiene sentido establecer un ordenamiento, las


categorías son excluyentes y exhaustivas, no se pueden realizar
cálculos numéricos.

Ejemplo: Pedro está en 4° grado.


Organización de Datos

Escalas de medición de los datos


De intervalo. Son datos medidos en una escala ordinal, pero de
tipo cuantitativo. La distancia entre valores tiene sentido. No se
pueden establecer razones entre valores.

Características: tiene sentido establecer un ordenamiento, las


categorías son excluyentes y exhaustivas, se pueden realizar
cálculos numéricos, no existe un valor que indique ausencia de
la característica medida, se puede establecer diferencias entre
valores.

Ejemplo: Pedro registró la temperatura como 4° Celsius.


Organización de Datos

Escalas de medición de los datos


De razón. Son datos medidos en una escala de intervalo, donde
el punto cero indica ausencia de medida, se pueden establecer
razones entre valores (tiempo, peso, dinero, etc.).

Características: tiene sentido establecer un ordenamiento, las


categorías son excluyentes y exhaustivas, se pueden realizar
cálculos numéricos, existe el valor que indique ausencia de la
característica medida.

Ejemplo: Pedro cultivó un pepino que tiene 4 cm de largo.


Organización de Datos

Tipos de tablas
Los datos se organizan en tablas de frecuencia, también
denominadas distribuciones de frecuencia, tales como:

• No agrupadas: Datos cualitativos y cuantitativos discretos


cuando el rango de valores no es muy amplio.
• Agrupadas: Datos cuantitativos continuos y discretos cuando
el rango de valores es muy amplio.
• Acumuladas: Cuantitativos.
• Bivariadas: Cualitativos.
Representación de Conjunto de Datos

Tipos de gráficos
La representación de un conjunto de datos se realiza a partir de
gráficos. Analizaremos los siguientes:

• Diagrama de barras univariado (cualitativos).


• Diagrama circular (cualitativos).
• Diagrama de puntos (cualitativos y cuantitativos).
• Histograma (cuantitativos).
• Polígono (cuantitativos).
• Ojiva (cuantitativos a partir de tablas acumuladas).
• Diagrama de barras bivariado (cualitativos).
• Diagrama de Pareto (cualitativos).
• Diagrama de cajas (cuantitativos).
Tabla o Distribución de Frecuencias no Agrupadas
Ejemplo 1 (Datos cualitativos)

Un proceso de producción emplea 7 máquinas en sus tres


operaciones de desplazamiento. Se clasificó una muestra
aleatoria del número de fallas diarias de acuerdo con la
máquina y la operación de desplazamiento en que ocurrió la
falla. Los resultados se muestran en la tabla siguiente.
Construya una tabla de frecuencias para las máquinas en
términos del uso.
Tabla o Distribución de Frecuencias no Agrupadas

Ejemplo 1 (Datos cualitativos)


Máquina 𝑓 (número de días) 𝑓𝑟 = 𝑓ൗ𝑛 % = 100𝑓𝑟
A 10 0,179 17,9
B 15 0,268 26,8
C 15 0,268 26,8
D 8 0,143 14,2
E 5 0,089 8,9
F 3 0,054 5,4
Total (𝑛) 56 1 100
Donde: 𝒏: número de datos, 𝒇: frecuencia absoluta (número de
veces que aparece un dato), 𝒇𝒓 : frecuencia relativa, %:
porcentaje.
Diagrama de Barras

Ejemplo 1 (Datos cualitativos)


Diagrama Circular

Ejemplo 1 (Datos cualitativos)

360𝑓ൗ
Máquina 𝑓 á𝑛𝑔𝑢𝑙𝑜 = 𝑛 % = 100𝑓𝑟

A 10 64,3 17,9
B 15 96,4 26,8
C 15 96,4 26,8
D 8 51,4 14,3
E 5 32,1 8,9
F 3 19,3 5,4
Total (n) 56 360 100
Donde: n: número de datos, 𝒇: frecuencia absoluta (número de
veces que aparece un dato), %: porcentaje.
Diagrama Circular

Ejemplo 1 (Datos cualitativos)

5%
A
9% 18%
B
14% C
D
27%
E
27%
F
Tabla o Distribución de Frecuencias no Agrupadas

Ejemplo 2 (Datos cuantitativos discretos)


Utilizando los datos del Ejemplo 1, construya una tabla de
frecuencias para el número de fallas.
Tabla o Distribución de Frecuencias no Agrupadas
Ejemplo 2 (Datos cuantitativos discretos)

# de fallas 𝑓 𝑓𝑟 % # de fallas 𝑓 𝑓𝑟 %
0 16 0,286 28,6 10 0 0,000 0,0
1 3 0,054 5,4 11 0 0,000 0,0
2 9 0,161 16,1 12 2 0,036 3,6
3 2 0,036 3,6 13 1 0,018 1,8
4 1 0,018 1,8 14 0 0,000 0,0
5 3 0,054 5,4 15 1 0,018 1,8
6 2 0,036 3,6 16 2 0,036 3,6
7 3 0,054 5,4 17 1 0,018 1,8
8 2 0,036 3,6 18 1 0,018 1,8
9 7 0,125 12,5 Total (n) 56 1 100
Diagrama de Barras

Ejemplo 2 (Datos cuantitativos discretos)


Diagrama de Puntos

Ejemplo 2 (Datos cuantitativos discretos)


Histograma

Ejemplo 2 (Datos cuantitativos discretos)


Polígono de Frecuencias

Ejemplo 2 (Datos cuantitativos discretos)


Tabla o Distribución de Frecuencias Agrupadas

Ejemplo 3
Se analizó la productividad de un grupo de trabajadores, a partir
del número de ”piezas aceptables” producidas por cada uno de
ellos en un periodo de una semana. Los datos se resumen en la
tabla. Construya una tabla de frecuencias.
21 35 41 46 51 54 57 61 64 69 77
22 36 41 47 52 54 57 61 65 71 77
24 37 44 48 52 55 58 61 66 71 77
29 37 44 48 52 55 58 62 66 73 79
32 37 44 48 52 55 58 62 66 73 80
33 38 44 49 52 55 58 62 66 73 81
34 40 44 50 53 55 59 62 66 74 81
34 40 44 50 53 56 60 63 66 75 83
35 40 46 51 53 56 60 63 68 75 84
35 40 46 51 53 56 61 63 69 76 88
Tabla o Distribución de Frecuencias Agrupadas

Ejemplo 3
1. Se determina el número de clases 𝐶 a utilizar. Ley de Sturges:
𝐶 = 3,3 log 𝑛 + 1, donde 𝑛 es el número de datos a agrupar
(aproximar al entero más cercano).
2. Se calcula el rango 𝑅, 𝑅 = 𝐷𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟.
3. Se determina la precisión (en la práctica la precisión es dada por
el instrumento de medición), lo cual es equivalente a seguir la
regla siguiente.

#de cifras decimales 0 1 2 3 …


Precisión 𝑃 1 0,1 0,01 0,001 …

4. Se calcula la amplitud 𝐴 = 𝑅Τ𝐶 (se acuerda aproximar por arriba,


teniendo en cuenta la precisión, es decir, la amplitud tendrá tantas
cifras decimales como los datos).
Tabla o Distribución de Frecuencias Agrupadas

Ejemplo 3
5. Se calculan límites teóricos denominados límites de clase.
Los de la primera clase serán:

Límite inferior de la primera clase: 𝐿𝐼1 = 𝐷𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟

Límite superior de la primera clase: 𝐿𝑆1 = 𝐿𝐼1 + 𝐴 − 𝑃

Para la clase 𝑖, 𝑖 = 1, … , 𝐶,

𝐿𝐼𝑖 = 𝐿𝐼𝑖−1 + 𝐴

𝐿𝑆𝑖 = 𝐿𝑆𝑖−1 + 𝐴
Tabla o Distribución de Frecuencias Agrupadas

Ejemplo 3
6. Se calculan límites prácticos denominados fronteras de
clase. Los de la primera clase serán:

Frontera inferior de la primera clase: 𝐹𝐼1 = 𝐿𝐼1 − 𝑃Τ2

Frontera superior de la primera clase: 𝐹𝑆1 = 𝐿S1 + 𝑃Τ2

Para la clase 𝑖, 𝑖 = 1, … , 𝐶,

𝐹𝐼𝑖 = 𝐹𝐼𝑖−1 + 𝐴

𝐹𝑆𝑖 = 𝐹𝑆𝑖−1 + 𝐴 o 𝐹𝑆𝑖 = 𝐹𝐼𝑖 + 𝐴


Tabla o Distribución de Frecuencias Agrupadas

Ejemplo 3
𝑓
Clase Límites Fronteras 𝑓 𝑓𝑟 = ൗ𝑛 %
1 21 – 29 20,5 – 29,5 4 0,04 4
2 30 – 38 29,5 – 38,5 12 0,11 11
3 39 – 47 38,5 – 47,5 16 0,15 15
4 48 – 56 47,5 – 56,5 28 0,25 25
5 57 – 65 56,5 – 65,5 22 0,20 20
6 66 – 74 65,5 – 74,5 15 0,14 14
7 75 – 83 74,5 – 83,5 11 0,10 10
8 84 – 92 83,5 – 92,5 2 0,02 2
Total 110 1 100
Tabla o Distribución de Frecuencias Agrupadas
Características de las tablas agrupadas
• Uniformidad: Todas las clases deben tener la misma amplitud.
• Unicidad: Las clases no deben traslaparse.
• Completez: Cada dato debe pertenecer a alguna clase.

Notas
• Si la última clase queda sin datos, se puede eliminar.
• Si no se sigue el acuerdo para el cálculo de la amplitud, es
posible que los datos mayores no pertenezcan a ninguna
clase, en este caso anexe otra clase que cumpla con las tres
propiedades anteriores.
• Es posible crear la tabla de frecuencia sin tener en cuenta los
pasos del 1 al 6, pero se deben garantizar las tres
propiedades.
Histograma

Ejemplo 3
Polígono de Frecuencia

Ejemplo 3
Tabla o Distribución de Frecuencias Acumuladas

Ejemplo 4 (Datos cuantitativos discretos y continuos)


Tabla de frecuencias acumuladas para el ejemplo 2.
# de fallas 𝑓𝑎𝑐 𝑓𝑟−𝑎𝑐 % 𝑎𝑐 # de fallas 𝑓𝑎𝑐 𝑓𝑟−𝑎𝑐 % 𝑎𝑐
0 16 0,286 28,6 10 48 0,857 85,7
1 19 0,339 33,9 11 48 0,857 85,7
2 28 0,500 50,0 12 50 0,893 89,3
3 30 0,536 53,6 13 51 0,911 91,1
4 31 0,554 55,4 14 51 0,911 91,1
5 34 0,607 60,7 15 52 0,929 92,9
6 36 0,643 64,3 16 54 0,964 96,4
7 39 0,696 69,6 17 55 0,982 98,2
8 41 0,732 73,2 18 56 1,000 100
9 48 0,857 85,7
Ojiva

Ejemplo 4 (Datos cuantitativos discretos y continuos)


Graficar la ojiva para los datos del ejemplo 2.
Tabla o Distribución de Frecuencias Acumuladas

Ejemplo 4 (Datos cuantitativos discretos y continuos)


Calcular la tabla de frecuencias acumuladas para los datos del
ejemplo 3.
Fronteras 𝑓𝑎𝑐 𝑓𝑟−𝑎𝑐 % 𝑎𝑐
≤ 20,5 0 0,000 0,0
≤ 29,5 4 0,036 3,6
≤ 38,5 16 0,145 14,5
≤ 47,5 32 0,291 29,1
≤ 56,5 60 0,545 54,5
≤ 65,5 82 0,745 74,5
≤ 74,5 97 0,882 88,2
≤ 83,5 108 0,982 98,2
≤ 92,5 110 1 100
Tabla o Distribución de Frecuencias Acumuladas

Ejemplo 4 (Datos cuantitativos discretos y continuos)


Graficar la ojiva para los datos del ejemplo 3.
Tabla o Distribución de Frecuencias Bivariadas

Ejemplo 5
Utilizando los datos del Ejemplo 1, construya una tabla de
frecuencias bivariada teniendo en cuenta la máquina y la
operación de desplazamiento.
Tabla o Distribución de Frecuencias Bivariadas

Ejemplo 5
Tabla bivariada teniendo en cuenta la máquina y la operación de
desplazamiento.
Máquina/Operación 1 2 3 Total
A 10 0 0 10
B 11 2 2 15
C 5 10 0 15
D 3 4 1 8
E 4 1 0 5
F 2 1 0 3
Total 35 18 3 56
Diagrama de Barras Bivariado

Ejemplo 5
Diagrama de Barras Bivariado

Ejemplo 5
Tabla o Distribución de Frecuencias Bivariadas

Ejemplo 5
Responder a partir de la tabla:
• ¿Qué porcentaje de los días se usó la máquina B?
• ¿Qué porcentaje de los días se realizó la operación de
desplazamiento 1?
• ¿Qué porcentaje de los días se usó la máquina B y se realizó
la operación de desplazamiento 1?
• ¿Qué porcentaje de los días en que se usó la máquina B se
hizo la operación de desplazamiento 1?
• ¿Qué porcentaje de los días en que se hizo la operación de
desplazamiento 1 se utilizó la máquina B?
Tabla o Distribución de Frecuencias Bivariadas

Ejercicio
Construya una tabla de frecuencias bivariada teniendo en
cuenta la máquina y la operación de desplazamiento, pero a
partir del número de fallas. Tome porcentajes de totales por fila,
columna, celdas, restringido a filas y columnas e interprete cada
uno de ellos.
Diagrama de Pareto

¿Qué es un Diagrama de Pareto


• Una forma especial de gráfico de barras verticales que separa
los problemas muy importantes de los menos importantes,
estableciendo un orden de prioridades.
• Fue creado por el economista italiano Vilfredo Pareto sobre la
base del principio según el cual, el 80% de los problemas son
provenientes de apenas el 20% de las causas.
• Sus objetivos fundamentales son:
1. Identificar y dar prioridad a los problemas más
significativos de un proceso.
2. Evaluar el comportamiento de un problema, comparando
los datos entre el “antes” y el “después”.
Diagrama de Pareto

Ejemplo 6
La tabla siguiente representa las causas de los accidentes de
tránsito ocurridos en una intersección durante el último mes.
Realizar el diagrama de Pareto, a partir de los siguientes datos.
Causa Frecuencia
Exceso de velocidad (V) 11
Falta de señalización (S) 8
Estado de embriaguez (Z) 32
Problemas de frenos (R) 7
Animales (A) 6
Problemas de sueño (N) 15
Otros (O) 4
Diagrama de Pareto

Ejemplo 6

Causa 𝑓 𝑓𝑎𝑐𝑢𝑚 %𝑎𝑐𝑢𝑚


Estado de embriaguez (Z) 32 32 38,5
Problemas de sueño (N) 15 47 56,6
Exceso de velocidad (V) 11 58 69,9
Falta de señalización (S) 8 66 79,5
Problemas de frenos (R) 7 73 87,9
Animales (A) 6 79 95,2
Otros (O) 4 83 100
Diagrama de Pareto

Ejemplo 6

D i a g ram a d e P a reto

100

100,00
95,18
80 87,95

79,52

69,88
60
Frecuencia

56,63

40 38,55

20

0
Z V R O
N S A
Unidad 1
Introducción y Estadística Descriptiva
Daniel Orlando Rivera Royero
Departamento de Ingeniería Industrial

Semana 1

También podría gustarte