Estadística y Control de Calidad
Estadística y Control de Calidad
Estadística y Control de Calidad
09/02/2022
Unidad. 1: Estadística Descriptiva
• Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá
ser 3.45).
• Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,
la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h...etc. Cuando se
estudia el comportamiento de una variable hay que distinguir los siguientes
conceptos:
Los principales conceptos en estadística a partir de los cuales podemos
profundizar en ella son:
Veamos dos ejemplos que nos aclaren estos dos tipos de Estadística:
Ejemplo 1. Cuando van a llegar cualquier tipo de elecciones, por ejemplo, las
elecciones generales, es muy frecuente que los medios de comunicación, nos
adelanten los resultados de encuestas o sondeos en los que se nos indica el
resultado final de dichas elecciones con una precisión y con un error
determinados. Estos sondeos son realizados por distintas técnicas sobre un grupo
(muestra) más o menos numeroso de personas. Naturalmente, cuánto mayor sea
el número de españoles con derecho a voto encuestados, mayor será la fiabilidad
de la encuesta, pero también mayor será el coste del sondeo. El estudio de esta
Un método sería pasar clase por clase y medirlos a todos, esto nos podría llevar
un tiempo considerable pero sería la forma más exacta de hacer dicho estudio,
aunque es fácil encontrarnos con ausencias y tendríamos que volver varios días y
pasar lista para conseguir la estatura de todo el alumnado. Una vez que tengamos
todos los datos en nuestro poder los resultados los obtendríamos mediante
Estadística descriptiva.
Otra posibilidad podría ser pasar clase por clase, decirle a los alumnos y alumnas
que anoten su estatura en un papel y recogerlos todos. También así tendríamos
un estudio de Estadística descriptiva, aunque seguramente menos fiable que con
el método anterior, pues casi con toda seguridad, y lo digo por experiencia,
algunos alumnos escriban su estatura a cálculo y otros, con ganas de bromas,
muy por encima o muy por debajo de la realidad.
Y otra posibilidad sería escoger una muestra, es decir un grupo de por ejemplo 50
personas, hacer el estudio descriptivo sobre ellas y después generalizarlo a todo
el instituto con Estadística inferencial. En este caso, comprobaríamos por una
parte que cuánto mayor sea la muestra más trabajo tendremos, pero más fiable
será el resultado final y por otra, que la elección de la muestra debe hacerse de
manera que permita también fiarnos del resultado obtenido. Si estamos en
segundo de bachillerato, ¿podríamos coger como muestra los 50 alumnos de este
curso? ¿Por qué? ¿Qué forma de elegir la muestra se te ocurre?
En cualquiera de los dos ejemplos, ¿cuáles serían los resultados más fiables?
Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son: media, mediana y moda. Las medidas de dispersión en
cambio miden el grado de dispersión de los valores de la variable. Dicho en otros
términos las medidas de dispersión pretenden evaluar en qué medida los datos
difieren entre sí. De esta forma, ambos tipos de medidas usadas en conjunto
permiten describir un conjunto de datos entregando información acerca de su
posición y su dispersión.
Según este criterio, haremos primero el estudio de las medidas estadísticas para
datos no agrupados y luego para datos agrupados.
Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética o
promedio aritmético. Se representa por la letra griega µ cuando se trata del
promedio del universo o población y por Ȳ (léase Y barra) cuando se trata del
promedio de la muestra. Es importante destacar que µ es una cantidad fija
mientras que el promedio de la muestra es variable puesto que diferentes
muestras extraídas de la misma población tienden a tener diferentes medias. La
media se expresa en la misma unidad que los datos originales: centímetros, horas,
gramos, etc.
Ejemplo de desviaciones:
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la
variable que ocupa la posición central, cuando los datos se disponen en orden de
magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores
a la mediana y el otro 50% tiene valores iguales o superiores a la mediana.
Moda
La moda de una distribución se define como el valor de la variable que más se
repite. En un polígono de frecuencia la moda corresponde al valor de la variable
que está bajo el punto más alto del gráfico. Una muestra puede tener más de una
moda.
Medidas de dispersión
Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el menor valor de
la variable.
Fórmulas
Donde µ es el promedio de la población.
Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como la desviación
estándar de la muestra expresada como porcentaje de la media muestral.
Donde:
Con los datos del ejemplo y recordando que el promedio (Y) resultó ser 2,78
partos por madre,
Cuando los datos están agrupados en intervalos de clase, se trabaja con la marca
de clase (Yc), de tal modo que la fórmula queda:
Donde Yc es el punto medio del intervalo y se llama marca de clase del intervalo
Percentiles
Los percentiles son valores de la variable que dividen la distribución en 100 partes
iguales. De este modo si el percentil 80 (P80) es igual a 35 años de edad, significa
que el 80% de los casos tiene edad igual o inferior a 35 años.
El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea
inmediatamente superior a 33,6 ((80x42) /100).
2. La mediana será:
Esto significa que un 50% de las familias tiene ingreso mensual igual o inferior a
$127.270.
3. El percentil 78 será:
Por lo tanto se puede decir que 78% de las familias tienen ingreso igual o inferior a
$174.660.
4. Los percentiles 10 y 90 serán:
5. - La varianza será:
Función De Distribución
Función de distribución
Este ejemplo es una muestra de 1000 elementos que empiezan en 7 y terminan
en 17.
Es importante recordar que la probabilidad siempre será un valor comprendido
entre 0 y 1. Entonces, es lógico que la función de distribución de probabilidad
empiece en 0 al inicio de la muestra y termine en 1 al final de la muestra.
La función de distribución anterior hace referencia a la distribución Normal. Otras
distribuciones como la Poisson, la log-normal y la exponencial también tienen una
función de distribución parecida.
Define una cuarta columna en tu hoja de cálculo y divide los valores en la tercera
columna por el número total de registros de tu conjunto de datos. Por ejemplo, si
tenías 10 valores totales, deberías escribir “=C1/10” para hallar el porcentaje
de frecuencia.
¿Cuál es la frecuencia absoluta acumulada?
8 Jul FRECUENCIA RELATIVA PORCENTUAL (hi%) Es el Producto de
la Frecuencia Absoluta “fi” por % entre el total de datos “n”: asi; Ejemplo: Sea las
notas de 10 alumnos en una Prueba Pre Test: Xi = 12; 11; 10; 12; 13; 12; 10; 13;
12;.
¿Cómo se calcula la frecuencia absoluta en Excel?
1.4 Histogramas.
Solución:
Recuerda que si vas a trabajar con una variable cualitativa o variable discreta que
asume pocos valores, deberás usar un diagrama de barras y no un histograma.
Polígono de frecuencias
Solución:
Ojiva
Una ojiva también se puede construir con las frecuencias relativas acumuladas o
frecuencias porcentuales acumuladas.
Ejemplo 3
Solución:
Diferencia entre el polígono de frecuencias y ojiva
Reto
Se registran las longitudes de los pernos producidos en una fábrica, y partir de allí
se construye el histograma mostrado. Calcular la frecuencia relativa y la frecuencia
porcentual de los pernos que tienen una longitud comprendida entre los 20,01 y
los 20,02 milímetros.
Solución:
Por esta razón es sumamente empleado dentro de las ciencias sociales y ciencias
económicas, permitiendo así establecer comparaciones útiles entre los distintos
resultados de un mismo proceso.
Trazar el gráfico lineal cerrado, juntando los puntos medios de los datos obtenidos.
excel-poligono de frecuencias
Obtener primero el cuadro de datos a partir del cual se desea graficar un polígono
de frecuencias.
Buscar el menú “insertar”, y elegir las opciones “gráfico”, luego “línea” y finalmente
“línea con marcadores”.
Presionar “aceptar” para obtener así la gráfica. Recordemos que debe ser un
gráfico cerrado, así que a menudo deberemos añadir datos para los intervalos
nuevos (en ese caso añadiremos el número 0 a cada uno).
Además, permite evaluar previamente, cuáles son las necesidades del público
objetivo y cómo satisfacerlas con nuestro producto o servicio, logando también, el
objetivo del mercadotecnia.
Fue enunciado por primera vez por el ingeniero, sociólogo, economista y filósofo
italiano Vilfredo Pareto (1848-1923).
En otras palabras, podemos decir que, aunque muchos factores contribuyan a una
causa, son pocos los responsables de dicho resultado.
El diagrama de Pareto está conformado por una estructura dividida en tres partes:
La parte inferior del eje "X" muestra los problemas, quejas, defectos o
desperdicios que se presentaron.
Área de producción
Área de ventas
El 80% de las tratativas cerradas por la fuerza de ventas son generadas por el
20% de los productos y 20% de los clientes generan el 80% de los ingresos.
Área de gerencia
El 80% del éxito de una empresa proviene del 20% de sus empleados.
Gestión de almacenes
Control de calidad
La categoría (o problemas) son los más comunes que observas en tu sitio web.
Correlación positiva
Correlación nula
Estos son pues, los tipos de correlación más visibles. Aunque si lo miramos desde
una perspectiva que evalua qué tan fuerte o débil es la correlación, encontramos
otra clasificación.
r=1
La correlación es positiva perfecta. Si una variable crece, la otra también lo hace
en una proporción constante. Es una relación directa, por eso si trazamos
una linea de ajuste esta va pasar por todos y cada uno de los puntos.
0<r<1
Es cuando r esta entre 0 y 1 sin llegar a ser 0 y 1. Es una correlación positiva. El
grado de cercanía de 1 define qué tan directa y proporcional es la relación entre
ambas variables, por ende entre más cerca esté de 0, más débil será su
correlación negativa.
r=0
La correlación es nula, es decir que no existe una relación lineal entre ambas
variables. Qué tal si pruebas buscando otro tipo de relación.
-1<r<0
Es cuando r esta entre -1 y 0 sin llegar a ser –1 y 0. Es una correlación negativa.
El grado de cercanía a -1 define que tan inversa y proporcional es la relación entre
ambas variables, por ende entre más cerca esté de 0, más debíl será su
correlación negativa.
r=-1
La correlación es negativa perfecta. Si una variable crece, la otra va a disminuir en
proporción constante. Es una relación directa e inversa, por lo tanto una línea de
ajuste va a tocar todos los puntos graficados.
Imagina que una litográfica está abriendo una nueva área de producción para
la impresión de posters, y en este momento se encuentra haciendo todos los
ensayos y pruebas para determinar la cantidad de tinta de cada color que
deberían tener las maquinas.
Como prueba inicial, han decidido establecer la relación de errores de impresión
según el grado de llenado de los recipientes de tinta de la máquina.
Las variables a estudiar para este ejemplo de grafico de dispersión en calidad son: