Medidas de Tendencia y Dispersion Terminado
Medidas de Tendencia y Dispersion Terminado
Medidas de Tendencia y Dispersion Terminado
Las medidas de tendencia central, o medidas de centralización, son métricas estadísticas que indican
el valor central de una distribución. Es decir, las medidas de tendencia central sirven para encontrar
un valor representativo del centro de un conjunto de datos.
Las medidas de tendencia central más utilizadas son la media, la mediana y la moda.
Para calcular la media se deben sumar todos los valores y luego dividir entre el número total de
datos. Por lo tanto, la fórmula de la media es la siguiente:
La media también se conoce como media aritmética o promedio. Además, la media de una
distribución estadística es equivalente a su esperanza matemática.
EJEMPLO:
Para hallar la media aritmética tenemos que sumar todas las notas y luego dividir entre el número
total de asignaturas del curso, que es 5. Por lo tanto, aplicamos la fórmula de la media aritmética:
Como puedes ver, en la media aritmética se atribuye a cada valor la misma ponderación, es decir,
cada dato tiene el mismo peso dentro del conjunto.
El cálculo de este tipo de medida de tendencia central varia ligeramente cuando los datos están
agrupados por intervalos.
Mediana: es el valor del medio de todos los datos ordenados de menor a mayor. Es decir, la
mediana divide todo el conjunto de datos ordenados en dos partes iguales.
Si el número total de datos es impar, la mediana será el valor que está justo en el medio de los
datos. Es decir, el valor que está en la posición (n+1)/2 de los datos ordenados.
Si el número total de datos es par, la mediana será la media de los dos datos que están en el centro.
Esto es, la media aritmética de los valores que están en la posiciones n/2 y n/2+1 de los datos
ordenados.
Moda: es el valor que más se repite del conjunto de datos que tiene una mayor frecuencia absoluta,
es decir, la moda es el valor que más se repite de un conjunto de datos.
Por lo tanto, para calcular la moda de un conjunto de datos estadísticos basta con contar el número
de veces que aparece cada dato en la muestra, y el dato más repetido será la moda.
Se pueden distinguir tres tipos de modas según el número de valores que están más repetidos:
Moda unimodal: solo hay un valor con el máximo número de repeticiones. Por ejemplo, [1, 4, 2, 4, 5,
3].
Moda bimodal: el máximo número de repeticiones se produce en dos valores diferentes y ambos
valores se repiten el mismo número de veces. Por ejemplo, [2, 6, 7, 2, 3, 6, 9].
Moda multimodal: tres o más valores tienen el mismo número máximo de repeticiones. Por
ejemplo, [3, 3, 4, 1, 3, 4, 2, 1, 4, 5, 2, 1].
Medidas de dispersión
Las medidas de dispersión permiten calcular la representatividad de una medida de posición, para lo
cual será preciso cuantificar la distancia de los diferentes valores de la distribución respecto a dicha
medida (que se pretende que sea su síntesis). A tal distancia es a lo que, en términos estadísticos se
le denomina variabilidad o dispersión de la distribución.
Entre menor sea la distancia, más representativa es la medida de posición, y entre mayor sea dicha
distancia, será menos representativa. Resulta pues necesario para completar la información que
pueda deducirse de una medida de posición o centralización, acompañarla de uno o varios
coeficientes que nos midan el grado de dispersión de la distribución de la variable respecto de esa
medida de centralización.
Estos coeficientes son los que se conocen como medidas de dispersión. Inicialmente se distingue
entre medidas de dispersión absolutas y relativas, entendiéndose por relativas las que no dependen
de las unidades de medida. Posteriormente se clasifican las medidas absolutas y relativas según sean
medidas referentes a promedios o no los sean.
Entre las medidas de dispersión absolutas no referentes a promedios se tienen el recorrido o rango o
diferencia entre el mayor y menor de los datos y el recorrido intercuartílico o diferencia existente
entre el tercer cuartil y el primero.
Entre las medidas de dispersión relativas utilizadas para comparar medidas de posición o promedios,
se tienen el índice de dispersión respecto a la mediana y el coeficiente de variación de Pearson. En la
tabla, se presenta el resumen de las fórmulas de cálculo de las medidas de dispersión más usadas en
quimiometría.
RANGO:
El rango es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de una
población o muestra estadística.
Para calcular el rango de una muestra o población estadística utilizaremos la siguiente fórmula:
R = Máxx – Mínx
R es el rango.
Máx es el valor máximo de la muestra o población.
Mín es el valor mínimo de la muestra o población estadística.
x es la variable sobre la que se pretende calcular esta medida.
DESVIACION ESTANDAR:
Formula:
S = Desviación estándar
∑ = Suma de
Xi = Valor de un conjunto de datos
x̄ = Media del conjunto de datos
N = Número de datos.
VARIANZA:
La varianza es una medida de dispersión que representa la variabilidad de una serie de datos
respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos
entre el total de observaciones.
FORMULA:
La unidad de medida de la varianza será siempre la unidad de medida correspondiente a los datos
pero elevada al cuadrado. La varianza siempre es mayor o igual que cero. Al elevarse los residuos al
cuadrado es matemáticamente imposible que la varianza salga negativa. Y de esa forma no puede
ser menor que cero.
n: número de observaciones.