Medidas de Tendencia y Dispersion Terminado

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 5

Medidas de Tendencia

Las medidas de tendencia central, o medidas de centralización, son métricas estadísticas que indican
el valor central de una distribución. Es decir, las medidas de tendencia central sirven para encontrar
un valor representativo del centro de un conjunto de datos.

Las medidas de tendencia central más utilizadas son la media, la mediana y la moda.

Las medidas de tendencia central también se llaman medidas de posición central.

Las medidas de tendencia central son:

Media: es el promedio de todos los datos de la muestra.

Para calcular la media se deben sumar todos los valores y luego dividir entre el número total de
datos. Por lo tanto, la fórmula de la media es la siguiente:

La media también se conoce como media aritmética o promedio. Además, la media de una
distribución estadística es equivalente a su esperanza matemática.

EJEMPLO:

Un alumno ha sacado las siguientes notas en un curso escolar: en matemáticas un 9, en lengua un 7,


en historia un 6, en economía un 8 y en ciencia un 7,5. ¿Cuál es la media de todas sus notas?

Para hallar la media aritmética tenemos que sumar todas las notas y luego dividir entre el número
total de asignaturas del curso, que es 5. Por lo tanto, aplicamos la fórmula de la media aritmética:

Sustituimos los datos en la fórmula y hacemos el cálculo de la media aritmética:

Como puedes ver, en la media aritmética se atribuye a cada valor la misma ponderación, es decir,
cada dato tiene el mismo peso dentro del conjunto.

El cálculo de este tipo de medida de tendencia central varia ligeramente cuando los datos están
agrupados por intervalos.

Mediana: es el valor del medio de todos los datos ordenados de menor a mayor. Es decir, la
mediana divide todo el conjunto de datos ordenados en dos partes iguales.

El cálculo de la mediana depende de si el número total de datos es par o impar:

Si el número total de datos es impar, la mediana será el valor que está justo en el medio de los
datos. Es decir, el valor que está en la posición (n+1)/2 de los datos ordenados.
Si el número total de datos es par, la mediana será la media de los dos datos que están en el centro.
Esto es, la media aritmética de los valores que están en la posiciones n/2 y n/2+1 de los datos
ordenados.

Donde n es el número total de datos de la muestra y el símbolo Me indica mediana.

Moda: es el valor que más se repite del conjunto de datos que tiene una mayor frecuencia absoluta,
es decir, la moda es el valor que más se repite de un conjunto de datos.

Por lo tanto, para calcular la moda de un conjunto de datos estadísticos basta con contar el número
de veces que aparece cada dato en la muestra, y el dato más repetido será la moda.

La moda también se puede decir moda estadística o valor modal.

Se pueden distinguir tres tipos de modas según el número de valores que están más repetidos:

Moda unimodal: solo hay un valor con el máximo número de repeticiones. Por ejemplo, [1, 4, 2, 4, 5,
3].

Moda bimodal: el máximo número de repeticiones se produce en dos valores diferentes y ambos
valores se repiten el mismo número de veces. Por ejemplo, [2, 6, 7, 2, 3, 6, 9].

Moda multimodal: tres o más valores tienen el mismo número máximo de repeticiones. Por
ejemplo, [3, 3, 4, 1, 3, 4, 2, 1, 4, 5, 2, 1].
Medidas de dispersión
Las medidas de dispersión permiten calcular la representatividad de una medida de posición, para lo
cual será preciso cuantificar la distancia de los diferentes valores de la distribución respecto a dicha
medida (que se pretende que sea su síntesis). A tal distancia es a lo que, en términos estadísticos se
le denomina variabilidad o dispersión de la distribución.

Entre menor sea la distancia, más representativa es la medida de posición, y entre mayor sea dicha
distancia, será menos representativa. Resulta pues necesario para completar la información que
pueda deducirse de una medida de posición o centralización, acompañarla de uno o varios
coeficientes que nos midan el grado de dispersión de la distribución de la variable respecto de esa
medida de centralización.

Estos coeficientes son los que se conocen como medidas de dispersión. Inicialmente se distingue
entre medidas de dispersión absolutas y relativas, entendiéndose por relativas las que no dependen
de las unidades de medida. Posteriormente se clasifican las medidas absolutas y relativas según sean
medidas referentes a promedios o no los sean.

Entre las medidas de dispersión absolutas no referentes a promedios se tienen el recorrido o rango o
diferencia entre el mayor y menor de los datos y el recorrido intercuartílico o diferencia existente
entre el tercer cuartil y el primero.

Entre las medidas de dispersión relativas no referentes a promedios se tienen el coeficiente de


apertura o cociente entre el mayor valor y el menor valor de una distribución y el recorrido relativo o
cociente entre el recorrido y la media, así como el recorrido semintercuartílico o cociente entre el
recorrido intercuatílico y la suma del primer y tercer cuartil. Entre las medidas de dispersión
absolutas referentes a promedios se tienen la varianza y la desviación típica.

Entre las medidas de dispersión relativas utilizadas para comparar medidas de posición o promedios,
se tienen el índice de dispersión respecto a la mediana y el coeficiente de variación de Pearson. En la
tabla, se presenta el resumen de las fórmulas de cálculo de las medidas de dispersión más usadas en
quimiometría.

RANGO:

El rango es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de una
población o muestra estadística.

Para calcular el rango de una muestra o población estadística utilizaremos la siguiente fórmula:

R = Máxx – Mínx

 R es el rango.
 Máx es el valor máximo de la muestra o población.
 Mín es el valor mínimo de la muestra o población estadística.
 x es la variable sobre la que se pretende calcular esta medida.
DESVIACION ESTANDAR:

La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o población).


Mientras mayor es la desviación estándar, mayor es la dispersión de la población. La desviación
estándar es un promedio de las desviaciones individuales de cada observación con respecto a la
media de una distribución. Así, la desviación estándar mide el grado de dispersión o variabilidad. En
primer lugar, midiendo la diferencia entre cada valor del conjunto de datos y la media del conjunto
de datos. Luego, sumando todas estas diferencias individuales para dar el total de todas las
diferencias. Por último, dividiendo el resultado por el número total de observaciones (normalmente
representado por la letra “n”) para llegar a un promedio de las distancias entre cada observación
individual y la media. Este promedio de las distancias es la desviación estándar y de esta manera
representa dispersión.

Formula:

 S = Desviación estándar
 ∑ = Suma de
 Xi = Valor de un conjunto de datos
 x̄ = Media del conjunto de datos
 N = Número de datos.

VARIANZA:

La varianza es una medida de dispersión que representa la variabilidad de una serie de datos
respecto a su media. Formalmente se calcula como la suma de los residuos al cuadrado divididos
entre el total de observaciones.

FORMULA:

La unidad de medida de la varianza será siempre la unidad de medida correspondiente a los datos
pero elevada al cuadrado. La varianza siempre es mayor o igual que cero. Al elevarse los residuos al
cuadrado es matemáticamente imposible que la varianza salga negativa. Y de esa forma no puede
ser menor que cero.

X: variable sobre la que se pretenden calcular la varianza

xi: observación número i de la variable X. i puede tomará valores entre 1 y n.

n: número de observaciones.

x̄: Es la media de la variable X.


FORMULAS DE MEDIDAS DE POSICIÓN

FORMULAS PARA LAS MEDIDAS DE DISPERSION

También podría gustarte