Gestion y Administracion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

TEMA 4 medidas de dispersion

Medidas de dispersión
A veces, es imprescindible saber si en una distribución los datos numéricos están agrupados o no
alrededor de los valores centrales. VARIABILIDAD
A esto es a lo que se le llama dispersión, y a los parámetros que miden estas desviaciones respecto
a la media medidas de dispersión o parámetros de dispersión.

Conocer la dispersión es importante, ya que:


Permite “medir” la confianza de la medida de tendencia central. Si los datos se encuentran
ampliamente dispersos, la posición central es menos representativa de los datos.
Podemos comparar la dispersión de varias distribuciones.

Las medidas de dispersión se dividen en dos tipos:


Absolutas: Rango o recorrido, Recorrido intercuartílico, Desviación absoluta media (desviacion
media), Varianza y desviación típica (o estándar).
Permiten medir la separación que, por término medio, existen entre los valores de la variable. Por
tanto, serán medidas expresadas en los mismos valores de la variable.
Relativas: Coeficiente de apertura, Recorrido relativo, Recorrido semi-intercuartílico, Coeficiente
de variación o de Pearson.
Se trata de medir la dispersión con independencia de los valores en que venga expresada la
variable. Permiten comparar distribuciones incluso cuando vienen expresadas en unidades
distintas.

RANGO, RECORRIDO O AMPLITUD DE LA DISTRIBUCIÓN (absoluta)


Diferencia entre el valor mínimo y máximo de una distribución en valores ordenados.
Rx=Xn-Xi

1.Cuanto menor es el recorrido, mayor es el grado de representatividad de los valores centrales.


2.Cuanto mayor es, la distribución está menos concentrada o más dispersa.
3.Tiene la gran ventaja de su sencillez de cálculo.
4.Tiene el inconveniente de que sólo depende de los valores extremos. De esta forma basta que
uno de ellos se separe mucho para que el recorrido se vea sensiblemente afectado.

Ejemplo: Distribución de edades.


18,19,20,21,22,23,24
Media aritmética simple: X =21
Mediana: Me=21
Recorrido: Rx=24-18=6
17,22, 24,33,44,53,54
Media aritmética simple: X=35.28
Mediana: Me=33
Recorrido: Rx=54-17=37

RECORRIDO INTERCUARTILICO (absoluta)


Para paliar el inconveniente de la sensibilidad del recorrido a valores extremos, a veces se utilizan
otras dos medidas:

Recorrido intercuartílico: Ri = Q3 – Q1
Recorrido entre percentiles: Ri = P90 – P10

EJEMPLO
17,22, 24,33,44,53,54
Media aritmética simple: X=35.28
Mediana: Me=33
Recorrido: Rx=54-17=37
RECORRIDO INTERCUARTÍLICO: Rx=Q3-Q1=31
Q1=22
Q3=53

RECORRIDO SEMI-INTERCUARTILICO Y RELATIVO (RELATIVAS)


Recorrido semi-intercuartílico: Rsi = Q3 – Q1 /Q3+Q1=53-22/53+22=0.41
Recorrido relativo: RRx = Rx/X(media)= 37/35.28=1.04
Nos indica el número de veces que el recorrido contiene a la media aritmética.

Desviación absoluta media ( o desviación media)


La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a
la media.

Fórmula para datos sin agrupar.


Nótese que se toman las desviaciones en valor absoluto, es decir, que la fórmula no distingue si la
diferencia de cada valor de la variable con la media es en más o en menos.

Ejemplo datos sin agrupar


2, 2, 4, 4, 5,
Media: X=3.4
Me=4
Mo=4 y 2
Dm= (2-3.4)+(2-3.4)+(4-3.4)+(4-3.4)+(5-3.4)= /5=1.12

Ejemplo datos agrupados en frecuencias

Clase fi Marca de clase fi * marca de clase(=X1) Xi-X(media)=X fi X

16-20 2 18 36 16,72 33,44


20-24 8
24-28 8
X=19.28

1. Su valor depende del valor de cada observación.


2. Se puede calcular alrededor de la media o de la mediana.
3. Mide la desviación de una observación sin notar si está por encima o por debajo del promedio.

La desviación media viene a indicar el grado de concentración o de dispersión de los valores de la


variable. Si es muy alta, indica gran dispersión; si es muy baja refleja un buen agrupamiento y que
los valores son parecidos entre sí.
La desviación media se puede utilizar como medida de dispersión en todas aquellas distribuciones
en las que la medida de tendencia central más significativas haya sido la media. Sin embargo,
para las mismas distribuciones es mucho más significativa la desviación típica, que estudiaremos a
continuación, y eso hace que el uso de la desviación media sea cada vez más restringido.

Varianza y desviación típica


Si las desviaciones con respecto a la media las consideramos al cuadrado, obtenemos que todos los
sumandos tienen el mismo signo (positivo). Esta es además la forma de medir la dispersión de los
datos porque que sus propiedades matemáticas son más fáciles de utilizar.
Vamos a definir entonces dos estadísticos que serán fundamentales en el resto del curso: La
varianza y la desviación típica.

Varianza y desviación típica (o estándar)


Ambas son una media aritmética del cuadrado de las distancias de cada uno de los valores de la
distribución con respecto a la media.
Se diferencian de la Dx (desviación media) en que, en lugar de tomar los valores absolutos, toman
el cuadrado de esos mismos valores y que respetan el signo positivo o negativo de los valores.

Varianza
La Varianza muestral , se define como la media de las diferencias cuadráticas de n puntuaciones
con respecto a su media aritmética, es decir:

Elevar cada diferencia al cuadrado hace que todos los números sean positivos (para evitar que los
números negativos reduzcan la varianza).
Y también hacen que las diferencias grandes se destaquen.

Varianza: ejemplo
Datos no agrupados
Puntuaciones 600,470,170,430,300
Media?: X=394
Varianza S2= 2062+762+(-224)2+362+(-4)2/5=21.704
Datos agrupados en frecuencias
La fórmula anterior incorpora la frecuencia

Varianza: propiedades
Es siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0 solamente cuando xi =
x.
La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.
Si a todos los valores de la variable se le suma una constante la varianza no se modifica.
Si todos los valores de la variable se multiplican por una constante, la varianza queda multiplicada
por el cuadrado de dicha constante.

Varianza y desviación típica (o estándar)


La varianza no tiene la misma magnitud que las observaciones (ej. si las observaciones se miden
en metros, la varianza lo hace en m2 ).
Si queremos que la medida de dispersión sea de la misma dimensionalidad que las
observaciones, bastará con tomar su raíz cuadrada. Por ello se define la desviación típica, como
Desviación típica (o estándar) ejemplo
Calcular la desviación típica de la distribución:
9, 3, 8, 8, 9, 8, 9, 18

La desviación típica, al igual que la media y la varianza, es un índice muy sensible a las
puntuaciones extremas.
En los casos que no se pueda hallar la media tampoco será posible hallar la desviación típica.
Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la
media.
La desviación típica y la varianza sirven para medir de forma eficaz la dispersión de un conjunto
de datos entorno a su media.
Desgraciadamente esta medida puede resultar engañosa cuando tratamos de comparar la
dispersión de dos conjuntos de datos, porque ambas son medidas absolutas.

Coeficiente de variación de Pearson (relativa)


El coeficiente de variación de PEARSON es una de las más significativas y lo podemos definir,
como el cociente entre la desviación típica y la media aritmética de una distribución.

Es necesario tener en cuenta que al efectuar el cociente eliminamos las unidades por tanto CV es
adimensional.
Por convención se considera que la dispersión es óptima si Cv es igual o menor que 0,3.
Se puede dar en tanto por ciento calculando:

También podría gustarte