Guia Estadistica Ultimo Momento

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 14

8.1.

2 OBJETIVO GENERAL

Retroalimentar los elementos conceptuales, teóricos y prácticos que hacen parte de la


estadística descriptiva para que el Dinamizador estudiante, comience a realizar análisis
estadísticos de algunas situaciones que se vivencian en los territorios.

8.1.3 OBJETIVOS ESPECIFICOS

 Profundizar en las medidas de tendencia no central.


 Explicar las medidas de dispersión para datos individuales y agrupados
 Incentivar al Dinamizador estudiante para que use la estadística descriptiva en sus
análisis.

8.2. CONCEPTUALIZACIÓN

8. 2.1 Medidas de posición no central

Este tipo de medidas de orden o medidas de posición no centradas, son valores numéricos
que nos dan a conocer la posición en el conjunto de datos ordenados. Cuando vimos las
medidas centralizadas teníamos que, si un grupo de datos se organiza de menor a mayor, el
valor que divide el conjunto en dos partes iguales se llama mediana. Para el caso de
medidas no centralizadas, cuando se requiere una descripción del comportamiento de cada
uno de los datos, se pueden dividir la muestra en partes iguales (Fernández el at., s.f.). Por
ejemplo, podemos dividirla en cuatro, diez o en cien partes, las cuales se llaman cuartiles,
deciles y percentiles. En este orden, empezamos por los:

1
 Cuartiles: se divide la muestra en cuatro partes iguales y se define los cuartiles así:
Q1= 25%, Q2=50%; es importante tener en cuenta que el Q2, va ser equivalente a la
mediana de la muestra y Q3=75%

Para calcular este estadístico usamos la siguiente formula:

( n+1) 2(n+ 1) 3( n+1)


Q 1= ,Q2= ,Q3=
4 4 4

Representación gráfica de los cuartiles

Q1 Q2 Q3

                       
                       
100
 Deciles: 0% 25% 50% 75% % Se dividen los
datos en 10 partes iguales, se calcula desde el D1 al D 9. Usamos la siguiente fórmula
para los deciles:

( n+1) 5( n+1) 9(n+1)


D 1= , D5 = , D 9= ,
10 10 10

Representación gráfica de los deciles

D1 D2 D3 D4 D5 D6 D7 D8 D9

                                       
                                       
100
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% %

 Percentiles: se procede a dividir la muestra en cien partes iguales, desde


P1 , P2 , … … P99. Para calcular este estadístico usamos la siguiente formula:

k (n+1) (n+1) 50 (n+1) 99(n+1)


Pk = =P = , P50= , P99= ,
100 1 100 100 100

2
Representación gráfica de los percentiles

P1 P2 P3 P4 P5 P6 P7 P8 P9 P100
….....
                                           
                                           
0% 1% 2% 3% 4% 5% 6% 7% 8% 9% …...... 100%

Para este caso se debe tener en cuenta lo siguiente:

 La mediana es igual al percentil 50 ( P50)


 El primer cuartil es el percentil 25 ( P25 )
 El tercer cuartil es el percentil 75 ( P75)
 El cuarto decil es el percentil 40 ( P40 )
 El sexto decil es el percentil 60 ( P60)

Hasta este punto se ha mirado la parte teórica, pero recuerden que es de suma importancia
llevarlo a la práctica para que los temas vistos se vayan interiorizando, por tanto, a
continuación, se presenta una actividad.

Ejemplo 1: Los Dinamizadores estudiantes del Proceso de Formación Profesional en


Revitalización de la Madre, Cohorte la Aldea, Ciclo I, con el propósito de analizar la
cantidad de abono orgánico que se produce en la finca la Colina, decidieron hacer
seguimiento durante 60 días a la producción; los datos recolectados durante los dos meses
se resumen en la siguiente tabla:

Tabla No 1. Peso en kilogramos de la producción de abono orgánico.

150 160 161 160 160 172 162 160 172 151
161 172 160 169 169 176 160 173 184 172
160 170 153 167 167 175 166 173 169 178
170 179 175 174 160 174 149 162 161 168
170 173 156 159 154 156 160 166 170 169
163 168 171 178 179 164 176 163 182 162
3
Fuente. Elaborado por Maidi Taitana Talaga, Dinamizadora UAIIN-CRIC.

A partir de los datos, ellos se plantean los siguientes pasos para hacer los respectivos
análisis:
1. Organizar los datos de manera ascendente.
2. Calcular los cuantiles, deciles, percentiles y los respectivos análisis para cada
estadístico.
Solución
1. Primero se organizan los datos de manera ascendente ubicando la posición de cada uno
de los datos, tal como se muestra en la siguiente tabla:

Tabla No 2. Peso en kilogramos de la producción de abono orgánico. Datos organizados de


manera ascendente.

1° 2° 3° 4° 5° 6° 7° 8° 9° 10°
149 150 151 153 154 156 156 159 160 160
11° 12° 13° 14° 15° 16° 17° 18° 19° 20°
160 160 160 160 160 160 160 161 161 161
21° 22° 23° 24° 25° 26° 27° 28° 29° 30°
162 162 162 163 163 164 166 166 167 167
31° 32° 33° 34° 35° 36° 37° 38° 39° 40°
168 168 169 169 169 169 170 170 170 170
41° 42° 43° 44° 45° 46° 47° 48° 49° 50°
171 172 172 172 172 173 173 173 174 174
51° 52° 53° 54° 55° 56° 57° 58° 59° 60°
175 175 176 176 178 179 179 179 182 184
Fuente. Elaborado por Maidi Taitana Talaga, Dinamizadora UAIIN-CRIC.

2. Se procede hacer el calculo de cada uno de los estadísticos haciendo uso de la


respectiva formula:
( n+1) (60+ 1) 61
Q 1= = = =15,25
4 4 4

Vemos que la posición del primer cuartil es 15, 25°, pero al ubicar el dato en la tabla
No 2, nos damos cuenta que este valor no está, por tanto, realizamos interpolación

4
lineal entre los valores correspondientes a las posiciones 15° y 16°, de lo cual podemos
observar que el primer cuantil toma el valor de 160. Siendo así, se puede decir que:

Análisis: Q 1 = 160 kilogramos, de lo cual se puede inferir que, el 25% de la


producción de abono orgánico que se hizo en la finca la Colina durante los 60 días, es
igual o inferior a 160 kilogramos, mientras que el 75% restante es mayor o igual 160
kilogramos

Ahora pasamos a calcular los deciles:

(60+ 1)
D 1= =6,1
10

8(60+1)
D 8= = 48,8 °
10

Una vez obtenido este valor posicional, se debe buscar en la tabla No 2, al hacer la revisión
se puede determinar que el decil D8 , no está, entonces se realiza interpolación lineal entre
los valores correspondientes a las posiciones 48° y 49°:

De lo anterior, observamos que el octavo decil toma el valor de 173, 8 kilogramos, dado
que a 173 se le adiciones 0,8 kilogramos.

5
Análisis: el 80 % de la producción de abono orgánico que se hizo en la finca la Colina
durante los 60 días, es igual o inferior 173,80 kilogramos, mientras que el 20% restante es
mayores o iguales a 173, 80 kilogramos.

Ahora se pasa a calcular los percentiles P43 :

43 (60+1) 2623
P43 = = =26,23 ° ,
100 100
Con el resultado anterior, se procede a buscarlo en la tabla No2, y se observa que el valor
26,23 no existe, por cual procedemos a realizar la interpolación lineal entre las posiciones
correspondientes 26° y 27°

Del cálculo anterior, el percentil 43 es el valor 164,46 kilogramos, dado que se repite en
paso realizado en el decil.

Análisis: se puede inferir que, el 43 % de la producción de abono orgánico que se hizo en


la finca la Colina durante los 60 días, es igual o inferior a 164, 46 kilogramos y el 57 %
restante es mayor o igual a 164, 46 kilogramos.

Hasta este punto se ha trabajado con datos individuales, pero qué pasa cuando se necesitan
realizar análisis para datos agrupados. Cuando nos encontramos en esta situación se deben
usar las siguientes fórmulas para calcular los cuantiles, deciles y percentiles:

CUARTILES DECILES PERCENTILES

6
( ) ( )
kn kn
−F i−1 −F i−1

( )
4 kn 100
Qk =Li + Ic −F i−1 Pk =Li + Ic
fi 10 fi
D k = Li + Ic
fi

Li = límite inferior Li = límite inferior Li = límite inferior


f i = frecuencia absoluta de f i = frecuencia absoluta de f i = frecuencia absoluta de
la clase i; es decir, de la la clase i; es decir, de la la clase i; es decir, de la
clase donde se encuentra el clase donde se encuentra el clase donde se encuentra el
cuartil k cuartil k cuartil k
Ic = intervalo de clase. Ic = intervalo de clase. Ic = intervalo de clase.
N= número total de N= número total de N= número total de
observaciones observaciones observaciones
F i−1 = frecuencia absoluta F i−1 = frecuencia absoluta F i−1 = frecuencia absoluta
acumulada de la clase acumulada de la clase acumulada de la clase
previa a la clase i; es decir, previa a la clase i; es decir, previa a la clase i; es decir,
frecuencia acumulada de frecuencia acumulada de frecuencia acumulada de
todas las clases previas a la todas las clases previas a la todas las clases previas a la
clase donde se encuentra el clase donde se encuentra el clase donde se encuentra el
cuartil k (citar) decil k. percentil k.

Además, se deben seguir los siguientes pasos:

a) Construir la tabla de frecuencias para datos agrupados.


b) Calcular el orden o posición del estadístico que se desea conocer, con la fórmula
para datos individuales
c) Una vez obtenido el valor posicional se busca en la columna de frecuencias F i, si no
está, se debe tomar el inmediato superior y llamar a la clase correspondiente clase
del cuartil, clase del decil o clase del percentil, según corresponda.
d) Diremos que el estadístico de orden pertenece a este intervalo, pero es necesaria una
mayor precisión. Por esto buscaremos el valor del estadístico dentro de la clase que
lo contiene.

A continuación, se debe realizar un ejercicio práctico para retroalimentar los conceptos que
hemos visto hasta este punto.

7
Teniendo en cuenta los datos presentados en el ejemplo 1, calcule el tercer cuantil ( Q3), el
segundo decil ( D 2), y el percentil noventa y cinco ( P95) para datos agrupados.

solución:

a) Se procede a calcular la tabla de frecuencias para datos agrupados:

Tabla No 3. Tabla de frecuencias de la producción de abono orgánico durante 60 días en la


Finca la Colina.
TABLA DE FRECUENCIAS- DATOS AGRUPADOS
INTERVALOS DE MARCA DE FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA
CLASE CLASE ABSOLUTA RELATIVA ABSOLUTA RELATIVA
ܿ ACUMULADA ACUMULADA
௜ ݊௜ ݂௜
ܰ௜ ‫ܨ‬௜
1 [ 149 -154) 151,5 4 0,07 4 0,07
2 [ 154 -159) 156,5 3 0,05 7 0,12
3 [ 159 -164) 161,5 18 0,30 25 0,42
4 [ 164 -169) 166,5 7 0,12 32 0,53
5 [169 -174 171,5 16 0,27 48 0,80
6 [ 174 - 179) 176,5 8 0,13 56 0,93
7 [179 -184) 181,5 4 0,07 60 1,00
SUMAS 60 1,00

Fuente: elaborado por Maidi Tatiana Talaga Castro.

Luego, se debe realizar los pasos b, c y d.

b). La posición de clase de tercer cuantil es:

3(60+ 1)
Q 3= =45,75°
4

c) . Una vez obtenido ese valor, se busca en la tabla No 3 en la columna de frecuencias


acumuladas, como el valor obtenido en Q3 = 45,75° no existe, se recurre al intervalo
siguiente, por lo cual la clase del tercer cuartil es [169-174). Hasta este punto
tenemos identificada la clase, ahora calculamos el valor del tercer cuantil dentro del
intervalo haciendo uso de la formula planteada para datos agrupados:

8
( ) ( )
kn 3∗60 n
−F i−1 −32
d). 4 4
Q3=Li + Ic Q3=169+ 5
fi 16

Q3=169+ ( 45−32
16 )
5 Q3=169+ ( 1316 ) 5 = 173, 06 kilogramos
Análisis: el 75 % de los kilogramos de abono orgánico producidos durante los 60 días son
iguales o inferiores a 173, 06 kilogramos y el 25% restante son iguales o superiores a 173,
06 kilogramos.

b). calcular la posición de clase del segundo decil

2 ( 60+1 )
D 2= =12,2°
10

c). Buscamos el valor obtenido en la columna de frecuencias acumuladas de la tabla No3,


como el valor obtenido en D2no está en la tabla, se recurre al intervalo siguiente, por tanto,
la clase del tercer cuartil es [159-164). Hasta este punto tenemos identificada la clase, ahora
calculamos el valor del segundo decil dentro del intervalo haciendo uso de la formula
planteada para datos agrupados:

( ) ( )
kn 2∗60
d). −F i−1 −7
10 10
D 2=Li + Ic D 2=159+ 5
fi 18

D2=159+ ( 12−7
18 )
5 D2=160,39 kilogramos,

Análisis: el 20 % de los kilogramos de abono orgánico producidos durante los 60 días son
iguales o inferiores a 160,39 kilogramos, y el 80% restante son iguales o superiores a
160,39 kilogramos.

b). cálculo de la posición de clase para el percentil noventa y cinco P95

9
95 ( 60+1 )
P95 = =57 , 95 °
100

c). Luego, se busca el valor obtenido en la columna de frecuencias acumuladas de la tabla


No 3, como el valor obtenido en P95 no está en la tabla, se recurre al intervalo siguiente, por
tanto, la clase del percentil noventa y cinco es [179-184). Hasta este punto tenemos
identificada la clase, ahora calculamos el valor del percentil noventa y cinco dentro del
intervalo haciendo uso de la formula planteada para datos agrupados:

( ) ( )
kn 95∗60
−F i−1 −56
d). P =L + 100 100
95 i Ic P95=179+ 5
fi 4

P95=179+ ( 57−56
4 )
5 P95=180,25 kilogramos.

Análisis: el 95 % de los kilogramos de abono orgánico producidos durante los 60 días son
iguales o inferiores a 180,25 kilogramos, y el 5% restante son iguales o superiores a 180,25
kilogramos.

8.2.2 Medidas de dispersión

Estas medidas son utilizadas para describir la dispersión de los elementos de una muestra,
es decir, permiten analizar qué tan cerca o lejos se encuentran los datos entorno a su valor
promedio. Los estadísticos que se usan con mayor frecuencia en este caso son: rango o
recorrido, varianza, desviación estándar y coeficiente de variación muestral. Se debe tener
en cuenta que todos estos estadísticos son valores mayores o iguales a cero, indicando un
valor de cero, la ausencia de dispersión (Gorgas el at., 2011)

a) Rango o recorrido: Es la diferencia entre el máximo y mínimo valor que toma la


variable en la muestra a analizar. Ojo, cuando se trabaja con muestras grandes no es
recomendable usar el rango como medida de variabilidad. Para calcular este valor se
debe usar la siguiente formula

10
Rango=Valor máximo −Valor minimo

b) Recorrido intercuartílico: es la diferencia entre el tercer cuartil y el primer cuartil

Ri=Q 3 −Q1

c) Varianza: La varianza de las observaciones x 1 , x 2 , , x 3 es el cuadrado de las


distancias entre cada observación y la media aritmética del conjunto de observaciones.
Normalmente, la varianza se simboliza mediante la letra “ s2” cuando se calcula para
una muestra y con σ 2” cuando se calcula para la población en estudio. (Gorgas et
al. (2011) p. 33). Para calcular este estadístico se usa la siguiente formula:

2
s=
∑ (x1 −¿ x )2 f i
¿
n−1
d) Desviación estándar: cuando se tiene una muestra aleatoria de x 1 , x 2 , , x 3 con
varianza s2”, la desviación estándar de esta será la raíz cuadrada de la varianza
muestral, es decir,

S= √ S =
2

√ ∑ (x1 −¿ x)2 f i ¿
n−1

Esta medida de dispersión es usada con frecuencia en análisis estadísticos. En general,


indica el promedio con el que se alejan los datos de la media aritmética.

Cuando se usa este estadístico se deben tener en cuenta las siguientes reglas:

El teorema de Chebyshev, plantea que no importa la forma que tenga la distribución, al


menos el 75% caen dentro de ± 2 desviaciones estándar a partir de la media de la
distribución, y al menos 89% de los valores caen dentro de ± 3 desviaciones estándar a
partir de la media.

11
 Podemos medir aún con más precisión el porcentaje de observaciones que caen dentro
de un alcance específico de curvas simétricas con forma de campana. En estos casos,
podemos decir que:
 Aproximadamente 68% de los valores de la población cae dentro de ± 1 desviación
estándar a partir de la media.
 Aproximadamente 95% de los valores de la población cae dentro de ± 2 desviación
estándar a partir de la media.
 Aproximadamente 99% de los valores de la población cae dentro de ± 3 desviación
estándar a partir de la media (Fernández el at., s.f. p. 37)

e) Coeficiente de variación: Es un índice que puede usarse para hacer comparaciones


entre poblaciones en las cuales se analizan diferentes características. Se debe tener
presente que este índice esta definido entre o y 1, cuando el valor obtenido es cercano
a 0, significa que los datos en la muestra a estudiar no están tan dispersos; mientras
que, si el valor es cercano a 1, significa que los datos están demasiados dispersos por
lo cual la media pierde confiabilidad. Para obtener calcular este índice se usa la
siguiente formula

S
CV =
x

1.1.1 Encuentro

 El Dinamizador estudiante debe hacer una lectura detalla de este documento antes del
encuentro presencial, durante el encuentro pedagógico debe estar atento, participando y
haciendo preguntas de los temas abordados y resolviendo los ejercicios planteados en
clase. El Dinamizador orientador, llevará registro de la participación y asistencia, esta
tendrá un porcentaje significativo en la notal final.

 El Dinamizador estudiante debe realizar el siguiente taller y enviarlo al orientador.

Taller No 1.
Durante los últimos treinta meses, un grupo de Dinamizadores estudiantes del Proceso de
Formación Profesional en Revitalización de la Madre Tierra UAIIN- CRIC, midieron la

12
presión mensual de lluvias en centímetros en el páramo de Paletara, y obtuvieron la
siguiente tabla de datos:

Tabla No 4. Precipitación de lluvias mensual durante treinta meses, en el páramo de


Paletara.
29,3 32,4 41,3 34,3 35,2 43,0 36,3 35,7 41,3 37,0
36,8 43,6 45,2 32,8 30,7 36,2 34,7 35,3 31,7 43,2
42,3 35,7 47,5 32,2 28,3 41,5 43,2 30,7 38,4 46,5
Fuente: Datos tomados de Fernandez el at., s. f.

A partir de la tabla No 4, realizar lo siguiente:

1.) Clasificar los datos y construir una tabla distribución de frecuencia.


2.) Calcular el cuartil 1, cuartil 2, y cuartil 3 y realizar el respectivo análisis de cada
uno.
3.) Calcular el decil 2, decil, 4 y decil 5, y realizar el respectivo análisis.
4.) Calcular el percentil 50, percentil 70 y percentil 86, y realizar el respectivo análisis.

1.1.2 Autoformación:

El Dinamizador estudiante debe profundizar en las bases conceptuales de todos los temas
vistos en esta unidad temática, luego debe proponer un ejercicio analítico en el cual calcule
el rango o recorrido, la varianza, la desviación estándar y el coeficiente de variación.

1.1.3 Práctica comunitaria y Crissac.

El Dinamizador estudiante a partir de las siguientes tablas de datos, las cuales recogen la
producción de leche durante treinta días en el Resguardo de Jámbalo y el Resguardo de
Quintana, debe hacer una comparación analítica entre las dos muestras; para ello debe usar
los estadísticos vistos en esta unidad temática. Esta actividad debe ser enviada al orientador
en un documento ordenado y con letra legible.

13
Tabla No 6. Tabla No 5. producción
Tabla No 5. producción de leche en
de leche en litros, Resguardo de
litros, Resguardo de Jámbalo
Quintana
134 143 145 134 147 110 149 147 136 145
148 141 165 133 145 112 145 146 135 135
133 139 150 155 149 117 130 149 130 136
122 128 155 267 148 118 138 148 129 147
112 126 147 168 159 120 139 135 128 145
115 120 145 169 158 121 137 125 127 150
Fuente: Elaboración propia

2 Documentos de apoyo

Fernandez, D., & Guitar, M. (s.f.). Probabilidad y estadística. Estadística descriptiva y


análisis de datos. Universidad Técnologica Nacional.
http://www1.frm.utn.edu.ar/estadistica/documentos/ed&ad.pdf

Gorgas, J., Cardiel, N., & Zambrano, J. (2011). Estadística descriptiva. En Estadística
básica para estudiantes de ciencias (pp. 11-25). Universidad Complutense de
Madrid.
https://webs.ucm.es/info/Astrof/users/jaz/ESTADISTICA/libro_GCZ2009.pdf

Newbold, P., Carlson, W., & Tnorne, B. (2008). Descripción grafica de los datos. En
Estadística para administración y economía (sexta ed., p. 49). Pearson Education.
http://fad.unsa.edu.pe/bancayseguros/wp-content/uploads/sites/4/2019/03/
Estadistica-para-administracion-y-la-economia.-6Ed.-Newbold-2008.pdf

14