Estadística Descriptiva

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

ESTADÍSTICA DESCRIPTIVA

Equipo N :

Integrante 1: Winkler Jota C.I: 2200516744

¡BIENVENIDOS A LA PRÁCTICA N 1! Esta práctica tiene por objetivo brindarte


las herramientas básicas para realizar estadística descriptiva con R, para comenzar
usaremos los datos del Cuadro 1, el cual representa a la estatura en pulgadas de 50
mujeres trabajadoras de la etnia Kichwa medidas en el año 2019 en Tena Ecuador

1. Distribución de Frecuencias

Cuadro 1: DISTRIBUCIÓN DE LAS TRABAJADORAS


Alturas de las trabajadoras
6 6 6 6 6 6 5 5 6 6
5 3 5 3 9 7 3 8 0 1
6 6 6 7 6 6 5 5 6 6
4 5 4 2 8 6 5 7 0 2
6 6 6 7 6 6 5 5 6 6
4 5 4 1 8 6 6 9 1 2
6 6 6 7 6 6 5 5 6 6
3 5 3 0 7 6 7 9 1 2
6 6 6 6 6 6 5 6 6 6
4 4 3 9 7 6 8 0 1 2
1. Construya el siguiente vector que contiene la altura de 50 mujeres indígenas trabajadoras de
una Chakra en la ciudad de Tena
alturas<-c(65,63,65,63,69,67,53,58,60,61,64,65,64,
72,68,66,55,57,60,62,64,65,64,71,68,66,
56,59,61,62,63,65,63,70,67,66,57,59,61,

62,64,64,63,69,67,66,58,60,61,62)

2. Use la library(fdth) para construir una distribución de frecuencias como sigue: a) Use la
siguiente instrucción:

dist1 <- fdt(alturas,breaks="Sturges")


b) Realice los siguientes cambios en la instrucción
dist2<-fdt(alturas,start=53,end=74,h=3,right=FALSE)
Podemos apreciar que R nos proporciona una tabla de frecuencias donde encontraremos el límite
superior e inferior aparente de la distribución, la frecuencia absoluta de cada clase, el porcentaje
absoluto de cada clase, la frecuencia absoluta acumulada de cada clase y el porcentaje acumulado
de las clases.

3. Escriba los dos resultados obtenidos en el siguiente espacio


Dist1

clase
Límites f f(%) F F(%)

1 [52.47-55.363] 2 4 2 4

2 [55.363-58.256] 5 10 7 14

3 [58.256-61.149] 9 18 16 32

4 [61.149- 64.041] 15 30 31 62

5 [64.041- 66.934] 9 18 40 80

6 [66.934- 69.827] 7 14 47 94

7 [69.827-72.72] 3 6 50 100

Dist2

clase Límites f f(%) F F(%)


1 [53-56] 2 4 2 4

2 [56-59] 5 10 7 14

3 [59-62] 9 18 16 32

4 [62-65] 15 30 31 62

5 [65-68] 12 24 43 86

6 [68-71] 5 10 48 96

7 [71-74] 2 4 50 100

a) ¿Cuál de los dos resultados coincide con la tabla realizada en clases?


Los resultados de la tabla “dist2” coinciden con la tabla realizada en clase, debido a que sus límites
son números enteros. La tabla “dist1” posee decimales dentro de sus límites, además los límites
superiores, no coinciden, siendo la tabla “dist2”, la que se asemeja en todos los aspectos con la
tabla realizada en clase.
b) Realice la interpretación de la clase 6
En la clase 6 dentro de la tabla “dist1”, se incluyen decimales dentro de su intervalo, lo que
incrementa la cantidad de datos dentro de ese intervalo, esto se evidencia en la frecuencia absoluta,
ya que, al comparar entre las dos tablas, se nota que en la tabla “dis1” hay 2 datos más que en la
tabla “dist2”, lo mismo ocurre con el porcentaje de la frecuencia absoluta, su cantidad es menor en
la tabla “dist2” en comparación con el dato de la “dist1”.
Por el contrario, con los resultados de la frecuencia acumulada y el porcentaje de esta misma, se
nota una contrariedad. En la tabla “dist2” el resultado aumentó en base a los datos de la tabla
“dist1”, esto se debe a que en la clase 5 se incluyen más elementos, por lo que al momento de
hallar las frecuencias acumuladas se observa un aumento en la clase 6 entre los dos resultados. En
la clase 6 dentro de la tabla “dist2”(5 mujeres trabajadoras tienen alturas entre 68 y 71 in ; 10%
mujeres trabajadoras tienen altura entre 53 y 71 in ; 48 mujeres tienen alturas entre 53 y 71 in ;
96% de las mujeres trabajadoras tienen alturas entre 53 y 71 in).
2. Gráficos para distribución de frecuencias
Para construir los gráficos usaremos el paquete agricolae y las instrucciones hist, polygon.freq, ogive.fre
con los siguientes parámetros:

#--------HISTOGRAMA DE MUJERES
hist(alturas,border=TRUE,xlim=c(53,72),col="blue") #--------POLÍGONO DE MUJERES

p<-hist(alturas,border=FALSE,xlim=c(53,72))
polygon.freq(p,col="red",frequency=1,lwd=2) #-------OJIVA DE LAS MUJERES
h<-graph.freq(alturas,plot=FALSE)

points<-ogive.freq(h,col="red",frame=FALSE,

xlab="Height", ylab="Accumulated relative frequency", main="ogive")


plot(points,type="b",pch=16,las=1,bty="l")
#-----HISTOGRAMA DE FRECUENCIAS ACUMULADAS
#install.packages('fdth') library(fdth)

dist <- fdt(alturas,breaks="Sturges")

plot(dist, type="cfh") #histograma de frecuencias acumulada

2.1. Dibuje los resultados y discuta el polígono de frecuencias.

HISTOGRAMA DE MUJERES

POLIGONO DE MUJERES
El polígono de frecuencias nos muestra una gráfica que une los puntos medios de cada columna,
permitiendo así distinguir cuales son los eventos que se repiten más y cuales son lo que se repiten
menos. En esta gráfica podemos apreciar que la variabilidad de alturas, llega a su punto central en
alturas de mujeres Kichuas que van desde los 61 a 64 in aproximadamente, lo que nos da a conocer
que hay mas probabilidad de encontrar mujeres Kichuas en ese rango de altura. De la misma
manera, nos dice que la cantidad de mujeres Kichuas de una estatura menos a 55 o mayor a 70 in,
son menos frecuentes dentro de esta nacionalidad.
OJIVA DE LAS MUJERES

2.2. HISTOGRAMA DE FRECUENCIAS ACUMULADAS


3. Resumen estadístico de una distribución de frecuencias

Una vez que hemos analizado la tabla de distribución de frecuencias y sus gráficos, pro- cedemos a
realizar estudio de estadísticos resúmenes como la media, la moda, la mediana y la varianza en esta
ocasión usaremos la instrucción stat.freq(). La sintaxis para lograr este propósito es la siguiente:
#------DESCRIPTIVA DE TABLA DE FRECUENCIAS

measures<-stat.freq(p) print(measures)

3.1. Escriba los resultados y discuta la media, la mediana y la moda.

Varianza: 16.98122
Media: 62.72
Mediana: 62.90909
Moda: 62, 64, 63.2
La media es 62.72 pulgadas, lo que indica que es más probable encontrar mujeres Kichuas con esa
altura promedio.
La mediana es un punto medio de entre todos los datos de un conjunto, en este caso es: 62.90909
pulgadas.
La moda es el dato que se repite con mayor frecuencia en el conjunto, para esta práctica, podemos
notar que existen 3 modas: 62, 64 y 63.2 pulgadas, esto indica que dentro de esta muestra las
alturas que más se repiten son las que se mencionaron.

3.2. Debemos notar que el cálculo de las medidas anteriores difieren al realizarlos por datos
directos, por ejemplo si se quiere hacer el cálculo de la media y la mediana junto a los cuartiles
podemos usar la instrucción summary() como sigue:
summary(alturas)

Min. 1st Qu. Median Mean 3rd Qu. Max.

53.0 61.0 63.5 63.2 66.0 72.0

Discuta estas diferencias


La diferencia se denota al trabajar con cierto número de decimales, lo que nos conlleva a
acercarnos más a una probabilidad exacta de que algo sea cierto o no.
3.3. Un gráfico muy utilizado y que posee grandes bondades es el boxplot, R usa una
instrucción con ese nombre que nos da este gráfico que entre otras cosas permite ver la asimetría de
los datos. Nosotros lo activaremos de la siguiente forma.
boxplot(alturas)
1) Dibuje el gráfico e indique cada una de sus partes.

Atípjca

Extremo
superior

Extremo Bigote Cuartil inferior Cuartil superior Escala


Mediana
inferior

2) Interprete el gráfico obtenido.

En el gráfico caja y bigote, se puede visualizar los diferentes componentes como son los cuartiles
en los que se divide el conjunto, de igual manera se puede observar los extremos inferior y superior
de nuestro conjunto, de igual manera, se divide el gráfico con líneas y distintos colores, lo que
permite visualizar de manera más efectiva, los extremos, los cuartiles y la mediana.

3) ¿Existen valores extremos?, de existir un dato anómalo o atípico, identifíquelo y


establezca qué clase de dato extremo es.
Si existen valores extremos, sin embargo, la escala numérica no muestra el extremo superior. Se
puede notar que existe un outlier o dato atípico en nuestra gráfica, este dato es la altura 53
pulgadas, el cual no está siendo incluido en el diagrama, de igual manera, este dato es un extremo
inferior, ya que se ubica en la parte izquierda del diagrama, pero si fuera una gráfica vertical,
estuviera ubicado en la parte baja.

4) Muestra el gráfico algún tipo de asimetría. ¿Cuál?, ¿Por qué?

Es una asimetría negativa o sesgada a la izquierda, ya que esta es más larga con respecto a la
mediana, esto da a entender que la media es menor que la mediana.

También podría gustarte