Fase 4.

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 19

Fase 4.

Aplicar conceptos a un proyecto agropecuario con procesamiento estadístico

Yenifer Robles Cortes

Código: 1105786261

Tutor:

Luis Alberto Caceres.

300046A_761

Universidad Nacional Abierta y A Distancia – UNAD

Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente - ECAPMA

Estadística Descriptiva

Mayo de 2020.
INTRODUCCIÓN
Al recolectar, presentar y caracterizar un conjunto de datos, la estadística descriptiva muestra
apropiadamente las diversas características existentes dentro del caso que se presente para
estudio. Dentro de los diversos temas que se podrá estudiar simultáneamente los valores de los
tipos de variables estadística. En este trabajo se analiza concretamente una base de datos
realizada para determinar cómo se encuentran los caficultores frente al tema del café en la finca
El Madrigal. Para desarrollar el estudio se utiliza la herramienta R para el desarrollo del mismo.

OBJETIVOS
 Con el programa R se realiza las pautas y la trazabilidad para el desarrollo del estudio.
 Identificar las gráficas y diagramas arrojados por el programa R al momento de dar solución
al código suministrado por el tutor del curso con algunos ajustes realizados por el
estudiante.
Código con las modificaciones.

# VARIABLE CUANTITATIVA CONTINUA


>
CONTINUA=c(11.2,14,19,12.5,11.8,12.1,13,12.2,12.1,11.7,10,11,12.5,12,19.8,14.2,11.5,13.4,9,1
8.3,5,18,14.6,10.7,15.2,9,6,13.6,15.8)

> summary(CONTINUA)# Resumen estadístico


Min. 1st Qu. Median Mean 3rd Qu. Max.
5.00 11.20 12.20 12.73 14.20 19.80
> mean(CONTINUA)#media aritmética
[1] 12.73103
> var(CONTINUA)#varianza
[1] 11.68222
> sd(CONTINUA)#desviación estándar
[1] 3.417926
> min(CONTINUA) #Mínimo
[1] 5
> max(CONTINUA)# Máximo
[1] 19.8
> range(CONTINUA) #Rango
[1] 5.0 19.8
> median(CONTINUA)# Mediana
[1] 12.2
> length(CONTINUA)# Número de datos
[1] 29
> quantile(CONTINUA, 0.25)# Cuantil Q1
25%
11.2
> quantile(CONTINUA, 0.5)# Cuantil Q2 que es la mimsa mediana
50%
12.2
> quantile(CONTINUA, 0.75)# Cuantil Q3
75%
14.2
> IQR(CONTINUA) #Rango intercuartílico
[1] 3
> sort(CONTINUA)# Ordenar
[1] 5.0 6.0 9.0 9.0 10.0 10.7 11.0 11.2 11.5 11.7 11.8 12.0 12.1 12.1 12.2
[16] 12.5 12.5 13.0 13.4 13.6 14.0 14.2 14.6 15.2 15.8 18.0 18.3 19.0 19.8
>
> # TABLA DE FRECUENCIAS (HISTOGRAMA)PARA VARIABLE CONTINUA, CON REGLA DE
STURGES
> # La regla de Sturges define el número de rangos para organizar la tabla de frecuencias:
>
> range(CONTINUA,na.rm=TRUE) # incluimos na.rm=TRUE para que ignore la presencia de
valores perdidos
[1] 5.0 19.8
> nclass.Sturges(CONTINUA)# Define el número de intervalos para presentar la frecuencia de la
variable (en este caso, 6 intervalos)
[1] 6
> seq(min(CONTINUA),max(CONTINUA),length=nclass.Sturges(CONTINUA)) # Límites de los
intervalos
[1] 5.00 7.96 10.92 13.88 16.84 19.80
>
intervalosCONTINUA=cut(CONTINUA,breaks=seq(min(CONTINUA),max(CONTINUA),length=nclas
s.Sturges(min(CONTINUA))),include.lowest=TRUE)
> intervalosCONTINUA# Se muestran los intervalos de edad, uno correspondiente a cada edad
observada
[1] (10.9,13.9] (13.9,16.8] (16.8,19.8] (10.9,13.9] (10.9,13.9] (10.9,13.9]
[7] (10.9,13.9] (10.9,13.9] (10.9,13.9] (10.9,13.9] (7.96,10.9] (10.9,13.9]
[13] (10.9,13.9] (10.9,13.9] (16.8,19.8] (13.9,16.8] (10.9,13.9] (10.9,13.9]
[19] (7.96,10.9] (16.8,19.8] [4.99,7.96] (16.8,19.8] (13.9,16.8] (7.96,10.9]
[25] (13.9,16.8] (7.96,10.9] [4.99,7.96] (10.9,13.9] (13.9,16.8]
Levels: [4.99,7.96] (7.96,10.9] (10.9,13.9] (13.9,16.8] (16.8,19.8]
>puntos=min(CONTINUA)
+(0:nclass.Sturges(CONTINUA))*(max(CONTINUA)min(CONTINUA))/nclass.Sturges(CONTINUA)
> # TABLAS DE FRECUENCIAS SIN REGLA DE STURGES:
> # Existen dos comandos que generan la misma tabla de frecuencia o histograma:
> # Gráficos de tabla de frecuencia:
> tbFreqCONTINUA=table.freq(hist(CONTINUA,plot=TRUE))
> hist(CONTINUA,ylab="Frecuencia",main="Histograma CONTINUA")#Histograma
> # Tabla de frecuencia:
> tbFreqCONTINUA
Lower Upper Main Frequency Percentage CF CPF
1 4 6 5 2 6.9 2 6.9
2 6 8 7 0 0.0 2 6.9
3 8 10 9 3 10.3 5 17.2
4 10 12 11 7 24.1 12 41.4
5 12 14 13 9 31.0 21 72.4
6 14 16 15 4 13.8 25 86.2
7 16 18 17 1 3.4 26 89.7
8 18 20 19 3 10.3 29 100.0
>
> # Gráfico de diagrama de cajas o Boxplot (organiza los datos en los cuatro cuartiles):
>
> boxplot(CONTINUA,ylab="unidad de medida",main="Boxplot CONTINUA")#Gráficos de cajas
> # VARIABLE CUANTITATIVA DISCRETA
> DISCRETA=c(2,3,1,2,1,2,1,2,4,3,1,1,2,0,5,2,6,0,0,2,1,0,7,5,3,2,2,4,4)
> summary(DISCRETA) # Resumen estadístico
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.000 1.000 2.000 2.345 3.000 7.000
> min(DISCRETA) # Mínimo
[1] 0
> max(DISCRETA) # Máximo
[1] 7
> range(DISCRETA) # Rango
[1] 0 7
> mean(DISCRETA) # Media aritmética
[1] 2.344828
> median(DISCRETA) # Mediana
[1] 2
> length(DISCRETA) # Número de datos
[1] 29
> sd(DISCRETA) # Desviación standar
[1] 1.818081
> quantile(DISCRETA, 0.25) # Cuantil Q1
25%
1
> quantile(DISCRETA, 0.5) # Cuantil Q2 que es la mimsa mediana
50%
2
> quantile(DISCRETA, 0.75) # Cuantil Q3
75%
3
> IQR(DISCRETA) # Rango intercuartílico
[1] 2
> sort(DISCRETA) # Ordenar
[1] 0 0 0 0 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 4 4 4 5 5 6 7
>
> # Para las variables discretas, las tabla de frecuencias se desarrollan por pasos:
>
> FrAbsDiscreta=table(DISCRETA) # Se le asigna el nombre de "FrAbsDiscreta" para la Tabla de
frecuencias absolutas de la variable discreta
>
> FrAbsAcumDiscreta<-as.table(cumsum(FrAbsDiscreta))# Se le asigna el nombre de
"FrAbsAcumDiscreta" para la Tabla de frecuencias absolutas acumuladas de la variable discreta
> FrAbsAcumDiscreta #Frecuencias absolutas acumuladas
0 1 2 3 4 5 6 7
4 10 19 22 25 27 28 29
> FrRelDiscreta=prop.table(table(DISCRETA))# Se le asigna el nombre de "FrRelDiscreta" para la
Tabla de frecuencias relativas de la variable discreta
> FrRelDiscreta # La frecuencia relativa se da en porcentaje, acá se presenta de 0 a 1 y para
pasarla a porcentaje se multiplica por 100
DISCRETA
0 1 2 3 4 5 6
0.13793103 0.20689655 0.31034483 0.10344828 0.10344828 0.06896552 0.03448276
7
0.03448276
> FrRelAcumDiscreta<-as.table(cumsum(FrRelDiscreta)) #Frecuencias relativas acumuladas
> FrRelAcumDiscreta # Para pasar a porcentaje, se debe multiplicar por 100
0 1 2 3 4 5 6 7
0.1379310 0.3448276 0.6551724 0.7586207 0.8620690 0.9310345 0.9655172 1.0000000
>
> # GRÁFICOS DE TABLA DE FRECUENCIAS (DIAGRAMA DE BARRAS)PARA VARIABLE DISCRETA:
>
> barplot(FrAbsDiscreta,ylab="Frecuencias Absolutas",main="Diagrama de barras Frecuencia
Absoluta DISCRETA")
> barplot(FrRelDiscreta,ylab="Frecuencia Relativa",main="Diagrama de barras Frecuencia
Relativa DISCRETA")
> barplot(FrAbsAcumDiscreta,ylab="Frecuencia Absoluta Acumulada",main="Diagrama de
barras Frecuencia Absoluta Acumulada DISCRETA")
> barplot(FrRelAcumDiscreta,ylab="Frecuencia Relativa Acumulada",main="Diagrama de barras
Frecuencia Relativa Acumulada DISCRETA")
>
> # Gráfico de diagrama de cajas o Boxplot para variables discretas (organiza los datos en los
cuatro cuartiles):
>
> boxplot(DISCRETA)
>
> # GRÁFICO DE TORTA PARA VARIABLE DISCRETA:
>
> pie(FrAbsDiscreta,col=rainbow(6),main=c("Grafico de tarta Frecuencia Absoulta DISCRETA")) #
Gráfico de tarta
> # VARIABLE CUALITATIVA O CATEGÓRICA
> # Son atributos no numéricos, como el nivel de estudios de una persona, el nivel de ingreso, o
el grado de ataque de un patógeno.
> # Para poder analizarlos es necesario codificarlos
> # Por ejemplo, si se hace una encuesta del nivel de estudio que tienen los agricultores de un
municipio, se pueden asignar cuatro niveles:
> # 1= sin estudio, 2= primaria, 3= secundaria y 4= universidad
> # CATEGORICA = Nivel de estudio de agricultores
>
> # En el siguiente renglón, reemplace y digite los 30 datos de su variable CUALITATIVA o
CATEGÓRICA, separándolos con comas:
>
> CATEGORICA=c(1,3,3,3,4,4,3,2,2,2,2,2,4,1,2,1,1,1,3,3,3,3,3,3,4,3,1,2,2,3)
>
> # Es necesario aclararle al programa que cada número es una categoría:
>
> # En el siguiente comando reemplace de acuerdo al número de niveles que tenga su variable
categórica:
>
> CATEGORICA=factor(CATEGORICA, levels=c(1,2,3,4)
+
+ # A continuación, indique el nombre de cada categoría:
+ # reemplace las palabras entre comillas, indicando el nombre de cada nivel de su variable:
+
+ labels=c("Mala","Regular","Buena","Muy Buena"))
Error: unexpected symbol in:
"
labels"
>
> CATEGORICA # Muestra cada dato con el nombre del nivel de la categoría que se asignó
previamente
[1] 1 3 3 3 4 4 3 2 2 2 2 2 4 1 2 1 1 1 3 3 3 3 3 3 4 3 1 2 2 3
>
> summary(CATEGORICA) # Hace un resumen del número de individuos que pertenecen a cada
una de las categorías asignadas
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.000 2.000 3.000 2.467 3.000 4.000
> table(CATEGORICA) #Tabla de frecuencias absolutas
CATEGORICA
1 2 3 4
6 8 12 4
>
> # Al asignar nombres a los comandos, no se deben repetir los que se usaron previamente:
>
> FrAbsCategorica=table(CATEGORICA) # Se le asigna el nombre de "FrAbsCategorica" para la
Tabla de frecuencia absoluta de la variable categórica o cualitativa
> FrAbsCategorica # Presenta la tabla de frecuencia absoluta de la variable categórica
CATEGORICA
1 2 3 4
6 8 12 4
> FrRelCategorica=prop.table(table(CATEGORICA))# Se le asigna el nombre de "FrRelCategorica"
para la Tabla de frecuencia relativa de la variable categorica o cualitativa
> FrRelCategorica # Indica la frecuencia de cada nivel en términos de porcentaje (multiplicar
por 100)
CATEGORICA
1 2 3 4
0.2000000 0.2666667 0.4000000 0.1333333
>
> # GRÁFICOS DE VARIABLES CUALITATIVAS:
> barplot(FrAbsCategorica,ylab="Frecuencias absolutas",main="Diagrama de Barras Frecuencia
Absoluta CATEGORICA") # Diagrama de barras (frecuencia absoluta) para cada nivel de estudios
> barplot(FrRelCategorica,ylab="Frecuencias relativas",main="Diagrama de barras Frecuencia
Relativa CATEGORICA") # Diagrama de barras (frecuencia relativa) para cada nivel de estudios
> barplot(FrAbsCategorica,ylab="Frecuencias absolutas",main="Diagrama de Barras Frecuencia
Absoluta CATEGORICA") # Diagrama de barras (frecuencia absoluta) para cada nivel de estudios

Desarrollo del trabajo

1. Definir un área de trabajo donde se puedan obtener datos de variables continuas, discretas
y cualitativas.

El área de trabajo elegida para el desarrollo de esta actividad es un cultivo de cafe.

2. Indicar la ubicación del sitio fuente de los datos: institución, municipio, vereda y/o finca si
aplica. El informe debe presentar los detalles de la locación elegida para la captura de datos y
evidencia fotográfica.

Este cultivo de café está ubicado en la finca El Madrigal, esta se encuentra en el corregimiento
de Honda Tolima en la Vereda el Mesuno.
3. Determinar una variable continua, una discreta y una cualitativa. Se debe realizar una
descripción clara de cada una de las variables elegidas.
Continúa:
En el terreno de la finca madrigal se tiene sembrado café, el cual cuenta con 30 surcos de 50
árboles se quiere saber cuántos kilos de este se obtienen en la cosecha por surco. Se debe tener
en cuenta que esta es la primera cosecha que se tiene en este lote.

Discreta:
De este mismo lote, se quiere saber cuántos árboles se perdieron por la plaga, también por
surco.

Cuantitativa:
Se realizó una encuesta a 30 caficultores del corregimiento de Honda, para saber que piensan
del tipo de cosecha que tuvieron del año 2020.

Cosecha de Café
Muy Buena Buena Regular Mala Muy Mala

4. Gestionar como mínimo 30 datos de cada una de las variables (si se puede más, mejor). Se
debe presentar evidencia fotográfica en el informe, que permita entender el contexto del
fenómeno en estudio.

VARIABLE CONTINÚA

No. de Surco No. de Kilos


1 11.2
2 14
3 19
4 12.5
5 11.8
6 12.1
7 13
8 12.2
9 12.1
10 11.7
11 10
12 11
13 12.5
14 12
15 19,8
16 14.2
17 11.5
18 13.4
19 9
20 18.3
21 5
22 13,8
23 5
24 18
25 14,6
26 10,7
27 15,2
28 9,6
29 13,6
30 15,8

Histogram of CONTINUA
Histogram of CONTINUA
8
10

Frequency
8

6
Frequency

4
4

2
2

0
0

5 10 15 20
5 10 15 20

CONTINUA CONTINUA

Estas dos graficas nos muestran los kilos de café obtenidos en la finca el
Madrigal en su primera cosecha:
 2 Surcos están entre los 5 y 10 Kilos
 10 Surcos están entre 10 y 14 Kilos
 8 Surcos están entre los 14 y 15 Kilos
 2 Surcos están entre los 15 y 16 Kilos
 4 Surcos obtuvieron de 16 a 20 Kilos

Boxplot CONTINUA
20
u n id a d d e m e d id a

15
10
5

Según este Boxplot, teniendo los datos anteriores de los kilos de café de los 30 surcos se
concluye lo siguiente se coloca los datos en el orden que indica el diagrama de caja:
Min: 5
Q1: 11.2
Mediana: 12.2
Media: 12.73
Q3: 14.2
Max: 19.80

Valor Variable
continua 
mean(CONTINUA)#media 12.73103
aritmética(mean)
var(CONTINUA)#varianza 11.68222
sd(CONTINUA)#desviación estándar 3.417926
min(CONTINUA) #Mínimo 5
max(CONTINUA)# Máximo 19.8
range(CONTINUA) #Rango 5.0 19.8
median(CONTINUA)# Mediana 12.2
length(CONTINUA)# Número de datos 29
quantile(CONTINUA, 0.25)# Cuantil Q1 11.2
quantile(CONTINUA, 0.5)# Cuantil Q2 12.2
que es la mimsa mediana
quantile(CONTINUA, 0.75)# Cuantil Q3 14.2
IQR(CONTINUA) #Rango intercuartílico 3
VARIABLE DISCRETA

No. De No de Árboles
Surco Perdidos por Plaga
1 2
2 3
3 1
4 2
5 1
6 2
7 1
8 2
9 1
10 2
11 4
12 3
13 1
14 1
15 2
16 0
17 5
18 2
19 0
20 0
21 2
22 1
23 0
24 7
25 5
26 3
27 2
28 2
29 4
30 4
Se evidencia en los diagramas de barras lo siguiente:
 En 4 surcos no se perdió ningún árbol por la plaga.
 6 surcos perdió un 1 árbol por la plaga.
 8 surcos perdieron de 2 árboles por la plaga.
 3 surcos perdieron de 3 árboles por la plaga.
 3 surcos perdieron de 4 árboles por la plaga
 2 surcos perdieron de 5 árboles por la plaga
 1 surco perdió 6 árboles por la plaga.
 1 surco perdió 7 árboles por la plaga.

Se Evidencia en los diagramas de barras lo siguiente:


 En 6 surcos no se perdió ningún árbol por la plaga.
 10 surcos se perdió un 1 árbol por la plaga.
 20 surcos se perdieron de 2 árboles por la plaga.
 22 surcos perdieron de 3 árboles por la plaga.
 23 surcos perdieron de 4 árboles por la plaga
 24 surcos perdieron de 5 árboles por la plaga
 25 surco se perdió 6 árboles por la plaga.
 26 surco perdió 7 árboles por la plaga.

Min: 0
Q1: 1.
Mediana: 2.
Media: 2.345
Q3: 3
Max:7.

En este gráfico de tarta se representa las proporciones sobre los datos del número de árboles
perdidos por plaga mostrando que:
 En surco 2 se perdieron 10 árboles.
Valor Variable Discreta
 En el surco 3 se perdieron 3 árboles.
mean(DISCRETA)#media 2.345
 En el surco 1 se
aritmética(mean)perdieron 7 árboles.
 En el surco 4 se perdieron 3 árboles.
var(DISCRETA)#varianza N/A
 En el surco 0 se perdieron 4 árboles.
sd(DISCRETA)#desviación estándar 1.818081
 Enmin(DISCRETA)
el surco 5 se perdieron
#Mínimo2 árboles. 0
 Enmax(DISCRETA)# Máximo1 árboles
el surco 7 se perdieron 7
range(DISCRETA) #Rango 07
median(DISCRETA)# Mediana 2
length(DISCRETA)# Número de datos 29
quantile(DISCRETA, 0.25)# Cuantil Q1 1
quantile(DISCRETA, 0.5)# Cuantil Q2 que 2
es la mimsa mediana
quantile(DISCRETA, 0.75)# Cuantil Q3 3
IQR(DISCRETA) #Rango intercuartílico 2
VARIABLE CUALITATIVA

Caficultor Mala (1) Regular (2) Buena (3) Muy buena (4)
Catherine Rojas 1
Edwin Moreno 3
Javier Bastidas 3
Hermes Moreno 3
Carlos Emeral 4
Oscar moreno 4
Idalia Bustos 3
Julio Castillo 2
Miguel Gómez 2
Macario Cabrera 2
Gladis Cárdenas 2
Ángel Córdoba 2
Rene Castillo 4
Pedro Gaviria 1
José Moreno 2
Flor Zea 1
Enoe Flórez 1
Gabriel Moreno 1
Jaime Zamudio 3
Arturo Castillo 3
Israel Barragán 3
Maria Godoy 3
Albeiro Castillo 3
Maria Cortes 3
Noé bustos 4
Moisés Bastidas 3
Carmen Delgado 1
Gregorio Hernandez 2
Flor Diaz 2
Edmundo Narváez 3

En este diagrama podemos ver los resultados obtenidos en la encuesta realizada a los
caficultores, concluyendo que:
 6 contestaron que estuvo mala la cosecha.
 8 contestaron que regular
 12 respondieron que les pareció buena.
 4 respondieron que estuvo muy buena.
Esta grafica muestra los datos en porcentaje de la encuesta a caficultores sobre el tipo de su
cosecha, teniendo que:
 El 10% contestó que muy buena
 El 20% contestó que Malo.
 El 30% contesto que estuvo Buena.
 El 15% contestó que le pareció buena.

Registro Fotografico
CONCLUSIONES

 Se tuvo más claridad sobre la función del programa R y también sobre cómo utilizarlo.
 Con el programa R se logra identificar y analizar los resultados requeridos para cualquier
problemática o estudio.
 Identificando las diferentes variables se puede identificar diferentes procesos
 Todas las herramientas que se utilizan en la estadística es fundamental para solucionar
problemas o dificultades que se presentan.
BIBLIOGRAFÍA

Mecabot. (2017). El software R, una herramienta para implementar métodos numéricos.


Recuperado de http://mecabot-ula.org/tutoriales/r-project-metodos-numericos/

Adicionalmente, consultar las indicaciones de manejo del programa en el siguiente texto:

Saenz J. (2010). Métodos estadísticos con R y R Commander. Recuperado de https://cran.r-


project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf

El programa R se puede descargar en el siguiente enlace (para sistema operativo Windows):


https://drive.google.com/drive/folders/1qU-s5UD-Rlf2fAbC1cVQfIcCSAhPGfXN?usp=sharing

También podría gustarte