Fase 4.
Fase 4.
Fase 4.
Código: 1105786261
Tutor:
300046A_761
Estadística Descriptiva
Mayo de 2020.
INTRODUCCIÓN
Al recolectar, presentar y caracterizar un conjunto de datos, la estadística descriptiva muestra
apropiadamente las diversas características existentes dentro del caso que se presente para
estudio. Dentro de los diversos temas que se podrá estudiar simultáneamente los valores de los
tipos de variables estadística. En este trabajo se analiza concretamente una base de datos
realizada para determinar cómo se encuentran los caficultores frente al tema del café en la finca
El Madrigal. Para desarrollar el estudio se utiliza la herramienta R para el desarrollo del mismo.
OBJETIVOS
Con el programa R se realiza las pautas y la trazabilidad para el desarrollo del estudio.
Identificar las gráficas y diagramas arrojados por el programa R al momento de dar solución
al código suministrado por el tutor del curso con algunos ajustes realizados por el
estudiante.
Código con las modificaciones.
1. Definir un área de trabajo donde se puedan obtener datos de variables continuas, discretas
y cualitativas.
2. Indicar la ubicación del sitio fuente de los datos: institución, municipio, vereda y/o finca si
aplica. El informe debe presentar los detalles de la locación elegida para la captura de datos y
evidencia fotográfica.
Este cultivo de café está ubicado en la finca El Madrigal, esta se encuentra en el corregimiento
de Honda Tolima en la Vereda el Mesuno.
3. Determinar una variable continua, una discreta y una cualitativa. Se debe realizar una
descripción clara de cada una de las variables elegidas.
Continúa:
En el terreno de la finca madrigal se tiene sembrado café, el cual cuenta con 30 surcos de 50
árboles se quiere saber cuántos kilos de este se obtienen en la cosecha por surco. Se debe tener
en cuenta que esta es la primera cosecha que se tiene en este lote.
Discreta:
De este mismo lote, se quiere saber cuántos árboles se perdieron por la plaga, también por
surco.
Cuantitativa:
Se realizó una encuesta a 30 caficultores del corregimiento de Honda, para saber que piensan
del tipo de cosecha que tuvieron del año 2020.
Cosecha de Café
Muy Buena Buena Regular Mala Muy Mala
4. Gestionar como mínimo 30 datos de cada una de las variables (si se puede más, mejor). Se
debe presentar evidencia fotográfica en el informe, que permita entender el contexto del
fenómeno en estudio.
VARIABLE CONTINÚA
Histogram of CONTINUA
Histogram of CONTINUA
8
10
Frequency
8
6
Frequency
4
4
2
2
0
0
5 10 15 20
5 10 15 20
CONTINUA CONTINUA
Estas dos graficas nos muestran los kilos de café obtenidos en la finca el
Madrigal en su primera cosecha:
2 Surcos están entre los 5 y 10 Kilos
10 Surcos están entre 10 y 14 Kilos
8 Surcos están entre los 14 y 15 Kilos
2 Surcos están entre los 15 y 16 Kilos
4 Surcos obtuvieron de 16 a 20 Kilos
Boxplot CONTINUA
20
u n id a d d e m e d id a
15
10
5
Según este Boxplot, teniendo los datos anteriores de los kilos de café de los 30 surcos se
concluye lo siguiente se coloca los datos en el orden que indica el diagrama de caja:
Min: 5
Q1: 11.2
Mediana: 12.2
Media: 12.73
Q3: 14.2
Max: 19.80
Valor Variable
continua
mean(CONTINUA)#media 12.73103
aritmética(mean)
var(CONTINUA)#varianza 11.68222
sd(CONTINUA)#desviación estándar 3.417926
min(CONTINUA) #Mínimo 5
max(CONTINUA)# Máximo 19.8
range(CONTINUA) #Rango 5.0 19.8
median(CONTINUA)# Mediana 12.2
length(CONTINUA)# Número de datos 29
quantile(CONTINUA, 0.25)# Cuantil Q1 11.2
quantile(CONTINUA, 0.5)# Cuantil Q2 12.2
que es la mimsa mediana
quantile(CONTINUA, 0.75)# Cuantil Q3 14.2
IQR(CONTINUA) #Rango intercuartílico 3
VARIABLE DISCRETA
No. De No de Árboles
Surco Perdidos por Plaga
1 2
2 3
3 1
4 2
5 1
6 2
7 1
8 2
9 1
10 2
11 4
12 3
13 1
14 1
15 2
16 0
17 5
18 2
19 0
20 0
21 2
22 1
23 0
24 7
25 5
26 3
27 2
28 2
29 4
30 4
Se evidencia en los diagramas de barras lo siguiente:
En 4 surcos no se perdió ningún árbol por la plaga.
6 surcos perdió un 1 árbol por la plaga.
8 surcos perdieron de 2 árboles por la plaga.
3 surcos perdieron de 3 árboles por la plaga.
3 surcos perdieron de 4 árboles por la plaga
2 surcos perdieron de 5 árboles por la plaga
1 surco perdió 6 árboles por la plaga.
1 surco perdió 7 árboles por la plaga.
Min: 0
Q1: 1.
Mediana: 2.
Media: 2.345
Q3: 3
Max:7.
En este gráfico de tarta se representa las proporciones sobre los datos del número de árboles
perdidos por plaga mostrando que:
En surco 2 se perdieron 10 árboles.
Valor Variable Discreta
En el surco 3 se perdieron 3 árboles.
mean(DISCRETA)#media 2.345
En el surco 1 se
aritmética(mean)perdieron 7 árboles.
En el surco 4 se perdieron 3 árboles.
var(DISCRETA)#varianza N/A
En el surco 0 se perdieron 4 árboles.
sd(DISCRETA)#desviación estándar 1.818081
Enmin(DISCRETA)
el surco 5 se perdieron
#Mínimo2 árboles. 0
Enmax(DISCRETA)# Máximo1 árboles
el surco 7 se perdieron 7
range(DISCRETA) #Rango 07
median(DISCRETA)# Mediana 2
length(DISCRETA)# Número de datos 29
quantile(DISCRETA, 0.25)# Cuantil Q1 1
quantile(DISCRETA, 0.5)# Cuantil Q2 que 2
es la mimsa mediana
quantile(DISCRETA, 0.75)# Cuantil Q3 3
IQR(DISCRETA) #Rango intercuartílico 2
VARIABLE CUALITATIVA
Caficultor Mala (1) Regular (2) Buena (3) Muy buena (4)
Catherine Rojas 1
Edwin Moreno 3
Javier Bastidas 3
Hermes Moreno 3
Carlos Emeral 4
Oscar moreno 4
Idalia Bustos 3
Julio Castillo 2
Miguel Gómez 2
Macario Cabrera 2
Gladis Cárdenas 2
Ángel Córdoba 2
Rene Castillo 4
Pedro Gaviria 1
José Moreno 2
Flor Zea 1
Enoe Flórez 1
Gabriel Moreno 1
Jaime Zamudio 3
Arturo Castillo 3
Israel Barragán 3
Maria Godoy 3
Albeiro Castillo 3
Maria Cortes 3
Noé bustos 4
Moisés Bastidas 3
Carmen Delgado 1
Gregorio Hernandez 2
Flor Diaz 2
Edmundo Narváez 3
En este diagrama podemos ver los resultados obtenidos en la encuesta realizada a los
caficultores, concluyendo que:
6 contestaron que estuvo mala la cosecha.
8 contestaron que regular
12 respondieron que les pareció buena.
4 respondieron que estuvo muy buena.
Esta grafica muestra los datos en porcentaje de la encuesta a caficultores sobre el tipo de su
cosecha, teniendo que:
El 10% contestó que muy buena
El 20% contestó que Malo.
El 30% contesto que estuvo Buena.
El 15% contestó que le pareció buena.
Registro Fotografico
CONCLUSIONES
Se tuvo más claridad sobre la función del programa R y también sobre cómo utilizarlo.
Con el programa R se logra identificar y analizar los resultados requeridos para cualquier
problemática o estudio.
Identificando las diferentes variables se puede identificar diferentes procesos
Todas las herramientas que se utilizan en la estadística es fundamental para solucionar
problemas o dificultades que se presentan.
BIBLIOGRAFÍA