Fase 5 Ejercicio Final.
Fase 5 Ejercicio Final.
Fase 5 Ejercicio Final.
Estudiante
Mariela
Tutor
Luis Alberto Cáceres Torres
INTRODUCCIÓN
En el presente trabajo vamos a implementar los conocimientos adquiridos en la
unidad 1 de estadísticas aplicadas a las ciencias agrarias donde aprendimos la
interpretación de datos, probabilidad y métodos estadísticos, en la unidad 2
profundizamos en probabilidades y distribución aplicadas a las ciencias agrarias,
pecuarias y ambientales aplicando el manejo del programa R con el propósito de
que el aprendizaje sea más dinámico y práctico.
CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
5 4 10 1 3 4 3 3 2 6 6 7 2 6 4 3 4 3 3 2 3 2 5 3 3 3
CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
5 9 19 20 23 27 30 33 35 41 47 54 56 62 66 69 73 76 79 81 25 26 27 28 29
30
84 86 91 94 97 100
CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0.05 0.04 0.10 0.01 0.03 0.04 0.03 0.03 0.02 0.06 0.06 0.07 0.02 0.06 0.04 0.03
21 22 23 24 25 26 27 28 29 30
0.04 0.03 0.03 0.02 0.03 0.02 0.05 0.03 0.03 0.03
14
12
10
Frecuencias absolutas
8
6
4
2
0
0 1 2 3 4 5 6 7 8 9 10
Descripción
PERIODO 764 - FRECUENCIAS RELATIVAS - DISCRETA
0.14
0.12
0.10
Frecuencias relativas
0.08
0.06
0.04
0.02
0.00
0 1 2 3 4 5 6 7 8 9 10
Descripción
PERIODO 764 - FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA
1.0
0.8
Frecuencias relativas
0.6
0.4
0.2
0.0
0 1 2 3 4 5 6 7 8 9 10
Descripción
Haga una descripción de cada uno de los gráficos presentados y analice los
resultados presentados en cada uno de ellos.
De acuerdo a lo observado en la gráfica de Frecuencias Relativas ¿el
comportamiento de la variable se asemeja a una distribución normal? Explique su
respuesta.
VARIABLE CUANTITATIVA CONTINUA
Indicar el nombre de la variable continúa elegida y presentar: pH1
Valor
Nombre de la variable Elegida pH1
Valor mínimo 4
Valor máximo 6,8
Media 5,1
Mediana 5,144
Varianza
Desviación estándar
• Presente los siguientes gráficos, haciendo una descripción de cada uno de ellos
y analice los resultados obtenidos:
• "HISTOGRAMA DE FRECUENCIAS ABSOLUTAS"
15
10
5
0
Descripción
• "POLIGONO DE FRECUENCIAS ABSOLUTAS"
15
10
5
0
Class limits
Descripción
• "HISTOGRAMA DE FRECUENCIAS RELATIVAS"
0.10
0.05
0.00
Descripción
• "POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN
PORCENTAJE"
60
40
20
0
Variable continua
Descripción
PERIODO 764 - POLÍGONO FRECUENCIAS RELATIVAS ACUMULADAS (%)
100
80
Frecuencia (%)
60
40
20
0
Variable continua
Descripción
PREGUNTAS ORIENTADORAS PARA EL ANÁLISIS DE RESULTADOS
VARIABLES AGRÍCOLAS
Variable continua: pH
1. Si el pH óptimo del suelo para sembrar papa oscila entre 5.5 y 7.0, de acuerdo a
los resultados obtenidos ¿cómo calificaría el suelo analizado?
BIBLIOGRAFIA
Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat
en problemas de agronomía. Recuperado
de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
docID=3221775&query=bioestadistica
Deaza D. (2018). OVI Distribuciones de probabilidad en el programa R.
Recuperado de http://hdl.handle.net/10596/23235
Díaz Mata, Alfredo (2013). Estadística aplicada a la administración y economía.
México: MC Graw Gill. https://es.wikipedia.org/wiki/Distribuci
%C3%B3n_de_probabilidad
Procesamiento en R
> getwd()
[1] "D:/D/Documents/My Shared Folder 1/UNAD 2020
I/Arnulfo/Estadistica/FINAL/Estadistica descriptiva"
>
> # EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046A_764 -
ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)
>
> # Cuando el volumen de información es alto, se pueden importar de una hoja de
cálculo en formato "*.csv"
> # Los datos con los que vamos a trabajar se encuentran en el archivo
"PROBABILIDAD.CSV"
> # Deben descargarlo y ubicar tanto la hoja de cálculo como este código en una
misma carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
> # No abra ni modifique el archivo, sólo guárdelo en la carpeta "Estadistica
descriptiva"
>
> # Vaya al menú de R - "Archivo"
> # Dé click en "Cambiar dir" y ubique la carpeta "Estadistica descriptiva", donde
deben estar los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
>
># VARIABLE CUANTITATIVA DISCRETA
>
> # Recuerde que debe ubicarse en cada línea del código y digitar al mismo
tiempo: "Control+R" para ejecutar cada comando
> # No se salte ninguna línea porque puede aparecerle errores en la ejecución de
los comandos
>
> getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde
guardaron los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
[1] "D:/D/Documents/My Shared Folder 1/UNAD 2020
I/Arnulfo/Estadistica/FINAL/Estadistica descriptiva"
> # Si no les aparece la carpeta, el programa R no va a encontrar la base de datos
y R mostrará un mensaje de error al intentar abrirla
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA)
> attach(PROBA) # Muestra los nombres de las variables sobre los cuales
R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):
>
> # Si el programa logró leer la hoja de cálculo PROBABILIDAD.csv, con el
siguiente comando le debe aparecer:
> # Ciérrela y continúe ejecutando el código
>
> View(PROBA)
>
> # El grupo debe escoger entre los tres tipos de variables discretas existentes:
> # Para los estudiantes de zootecnia, la variable "LECHONES", que es el número
de lechones por cerda.
> # Para los estudiantes de agronomía, la variable "ACAROS", que es el número
de ácaros por hoja.
> # Para los estudiantes de ambiental, la variable "HOGARES", que corresponde
al número de hogares que reciclan en 100 barrios
> # Si el número del grupo es par, seleccionar la variable terminada en número
par.
> # Si el número del grupo es impar, seleccionar la variable terminada en número
impar.
> # Si en el grupo hay estudiantes de distintas profesiones, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
> CONTEO=ACAROS1 # En esta linea reemplaze la palabra "LECHONES1" por
la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "HOGARES2" entonces la línea previa deberá quedar
así: CONTEO=HOGARES2
> # No debe reemplazar nada más, porque de lo contrario puede aparecerle algún
error
> min(ACAROS1)
[1] NA
> max(ACAROS1)
[1] NA
> table(ACAROS1) # Tabla de frecuencias absolutas
ACAROS1
0 1 2 3 4 5 6 7 8 9 10
13 13 12 14 5 13 8 7 5 7 3
> fabs=table(ACAROS1) # Tabla de frecuencias absolutas
> fabs
ACAROS1
0 1 2 3 4 5 6 7 8 9 10
13 13 12 14 5 13 8 7 5 7 3
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
0 1 2 3 4 5 6 7 8 9 10
13 26 38 52 57 70 78 85 90 97 100
> frel=prop.table(table(ACAROS1)) # Tabla de frecuencias relativas
> frel
ACAROS1
0 1 2 3 4 5 6 7 8 9 10
0.13 0.13 0.12 0.14 0.05 0.13 0.08 0.07 0.05 0.07 0.03
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
0 1 2 3 4 5 6 7 8 9 10
0.13 0.26 0.38 0.52 0.57 0.70 0.78 0.85 0.90 0.97 1.00
>
> # GRAFICOS PARA VARIABLES DISCRETAS
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 764 -
FRECUENCIAS ABSOLUTAS - DISCRETA") # Frecuencias absolutas
>
> barplot(frel,ylab="Frecuencias relativas",main="PERIODO 764 - FRECUENCIAS
RELATIVAS - DISCRETA") # Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 764 -
FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA") #Frecuencias
relativas acumuladas
>
>
># VARIABLE CUANTITATIVA CONTINUA
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra el nombre de las variables sobre los que el
programa R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):
>
> # Instalación del paquete "fdth"
> # Cuando aparezca el listado, elegir: "USA(IA)" y después: "fdth". hacer clic en
"OK"
> # Esperar hasta que instale el paquete de comandos, puede tardar varios
minutos
> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de abajo
de la Consola R
>
> utils:::menuInstallPkgs() # seleccionar el primero de la lista: "0-Cloud [https]" y
después el paquete: "fdth"
--- Please select a CRAN mirror for use in this session ---
probando la URL
'https://mirror.las.iastate.edu/CRAN/bin/windows/contrib/4.0/fdth_1.2-5.zip'
Content type 'application/zip' length 292825 bytes (285 KB)
downloaded 285 KB
sd, var
Warning message:
package ‘fdth’ was built under R version 4.0.3
>
> # El grupo debe escoger entre los tres tipos de variables continuas existentes:
> # Para los estudiantes de zootecnia, la variable "PESOCON", que es el peso de
conejos.
> # Para los estudiantes de agronomía, la variable "pH", que es el potencial de
hidrógeno del suelo.
> # Para los estudiantes de ambiental, la variable "PM", que corresponde al
material particulado de 2.5
> # Si el número del grupo es par, seleccionar una la variable terminada en
número par.
> # Si el número del grupo es impar, seleccionar la variable terminada en número
par.
> # Si en el grupo hay estudiantes de distintas profesiones, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
>
> VARIABLECONTINUA=pH1 # En esta linea reemplaze la palabra "PESOCON0"
por la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "PM8" entonces la línea previa deberá quedar así:
VARIABLECONTINUA=PM8
>
> summary(pH1)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
4.000 4.600 5.100 5.144 5.600 6.800 1
> minimos=min(pH1)
> minimos
[1] NA
> maximos=max(pH1)
> maximos
[1] NA
> mean(pH1)
[1] NA
> median(pH1)
[1] NA
> VARIANZA=var(pH1)
> VARIANZA
[1] NA
> sd(pH1)
[1] NA
> SIGMA=sqrt(VARIANZA)
> SIGMA
[1] NA
> length(pH1)
[1] 101
># TABLA DE FRECUENCIAS
>
> dist <- fdt(pH1)
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta (f),
frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia
acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))
Class limits f rf rf(%) cf cf(%)
[3.96,4.324) 14 0.14 14 14 14
[4.324,4.687) 12 0.12 12 26 26
[4.687,5.05) 22 0.22 22 48 48
[5.05,5.414) 21 0.21 21 69 69
[5.414,5.777) 12 0.12 12 81 81
[5.777,6.141) 12 0.12 12 93 93
[6.141,6.504) 4 0.04 4 97 97
[6.504,6.868) 3 0.03 3 100 100
>
># GRÁFICOS DE VARIABLES CONTINUAS
>
> plot(dist, type="fh",col="blue",xlab="Intervalo de la variable
continua",main="PERIODO 764 - HISTOGRAMA FRECUENCIAS ABSOLUTAS")
# HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="fp",col="blue",main="PERIODO 764 - POLIGONO
FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA") #POLIGONO DE
FRECUENCIAS ABSOLUTAS
> plot(dist, type="rfh",col="blue",xlab="Intervalo variable
conitnua",main="PERIODO 764 - HISTOGRAMA FRECUENCIAS
RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
>
> # Cuando ejecute el siguiente comando y le aparezca la gráfica de "POLIGONO
DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE", por favor
NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá el siguiente error:
> # Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) :
> # plot.new has not been called yet
> plot(dist, type="cfp",ylim=c(0,100), col="red",ylab="Frecuencia
(%)",xlab="Variable continua",main="PERIODO 764 - POLÍGONO FRECUENCIAS
RELATIVAS ACUMULADAS (%)") #POLIGONO DE FRECUENCIAS RELATIVAS
ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50%
> abline(h=75, col="blue") # frecuencia = 75%
> abline(h=100, col="green") # frecuencia = 100%
> abline(v=median(pH1), col="red") # mediana
> abline(v=quantile(pH1, 0.25), col="black")# Cuantil Q1
Error in quantile.default(pH1, 0.25) :
missing values and NaN's not allowed if 'na.rm' is FALSE
> abline(v=quantile(pH1, 0.5),col="red")# Cuantil Q2 (es la misma mediana)
Error in quantile.default(pH1, 0.5) :
missing values and NaN's not allowed if 'na.rm' is FALSE
> abline(v=quantile(pH1, 0.75),col="blue")# Cuantil Q3
Error in quantile.default(pH1, 0.75) :
missing values and NaN's not allowed if 'na.rm' is FALSE
> abline(v=max(pH1), col="brown") # valor máximo
>
> # Donde se unen las líneas rojas es la mediana, lo cual indica que hay una
probabilidad del 50% de que los datos sean iguales o inferiores a esta.
>
> #Distribución emprica
> ECDF=ecdf(pH1)
> ECDF
Empirical CDF
Call: ecdf(pH1)
x[1:26] = 4, 4.1, 4.2, ..., 6.7, 6.8
> minimos
[1] NA
> maximos
[1] NA
> # Al igual que con la gráfica anterior, cuando ejecute el próximo comando y le
aparezca la gráfica "Distribución empírica", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá un error.
> # Gráfico de Distribución empírica:
> plot(ECDF,col="red",lwd=3,xlab="pH1",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 764 -
DISTRIBUCIÓN EMPÍRICA")
Error in plot.window(...) : se necesitan valores finitos de 'xlim'
> plot(ECDF,col="red",lwd=3,xlab="VARIABLE CONTINUA",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 764 -
DISTRIBUCIÓN EMPÍRICA")
Error in plot.window(...) : se necesitan valores finitos de 'xlim'
> # CÁLCULO DE PROBABILIDADES
>
> # En el siguiente comando, indique el valor de la media de la variable elegida:
> media= 5.062
> # Ahora indique el valor de la varianza de la variable elegida:
> varianza= 0.29955
> sigma=sqrt(varianza)
> sigma=sqrt(0.29955)
> valor=6
> # Dentro del rango de valores de la variable elegida, indique aquel del que
quiere conocer su probabilidad.
> # Reemplace el valor de 2700 por uno que se encuentre dentro del rango de
datos en el que se encuentra la variable que eligió:
>
> valor=6
> pnorm(valor,media,sigma)
[1] 0.9567202
> 1-pnorm(valor,media,sigma)
[1] 0.04327982
>
> # Responda a todas las preguntas solicitadas en la guía de la Fase 5
>
R version 4.0.2 (2020-06-22) -- "Taking Off Again"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)
>
> # EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046A_764 -
ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)
>
> # Cuando el volumen de información es alto, se pueden importar de una hoja de
cálculo en formato "*.csv"
> # Los datos con los que vamos a trabajar se encuentran en el archivo
"PROBABILIDAD.CSV"
> # Deben descargarlo y ubicar tanto la hoja de cálculo como este código en una
misma carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
> # No abra ni modifique el archivo, sólo guárdelo en la carpeta "Estadistica
descriptiva"
>
> # Vaya al menú de R - "Archivo"
> # Dé click en "Cambiar dir" y ubique la carpeta "Estadistica descriptiva", donde
deben estar los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
>
># VARIABLE CUANTITATIVA DISCRETA
>
> # Recuerde que debe ubicarse en cada línea del código y digitar al mismo
tiempo: "Control+R" para ejecutar cada comando
> # No se salte ninguna línea porque puede aparecerle errores en la ejecución de
los comandos
>
> getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde
guardaron los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
[1] "C:/Users/EQUIPO/Documents/estadistica descriptiva"
> # Si no les aparece la carpeta, el programa R no va a encontrar la base de datos
y R mostrará un mensaje de error al intentar abrirla
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra los nombres de las variables sobre los cuales
R va a hacer los cálculos
>
> # Si el programa logró leer la hoja de cálculo PROBABILIDAD.csv, con el
siguiente comando le debe aparecer:
> # Ciérrela y continúe ejecutando el código
>
> View(PROBA)
>
> # El grupo debe escoger entre los tres tipos de variables discretas existentes:
> # Para los estudiantes de zootecnia, la variable "LECHONES", que es el número
de lechones por cerda.
> # Para los estudiantes de agronomía, la variable "ACAROS", que es el número
de ácaros por hoja.
> # Para los estudiantes de ambiental, la variable "HOGARES", que corresponde
al número de hogares que reciclan en 100 barrios
> # Si el número del grupo es par, seleccionar la variable terminada en número
par.
> # Si el número del grupo es impar, seleccionar la variable terminada en número
impar.
> # Si en el grupo hay estudiantes de distintas profesiones, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
> CONTEO=ACAROS2 # En esta linea reemplaze la palabra "LECHONES1" por
la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "HOGARES2" entonces la línea previa deberá quedar
así: CONTEO=HOGARES2
> # No debe reemplazar nada más, porque de lo contrario puede aparecerle algún
error
>
> min(CONTEO)
[1] 0
> max(CONTEO)
[1] 10
> table(CONTEO) # Tabla de frecuencias absolutas
CONTEO
0 1 2 3 4 5 6 7 8 9 10
4 5 8 9 10 10 14 10 12 11 7
> fabs=table(CONTEO) # Tabla de frecuencias absolutas
> fabs
CONTEO
0 1 2 3 4 5 6 7 8 9 10
4 5 8 9 10 10 14 10 12 11 7
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
0 1 2 3 4 5 6 7 8 9 10
4 9 17 26 36 46 60 70 82 93 100
> frel=prop.table(table(CONTEO)) # Tabla de frecuencias relativas
> frel
CONTEO
0 1 2 3 4 5 6 7 8 9 10
0.04 0.05 0.08 0.09 0.10 0.10 0.14 0.10 0.12 0.11 0.07
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
0 1 2 3 4 5 6 7 8 9 10
0.04 0.09 0.17 0.26 0.36 0.46 0.60 0.70 0.82 0.93 1.00
>
> # GRAFICOS PARA VARIABLES DISCRETAS
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 764 -
FRECUENCIAS ABSOLUTAS - DISCRETA") # Frecuencias absolutas
>
> barplot(frel,ylab="Frecuencias relativas",main="PERIODO 764 - FRECUENCIAS
RELATIVAS - DISCRETA") # Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 764 -
FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA") #Frecuencias
relativas acumuladas
>
>
># VARIABLE CUANTITATIVA CONTINUA
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra el nombre de las variables sobre los que el
programa R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):
>
> # Instalación del paquete "fdth"
> # Cuando aparezca el listado, elegir el primero de la lista: "0-Cloud [https]" y
después: "fdth". hacer clic en "OK"
> # Esperar hasta que instale el paquete de comandos, puede tardar varios
minutos
> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de abajo
de la Consola R
>
> utils:::menuInstallPkgs() # seleccionar el primero de la lista: "0-Cloud [https]" y
después el paquete: "fdth"
--- Please select a CRAN mirror for use in this session ---
probando la URL 'https://cloud.r-project.org/bin/windows/contrib/4.0/fdth_1.2-5.zip'
Content type 'application/zip' length 292913 bytes (286 KB)
downloaded 286 KB
sd, var
Warning message:
package ‘fdth’ was built under R version 4.0.3
>
> # El grupo debe escoger entre los tres tipos de variables continuas existentes:
> # Para los estudiantes de zootecnia, la variable "PESOCON", que es el peso de
conejos.
> # Para los estudiantes de agronomía, la variable "pH", que es el potencial de
hidrógeno del suelo.
> # Para los estudiantes de ambiental, la variable "PM", que corresponde al
material particulado de 2.5
> # Si el número del grupo es par, seleccionar una la variable terminada en
número par.
> # Si el número del grupo es impar, seleccionar la variable terminada en número
par.
> # Si en el grupo hay estudiantes de distintas profesiones, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
>
> VARIABLECONTINUA=pH2 # En esta linea reemplaze la palabra "PESOCON1"
por la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "PM2" entonces la línea previa deberá quedar así:
VARIABLECONTINUA=PM2
>
> summary(VARIABLECONTINUA)
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.000 4.675 5.000 5.050 5.425 6.000
> minimos=min(VARIABLECONTINUA)
> minimos
[1] 4
> maximos=max(VARIABLECONTINUA)
> maximos
[1] 6
> mean(VARIABLECONTINUA)
[1] 5.05
> median(VARIABLECONTINUA)
[1] 5
> VARIANZA=var(VARIABLECONTINUA)
> VARIANZA
[1] 0.3029293
> sd(VARIABLECONTINUA)
[1] 0.5503901
> SIGMA=sqrt(VARIANZA)
> SIGMA
[1] 0.5503901
> length(VARIABLECONTINUA)
[1] 100
>
># TABLA DE FRECUENCIAS
>
> dist <- fdt(VARIABLECONTINUA)
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta (f),
frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia
acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))
Class limits f rf rf(%) cf cf(%)
[3.96,4.223) 9 0.09 9 9 9
[4.223,4.485) 8 0.08 8 17 17
[4.485,4.747) 11 0.11 11 28 28
[4.747,5.01) 25 0.25 25 53 53
[5.01,5.272) 15 0.15 15 68 68
[5.272,5.535) 12 0.12 12 80 80
[5.535,5.797) 8 0.08 8 88 88
[5.797,6.06) 12 0.12 12 100 100
>
># GRÁFICOS DE VARIABLES CONTINUAS
>
> plot(dist, type="fh",col="blue",xlab="Intervalo de la variable
continua",main="PERIODO 764 - HISTOGRAMA FRECUENCIAS ABSOLUTAS")
# HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="fp",col="blue",main="PERIODO 764 - POLIGONO
FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA") #POLIGONO DE
FRECUENCIAS ABSOLUTAS
> plot(dist, type="rfh",col="blue",xlab="Intervalo variable
conitnua",main="PERIODO 764 - HISTOGRAMA FRECUENCIAS
RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
>
> # Cuando ejecute el siguiente comando y le aparezca la gráfica de "POLIGONO
DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE", por favor
NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá el siguiente error:
> # Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) :
> # plot.new has not been called yet
>
>
> plot(dist, type="cfp",ylim=c(0,100), col="red",ylab="Frecuencia
(%)",xlab="Variable continua",main="PERIODO 764 - POLÍGONO FRECUENCIAS
RELATIVAS ACUMULADAS (%)") #POLIGONO DE FRECUENCIAS RELATIVAS
ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50%
> abline(h=75, col="blue") # frecuencia = 75%
> abline(h=100, col="green") # frecuencia = 100%
> abline(v=median(VARIABLECONTINUA), col="red") # mediana
> abline(v=quantile(VARIABLECONTINUA, 0.25), col="black")# Cuantil Q1
> abline(v=quantile(VARIABLECONTINUA, 0.5),col="red")# Cuantil Q2 (es la
misma mediana)
> abline(v=quantile(VARIABLECONTINUA, 0.75),col="blue")# Cuantil Q3
> abline(v=max(VARIABLECONTINUA), col="brown") # valor máximo
>
> # Donde se unen las líneas rojas es la mediana, lo cual indica que hay una
probabilidad del 50% de que los datos sean iguales o inferiores a esta.
>
> #Distribución emprica
> ECDF=ecdf(VARIABLECONTINUA)
> ECDF
Empirical CDF
Call: ecdf(VARIABLECONTINUA)
x[1:20] = 4, 4.1, 4.2, ..., 5.8, 6
> minimos
[1] 4
> maximos
[1] 6
>
> # Al igual que con la gráfica anterior, cuando ejecute el próximo comando y le
aparezca la gráfica "Distribución empírica", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá un error.
>
> # Gráfico de Distribución empírica:
> plot(ECDF,col="red",lwd=3,xlab="VARIABLE CONTINUA",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 764 -
DISTRIBUCIÓN EMPÍRICA")
> abline(h=0.5, col="red") # la línea horizontal de color rojo, indica el 50% de
la frecuencia de la variable
> abline(v=median(VARIABLECONTINUA), col="red", ) # la línea vertical de color
rojo indica la mediana de la variable
> median(VARIABLECONTINUA) # valor de la mediana en la variable elegida
[1] 5
> abline(v=mean(VARIABLECONTINUA), col="blue", ) # la línea vertical de color
azul indica la media de la variable
>
> # CÁLCULO DE PROBABILIDADES
>
> # En el siguiente comando, indique el valor de la media de la variable elegida:
> media= 5.062
> # Ahora indique el valor de la varianza de la variable elegida:
> varianza= 0.29955
> sigma=sqrt(varianza)
>
> # Dentro del rango de valores de la variable elegida, indique aquel del que
quiere conocer su probabilidad.
> # Reemplace el valor de 2700 por uno que se encuentre dentro del rango de
datos en el que se encuentra la variable que eligió:
>
> valor=7.5
> pnorm(valor,media,sigma)
[1] 0.9999958
> 1-pnorm(valor,media,sigma)
[1] 4.204431e-06
>
> # Responda a todas las preguntas solicitadas en la guía de la Fase 5
>
> # Preparado por:
>
> # Luis Alberto Cáceres
> # Director de Curso
> # Director de Curso
>