Fase 5 Ejercicio Final.

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 42

Estadística Descriptiva

Fase 5 - Ejercicio final

Estudiante

Mariela

Tutor
Luis Alberto Cáceres Torres

Código del curso:


300046_116

Universidad Nacional Abierta y a Distancia UNAD


Escuela de Ciencias Agrícolas, Pecuarias y del Medio Ambiente ECAPMA
Mayo 2021

INTRODUCCIÓN
En el presente trabajo vamos a implementar los conocimientos adquiridos en la
unidad 1 de estadísticas aplicadas a las ciencias agrarias donde aprendimos la
interpretación de datos, probabilidad y métodos estadísticos, en la unidad 2
profundizamos en probabilidades y distribución aplicadas a las ciencias agrarias,
pecuarias y ambientales aplicando el manejo del programa R con el propósito de
que el aprendizaje sea más dinámico y práctico.

3.1 VARIABLE CUANTITATIVA DISCRETA


3.1.1. Indicar el nombre de la variable discreta elegida y presentar:
Amb_discreta

• Tabla de Frecuencias Absolutas

CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
5 4 10 1 3 4 3 3 2 6 6 7 2 6 4 3 4 3 3 2 3 2 5 3 3 3

• Tabla de Frecuencias Absolutas Acumuladas

CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
5 9 19 20 23 27 30 33 35 41 47 54 56 62 66 69 73 76 79 81 25 26 27 28 29
30
84 86 91 94 97 100

• Tabla de Frecuencias Relativas

CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
0.05 0.04 0.10 0.01 0.03 0.04 0.03 0.03 0.02 0.06 0.06 0.07 0.02 0.06 0.04 0.03
21 22 23 24 25 26 27 28 29 30
0.04 0.03 0.03 0.02 0.03 0.02 0.05 0.03 0.03 0.03

• Tabla de Frecuencias Relativas Acumuladas


CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
20
0.05 0.09 0.19 0.20 0.23 0.27 0.30 0.33 0.35 0.41 0.47 0.54 0.56 0.62 0.66
0.69
21 22 23 24 25 26 27 28 29 30
0.73 0.76 0.79 0.81 0.84 0.86 0.91 0.94 0.97 1.00

VARIABLE CUANTITATIVA DISCRETA


Indicar el nombre de la variable discreta elegida y presentar:
Ácaros 1
 Tabla de Frecuencias Absolutas
 Tabla de Frecuencias Absolutas Acumuladas
 Tabla de Frecuencias Relativas

GRAFICOS PARA VARIABLES DISCRETAS


PERIODO 764 - FRECUENCIAS ABSOLUTAS - DISCRETA

14
12
10
Frecuencias absolutas

8
6
4
2
0

0 1 2 3 4 5 6 7 8 9 10

Descripción
PERIODO 764 - FRECUENCIAS RELATIVAS - DISCRETA

0.14
0.12
0.10
Frecuencias relativas

0.08
0.06
0.04
0.02
0.00

0 1 2 3 4 5 6 7 8 9 10

Descripción
PERIODO 764 - FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA

1.0
0.8
Frecuencias relativas

0.6
0.4
0.2
0.0

0 1 2 3 4 5 6 7 8 9 10

Descripción

Haga una descripción de cada uno de los gráficos presentados y analice los
resultados presentados en cada uno de ellos.
De acuerdo a lo observado en la gráfica de Frecuencias Relativas ¿el
comportamiento de la variable se asemeja a una distribución normal? Explique su
respuesta.
VARIABLE CUANTITATIVA CONTINUA
Indicar el nombre de la variable continúa elegida y presentar: pH1
Valor
Nombre de la variable Elegida pH1
Valor mínimo 4
Valor máximo 6,8
Media 5,1
Mediana 5,144
Varianza
Desviación estándar

Tabla resumen indicando:


Intervalos de Frecuencia Frecuencia Frecuencia Frecuencia
datos Absoluta Relativa Absoluta Relativa
Acumulada Acumulada

• Presente los siguientes gráficos, haciendo una descripción de cada uno de ellos
y analice los resultados obtenidos:
• "HISTOGRAMA DE FRECUENCIAS ABSOLUTAS"

PERIODO 764 - HISTOGRAMA FRECUENCIAS ABSOLUTAS


25
20
Frequency

15
10
5
0

3.96 4.32 4.69 5.05 5.41 5.78 6.14 6.50 6.87

Intervalo de la variable continua

Descripción
• "POLIGONO DE FRECUENCIAS ABSOLUTAS"

PERIODO 764 - POLIGONO FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA


25
20
Frequency

15
10
5
0

3.96 4.32 4.69 5.05 5.41 5.78 6.14 6.50 6.87

Class limits

Descripción
• "HISTOGRAMA DE FRECUENCIAS RELATIVAS"

PERIODO 764 - HISTOGRAMA FRECUENCIAS RELATIVAS


0.25
0.20
0.15
Frequency

0.10
0.05
0.00

3.96 4.32 4.69 5.05 5.41 5.78 6.14 6.50 6.87

Intervalo variable conitnua

Descripción
• "POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN
PORCENTAJE"

PERIODO 764 - POLÍGONO FRECUENCIAS RELATIVAS ACUMULADAS (%)


100
80
Frecuencia (%)

60
40
20
0

3.96 4.32 4.69 5.05 5.41 5.78 6.14 6.50 6.87

Variable continua

Descripción
PERIODO 764 - POLÍGONO FRECUENCIAS RELATIVAS ACUMULADAS (%)
100
80
Frecuencia (%)

60
40
20
0

3.96 4.32 4.69 5.05 5.41 5.78 6.14 6.50 6.87

Variable continua

Descripción
PREGUNTAS ORIENTADORAS PARA EL ANÁLISIS DE RESULTADOS
VARIABLES AGRÍCOLAS

Variable discreta: ÁCAROS

En un cultivo de fresas de la Sabana de Bogotá, se realizó un monitoreo del


número de ácaros (adultos y fases juveniles) por hoja, para determinar si se hace
necesario tomar una medida para controlar su población.

1. En estudios previos se ha determinado que un número promedio mayor a 4


ácaros por hoja, es el umbral económico que afecta tanto la calidad como el
rendimiento del cultivo; de acuerdo a los resultados obtenidos ¿tomaría o no la
decisión de aplicar alguna medida de control?

2. Teniendo en cuenta que los consumidores reclaman alimentos libres de


agroquímicos, ¿qué estrategia de control utilizaría para regular la población de
ácaros en el cultivo?

3. ¿Considera que la variable analizada se ajusta al modelo de distribución


normal? Explique su respuesta.

Variable continua: pH

Se desea sembrar papa en un terreno al que previamente se le realizó un análisis


físico químico del suelo en 100 muestras recogidas al azar, una de las variables
medidas fue el pH.

1. Si el pH óptimo del suelo para sembrar papa oscila entre 5.5 y 7.0, de acuerdo a
los resultados obtenidos ¿cómo calificaría el suelo analizado?

2. ¿Es un suelo ácido o básico?

3. ¿Qué enmiendas recomendaría para mejorar el pH del suelo analizado?

4. En la sección “CÁLCULO DE PROBABILIDADES”, ubicada al final del script,


ingrese el pH promedio (media= 5.062) y la varianza (varianza= 0.29955) de las
muestras analizadas. 5. ¿Cuál es la probabilidad de encontrar una muestra de
suelo con un pH menor o igual de 5?

6. ¿Cuál es la probabilidad de encontrar una muestra de suelo con un pH mayor o


igual de 5.5?

VARIABLE CUANTITATIVA DISCRETA


Indicar el nombre de la variable discreta elegida y presentar:
• Tabla de Frecuencias Absolutas
Variabl Frecuencia
e absoluta
0 0
1 13
2 12
3 14
4 5
5 13
6 8
7 7
8 5
9 7
10 3
TOTAL 87

• Tabla de Frecuencias Absolutas Acumuladas


Variabl Frecuencia Frecuencia absoluta
e absoluta acumulada
0 3 3
1 26 29
2 38 67
3 52 119
4 57 176
5 70 246
6 78 324
7 85 409
8 90 499
9 97 596
10 100 696
TOTAL 696

• Tabla de Frecuencias Relativas


Variabl Frecuencia Frecuencia absoluta Frecuencias
e absoluta acumulada relativas
0 3 3 13%
1 26 29 0.26%
2 38 67 0.38%
3 52 119 0.52%
4 57 176 0.57%
5 70 246 0.70%
6 78 324 0.78%
7 85 409 0.85%
8 90 499 0.90%
9 97 596 0.97%
10 100 696 1.00%
TOTAL 696

• Tabla de Frecuencias Relativas Acumuladas


Variabl Frecuencia Frecuencia absoluta Frecuencias Frecuencias relativas
e absoluta acumulada relativas acumuladas
0 3 3 13% 13%
1 26 29 0.26% 0.26%
2 38 67 0.38% 0.38%
3 52 119 0.52% 0.52%
4 57 176 0.57% 0.57%
5 70 246 0.70% 0.70%
6 78 324 0.78% 0.78%
7 85 409 0.85% 0.85%
8 90 499 0.90% 0.90%
9 97 596 0.97% 0.97%
10 100 696 1.00% 1.00%
TOTAL 696
CONCLUSIONES

Los conceptos antes mencionados han sido analizados e investigados de tal


manera de hacer más fácil su comprensión y entendimientos ya que la estadística
es la ciencia que trata de entender, organizar y tomar decisiones que estén de
acuerdo con los análisis efectuados. La estadística juega un papel muy importante
en nuestras vidas, ya que actualmente ésta se ha convertido en un método muy
efectivo para describir con mucha precisión los valores de datos económicos,
políticos, sociales, psicológicos, biológicos y físicos, además, sirve como
herramienta para relacionar y analizar dichos datos. El trabajo del experto
estadístico ha evolucionado mucho, ya no consiste sólo en reunir y tabular los
datos, sino sobre todo en el proceso de interpretación de esa información, ahora
tiene un papel mucho más importante del que tenía en años pasados. Es de vital
importancia para nuestra vida profesional venidera, que manejemos estos
conceptos con facilidad, así mismo el que los usemos de la manera apropiada,
siempre en pro de buscar soluciones a los problemas que se nos puedan
presentar.

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

BIBLIOGRAFIA
 
 
 
 
 
  Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat
en problemas de agronomía. Recuperado
de http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
docID=3221775&query=bioestadistica 
Deaza D. (2018). OVI Distribuciones de probabilidad en el programa R.
Recuperado de http://hdl.handle.net/10596/23235
Díaz Mata, Alfredo (2013). Estadística aplicada a la administración y economía.
México: MC Graw Gill. https://es.wikipedia.org/wiki/Distribuci
%C3%B3n_de_probabilidad

 
 
 
 

Procesamiento en R

> getwd()
[1] "D:/D/Documents/My Shared Folder 1/UNAD 2020
I/Arnulfo/Estadistica/FINAL/Estadistica descriptiva"
>
> # EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046A_764 -
ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)
>
> # Cuando el volumen de información es alto, se pueden importar de una hoja de
cálculo en formato "*.csv"
> # Los datos con los que vamos a trabajar se encuentran en el archivo
"PROBABILIDAD.CSV"
> # Deben descargarlo y ubicar tanto la hoja de cálculo como este código en una
misma carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
> # No abra ni modifique el archivo, sólo guárdelo en la carpeta "Estadistica
descriptiva"
>
> # Vaya al menú de R - "Archivo"
> # Dé click en "Cambiar dir" y ubique la carpeta "Estadistica descriptiva", donde
deben estar los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
>
># VARIABLE CUANTITATIVA DISCRETA
>
> # Recuerde que debe ubicarse en cada línea del código y digitar al mismo
tiempo: "Control+R" para ejecutar cada comando
> # No se salte ninguna línea porque puede aparecerle errores en la ejecución de
los comandos
>
> getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde
guardaron los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
[1] "D:/D/Documents/My Shared Folder 1/UNAD 2020
I/Arnulfo/Estadistica/FINAL/Estadistica descriptiva"
> # Si no les aparece la carpeta, el programa R no va a encontrar la base de datos
y R mostrará un mensaje de error al intentar abrirla
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA)
> attach(PROBA) # Muestra los nombres de las variables sobre los cuales
R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):

ACAROS1, ACAROS2, HOGARES1, HOGARES2, LECHONES1,


LECHONES2,
PESOCON1, PESOCON2, pH1, pH2, PM1, PM2, X, X.1, X.10, X.11, X.12,
X.13, X.14, X.15, X.16, X.17, X.18, X.19, X.2, X.20, X.21, X.22,
X.23, X.24, X.3, X.4, X.5, X.6, X.7, X.8, X.9

>
> # Si el programa logró leer la hoja de cálculo PROBABILIDAD.csv, con el
siguiente comando le debe aparecer:
> # Ciérrela y continúe ejecutando el código
>
> View(PROBA)
>
> # El grupo debe escoger entre los tres tipos de variables discretas existentes:
> # Para los estudiantes de zootecnia, la variable "LECHONES", que es el número
de lechones por cerda.
> # Para los estudiantes de agronomía, la variable "ACAROS", que es el número
de ácaros por hoja.
> # Para los estudiantes de ambiental, la variable "HOGARES", que corresponde
al número de hogares que reciclan en 100 barrios
> # Si el número del grupo es par, seleccionar la variable terminada en número
par.
> # Si el número del grupo es impar, seleccionar la variable terminada en número
impar.
> # Si en el grupo hay estudiantes de distintas profesiones, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
> CONTEO=ACAROS1 # En esta linea reemplaze la palabra "LECHONES1" por
la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "HOGARES2" entonces la línea previa deberá quedar
así: CONTEO=HOGARES2
> # No debe reemplazar nada más, porque de lo contrario puede aparecerle algún
error
> min(ACAROS1)
[1] NA
> max(ACAROS1)
[1] NA
> table(ACAROS1) # Tabla de frecuencias absolutas
ACAROS1
0 1 2 3 4 5 6 7 8 9 10
13 13 12 14 5 13 8 7 5 7 3
> fabs=table(ACAROS1) # Tabla de frecuencias absolutas
> fabs
ACAROS1
0 1 2 3 4 5 6 7 8 9 10
13 13 12 14 5 13 8 7 5 7 3
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
0 1 2 3 4 5 6 7 8 9 10
13 26 38 52 57 70 78 85 90 97 100
> frel=prop.table(table(ACAROS1)) # Tabla de frecuencias relativas
> frel
ACAROS1
0 1 2 3 4 5 6 7 8 9 10
0.13 0.13 0.12 0.14 0.05 0.13 0.08 0.07 0.05 0.07 0.03
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
0 1 2 3 4 5 6 7 8 9 10
0.13 0.26 0.38 0.52 0.57 0.70 0.78 0.85 0.90 0.97 1.00
>
> # GRAFICOS PARA VARIABLES DISCRETAS
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 764 -
FRECUENCIAS ABSOLUTAS - DISCRETA") # Frecuencias absolutas
>
> barplot(frel,ylab="Frecuencias relativas",main="PERIODO 764 - FRECUENCIAS
RELATIVAS - DISCRETA") # Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 764 -
FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA") #Frecuencias
relativas acumuladas
>
>
># VARIABLE CUANTITATIVA CONTINUA
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra el nombre de las variables sobre los que el
programa R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):

ACAROS1, ACAROS2, HOGARES1, HOGARES2, LECHONES1,


LECHONES2,
PESOCON1, PESOCON2, pH1, pH2, PM1, PM2, X, X.1, X.10, X.11, X.12,
X.13, X.14, X.15, X.16, X.17, X.18, X.19, X.2, X.20, X.21, X.22,
X.23, X.24, X.3, X.4, X.5, X.6, X.7, X.8, X.9

The following objects are masked from PROBA (pos = 4):

ACAROS1, ACAROS2, HOGARES1, HOGARES2, LECHONES1,


LECHONES2,
PESOCON1, PESOCON2, pH1, pH2, PM1, PM2, X, X.1, X.10, X.11, X.12,
X.13, X.14, X.15, X.16, X.17, X.18, X.19, X.2, X.20, X.21, X.22,
X.23, X.24, X.3, X.4, X.5, X.6, X.7, X.8, X.9

>
> # Instalación del paquete "fdth"
> # Cuando aparezca el listado, elegir: "USA(IA)" y después: "fdth". hacer clic en
"OK"
> # Esperar hasta que instale el paquete de comandos, puede tardar varios
minutos
> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de abajo
de la Consola R
>
> utils:::menuInstallPkgs() # seleccionar el primero de la lista: "0-Cloud [https]" y
después el paquete: "fdth"
--- Please select a CRAN mirror for use in this session ---
probando la URL
'https://mirror.las.iastate.edu/CRAN/bin/windows/contrib/4.0/fdth_1.2-5.zip'
Content type 'application/zip' length 292825 bytes (285 KB)
downloaded 285 KB

package ‘fdth’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\MIPC\AppData\Local\Temp\RtmpyICyPH\downloaded_packages
>
> library(fdth) # si se muestra en rojo en la Consola R, indica que se instaló
correctamente

Attaching package: ‘fdth’


The following objects are masked from ‘package:stats’:

sd, var

Warning message:
package ‘fdth’ was built under R version 4.0.3
>
> # El grupo debe escoger entre los tres tipos de variables continuas existentes:
> # Para los estudiantes de zootecnia, la variable "PESOCON", que es el peso de
conejos.
> # Para los estudiantes de agronomía, la variable "pH", que es el potencial de
hidrógeno del suelo.
> # Para los estudiantes de ambiental, la variable "PM", que corresponde al
material particulado de 2.5
> # Si el número del grupo es par, seleccionar una la variable terminada en
número par.
> # Si el número del grupo es impar, seleccionar la variable terminada en número
par.
> # Si en el grupo hay estudiantes de distintas profesiones, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
>
> VARIABLECONTINUA=pH1 # En esta linea reemplaze la palabra "PESOCON0"
por la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "PM8" entonces la línea previa deberá quedar así:
VARIABLECONTINUA=PM8
>
> summary(pH1)
Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
4.000 4.600 5.100 5.144 5.600 6.800 1
> minimos=min(pH1)
> minimos
[1] NA
> maximos=max(pH1)
> maximos
[1] NA
> mean(pH1)
[1] NA
> median(pH1)
[1] NA
> VARIANZA=var(pH1)
> VARIANZA
[1] NA
> sd(pH1)
[1] NA
> SIGMA=sqrt(VARIANZA)
> SIGMA
[1] NA
> length(pH1)
[1] 101
># TABLA DE FRECUENCIAS
>
> dist <- fdt(pH1)
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta (f),
frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia
acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))
Class limits f rf rf(%) cf cf(%)
[3.96,4.324) 14 0.14 14 14 14
[4.324,4.687) 12 0.12 12 26 26
[4.687,5.05) 22 0.22 22 48 48
[5.05,5.414) 21 0.21 21 69 69
[5.414,5.777) 12 0.12 12 81 81
[5.777,6.141) 12 0.12 12 93 93
[6.141,6.504) 4 0.04 4 97 97
[6.504,6.868) 3 0.03 3 100 100
>
># GRÁFICOS DE VARIABLES CONTINUAS
>
> plot(dist, type="fh",col="blue",xlab="Intervalo de la variable
continua",main="PERIODO 764 - HISTOGRAMA FRECUENCIAS ABSOLUTAS")
# HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="fp",col="blue",main="PERIODO 764 - POLIGONO
FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA") #POLIGONO DE
FRECUENCIAS ABSOLUTAS
> plot(dist, type="rfh",col="blue",xlab="Intervalo variable
conitnua",main="PERIODO 764 - HISTOGRAMA FRECUENCIAS
RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
>
> # Cuando ejecute el siguiente comando y le aparezca la gráfica de "POLIGONO
DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE", por favor
NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá el siguiente error:
> # Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) :
> # plot.new has not been called yet
> plot(dist, type="cfp",ylim=c(0,100), col="red",ylab="Frecuencia
(%)",xlab="Variable continua",main="PERIODO 764 - POLÍGONO FRECUENCIAS
RELATIVAS ACUMULADAS (%)") #POLIGONO DE FRECUENCIAS RELATIVAS
ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50%
> abline(h=75, col="blue") # frecuencia = 75%
> abline(h=100, col="green") # frecuencia = 100%
> abline(v=median(pH1), col="red") # mediana
> abline(v=quantile(pH1, 0.25), col="black")# Cuantil Q1
Error in quantile.default(pH1, 0.25) :
missing values and NaN's not allowed if 'na.rm' is FALSE
> abline(v=quantile(pH1, 0.5),col="red")# Cuantil Q2 (es la misma mediana)
Error in quantile.default(pH1, 0.5) :
missing values and NaN's not allowed if 'na.rm' is FALSE
> abline(v=quantile(pH1, 0.75),col="blue")# Cuantil Q3
Error in quantile.default(pH1, 0.75) :
missing values and NaN's not allowed if 'na.rm' is FALSE
> abline(v=max(pH1), col="brown") # valor máximo
>
> # Donde se unen las líneas rojas es la mediana, lo cual indica que hay una
probabilidad del 50% de que los datos sean iguales o inferiores a esta.
>
> #Distribución emprica
> ECDF=ecdf(pH1)
> ECDF
Empirical CDF
Call: ecdf(pH1)
x[1:26] = 4, 4.1, 4.2, ..., 6.7, 6.8
> minimos
[1] NA
> maximos
[1] NA
> # Al igual que con la gráfica anterior, cuando ejecute el próximo comando y le
aparezca la gráfica "Distribución empírica", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá un error.
> # Gráfico de Distribución empírica:
> plot(ECDF,col="red",lwd=3,xlab="pH1",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 764 -
DISTRIBUCIÓN EMPÍRICA")
Error in plot.window(...) : se necesitan valores finitos de 'xlim'
> plot(ECDF,col="red",lwd=3,xlab="VARIABLE CONTINUA",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 764 -
DISTRIBUCIÓN EMPÍRICA")
Error in plot.window(...) : se necesitan valores finitos de 'xlim'
> # CÁLCULO DE PROBABILIDADES
>
> # En el siguiente comando, indique el valor de la media de la variable elegida:
> media= 5.062
> # Ahora indique el valor de la varianza de la variable elegida:
> varianza= 0.29955
> sigma=sqrt(varianza)
> sigma=sqrt(0.29955)
> valor=6
> # Dentro del rango de valores de la variable elegida, indique aquel del que
quiere conocer su probabilidad.
> # Reemplace el valor de 2700 por uno que se encuentre dentro del rango de
datos en el que se encuentra la variable que eligió:
>
> valor=6
> pnorm(valor,media,sigma)
[1] 0.9567202
> 1-pnorm(valor,media,sigma)
[1] 0.04327982
>
> # Responda a todas las preguntas solicitadas en la guía de la Fase 5
>
R version 4.0.2 (2020-06-22) -- "Taking Off Again"
Copyright (C) 2020 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)

R es un software libre y viene sin GARANTIA ALGUNA.


Usted puede redistribuirlo bajo ciertas circunstancias.
Escriba 'license()' o 'licence()' para detalles de distribucion.

R es un proyecto colaborativo con muchos contribuyentes.


Escriba 'contributors()' para obtener más información y
'citation()' para saber cómo citar R o paquetes de R en publicaciones.

Escriba 'demo()' para demostraciones, 'help()' para el sistema on-line de ayuda,


o 'help.start()' para abrir el sistema de ayuda HTML con su navegador.
Escriba 'q()' para salir de R.

[Previously saved workspace restored]

>
> # EJERCICIO FINAL PRUEBA OBJETIVA ABIERTA CURSO 300046A_764 -
ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)
>
> # Cuando el volumen de información es alto, se pueden importar de una hoja de
cálculo en formato "*.csv"
> # Los datos con los que vamos a trabajar se encuentran en el archivo
"PROBABILIDAD.CSV"
> # Deben descargarlo y ubicar tanto la hoja de cálculo como este código en una
misma carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
> # No abra ni modifique el archivo, sólo guárdelo en la carpeta "Estadistica
descriptiva"
>
> # Vaya al menú de R - "Archivo"
> # Dé click en "Cambiar dir" y ubique la carpeta "Estadistica descriptiva", donde
deben estar los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
>
># VARIABLE CUANTITATIVA DISCRETA
>
> # Recuerde que debe ubicarse en cada línea del código y digitar al mismo
tiempo: "Control+R" para ejecutar cada comando
> # No se salte ninguna línea porque puede aparecerle errores en la ejecución de
los comandos
>
> getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde
guardaron los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
[1] "C:/Users/EQUIPO/Documents/estadistica descriptiva"
> # Si no les aparece la carpeta, el programa R no va a encontrar la base de datos
y R mostrará un mensaje de error al intentar abrirla
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra los nombres de las variables sobre los cuales
R va a hacer los cálculos
>
> # Si el programa logró leer la hoja de cálculo PROBABILIDAD.csv, con el
siguiente comando le debe aparecer:
> # Ciérrela y continúe ejecutando el código
>
> View(PROBA)
>
> # El grupo debe escoger entre los tres tipos de variables discretas existentes:
> # Para los estudiantes de zootecnia, la variable "LECHONES", que es el número
de lechones por cerda.
> # Para los estudiantes de agronomía, la variable "ACAROS", que es el número
de ácaros por hoja.
> # Para los estudiantes de ambiental, la variable "HOGARES", que corresponde
al número de hogares que reciclan en 100 barrios
> # Si el número del grupo es par, seleccionar la variable terminada en número
par.
> # Si el número del grupo es impar, seleccionar la variable terminada en número
impar.
> # Si en el grupo hay estudiantes de distintas profesiones, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
> CONTEO=ACAROS2 # En esta linea reemplaze la palabra "LECHONES1" por
la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "HOGARES2" entonces la línea previa deberá quedar
así: CONTEO=HOGARES2
> # No debe reemplazar nada más, porque de lo contrario puede aparecerle algún
error
>
> min(CONTEO)
[1] 0
> max(CONTEO)
[1] 10
> table(CONTEO) # Tabla de frecuencias absolutas
CONTEO
0 1 2 3 4 5 6 7 8 9 10
4 5 8 9 10 10 14 10 12 11 7
> fabs=table(CONTEO) # Tabla de frecuencias absolutas
> fabs
CONTEO
0 1 2 3 4 5 6 7 8 9 10
4 5 8 9 10 10 14 10 12 11 7
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
0 1 2 3 4 5 6 7 8 9 10
4 9 17 26 36 46 60 70 82 93 100
> frel=prop.table(table(CONTEO)) # Tabla de frecuencias relativas
> frel
CONTEO
0 1 2 3 4 5 6 7 8 9 10
0.04 0.05 0.08 0.09 0.10 0.10 0.14 0.10 0.12 0.11 0.07
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
0 1 2 3 4 5 6 7 8 9 10
0.04 0.09 0.17 0.26 0.36 0.46 0.60 0.70 0.82 0.93 1.00
>
> # GRAFICOS PARA VARIABLES DISCRETAS
> barplot(fabs,ylab="Frecuencias absolutas",main="PERIODO 764 -
FRECUENCIAS ABSOLUTAS - DISCRETA") # Frecuencias absolutas
>
> barplot(frel,ylab="Frecuencias relativas",main="PERIODO 764 - FRECUENCIAS
RELATIVAS - DISCRETA") # Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="PERIODO 764 -
FRECUENCIAS RELATIVAS ACUMULADAS - DISCRETA") #Frecuencias
relativas acumuladas
>
>
># VARIABLE CUANTITATIVA CONTINUA
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra el nombre de las variables sobre los que el
programa R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):

ACAROS1, ACAROS2, HOGARES1, HOGARES2, LECHONES1,


LECHONES2,
PESOCON1, PESOCON2, pH1, pH2, PM1, PM2

>
> # Instalación del paquete "fdth"
> # Cuando aparezca el listado, elegir el primero de la lista: "0-Cloud [https]" y
después: "fdth". hacer clic en "OK"
> # Esperar hasta que instale el paquete de comandos, puede tardar varios
minutos
> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de abajo
de la Consola R
>
> utils:::menuInstallPkgs() # seleccionar el primero de la lista: "0-Cloud [https]" y
después el paquete: "fdth"
--- Please select a CRAN mirror for use in this session ---
probando la URL 'https://cloud.r-project.org/bin/windows/contrib/4.0/fdth_1.2-5.zip'
Content type 'application/zip' length 292913 bytes (286 KB)
downloaded 286 KB

package ‘fdth’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\EQUIPO\AppData\Local\Temp\Rtmp2dcgPl\downloaded_packages
>
> library(fdth) # si se muestra en rojo en la Consola R, indica que se instaló
correctamente

Attaching package: ‘fdth’

The following objects are masked from ‘package:stats’:

sd, var

Warning message:
package ‘fdth’ was built under R version 4.0.3
>
> # El grupo debe escoger entre los tres tipos de variables continuas existentes:
> # Para los estudiantes de zootecnia, la variable "PESOCON", que es el peso de
conejos.
> # Para los estudiantes de agronomía, la variable "pH", que es el potencial de
hidrógeno del suelo.
> # Para los estudiantes de ambiental, la variable "PM", que corresponde al
material particulado de 2.5
> # Si el número del grupo es par, seleccionar una la variable terminada en
número par.
> # Si el número del grupo es impar, seleccionar la variable terminada en número
par.
> # Si en el grupo hay estudiantes de distintas profesiones, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
>
> VARIABLECONTINUA=pH2 # En esta linea reemplaze la palabra "PESOCON1"
por la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "PM2" entonces la línea previa deberá quedar así:
VARIABLECONTINUA=PM2
>
> summary(VARIABLECONTINUA)
Min. 1st Qu. Median Mean 3rd Qu. Max.
4.000 4.675 5.000 5.050 5.425 6.000
> minimos=min(VARIABLECONTINUA)
> minimos
[1] 4
> maximos=max(VARIABLECONTINUA)
> maximos
[1] 6
> mean(VARIABLECONTINUA)
[1] 5.05
> median(VARIABLECONTINUA)
[1] 5
> VARIANZA=var(VARIABLECONTINUA)
> VARIANZA
[1] 0.3029293
> sd(VARIABLECONTINUA)
[1] 0.5503901
> SIGMA=sqrt(VARIANZA)
> SIGMA
[1] 0.5503901
> length(VARIABLECONTINUA)
[1] 100
>
># TABLA DE FRECUENCIAS
>
> dist <- fdt(VARIABLECONTINUA)
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta (f),
frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia
acumulada (cf) y frecuencia acumulada en porcentaje (cf(%))
Class limits f rf rf(%) cf cf(%)
[3.96,4.223) 9 0.09 9 9 9
[4.223,4.485) 8 0.08 8 17 17
[4.485,4.747) 11 0.11 11 28 28
[4.747,5.01) 25 0.25 25 53 53
[5.01,5.272) 15 0.15 15 68 68
[5.272,5.535) 12 0.12 12 80 80
[5.535,5.797) 8 0.08 8 88 88
[5.797,6.06) 12 0.12 12 100 100
>
># GRÁFICOS DE VARIABLES CONTINUAS
>
> plot(dist, type="fh",col="blue",xlab="Intervalo de la variable
continua",main="PERIODO 764 - HISTOGRAMA FRECUENCIAS ABSOLUTAS")
# HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="fp",col="blue",main="PERIODO 764 - POLIGONO
FRECUENCIAS ABSOLUTAS VARIABLE CONTINUA") #POLIGONO DE
FRECUENCIAS ABSOLUTAS
> plot(dist, type="rfh",col="blue",xlab="Intervalo variable
conitnua",main="PERIODO 764 - HISTOGRAMA FRECUENCIAS
RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
>
> # Cuando ejecute el siguiente comando y le aparezca la gráfica de "POLIGONO
DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE", por favor
NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá el siguiente error:
> # Error in int_abline(a = a, b = b, h = h, v = v, untf = untf, ...) :
> # plot.new has not been called yet
>
>
> plot(dist, type="cfp",ylim=c(0,100), col="red",ylab="Frecuencia
(%)",xlab="Variable continua",main="PERIODO 764 - POLÍGONO FRECUENCIAS
RELATIVAS ACUMULADAS (%)") #POLIGONO DE FRECUENCIAS RELATIVAS
ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50%
> abline(h=75, col="blue") # frecuencia = 75%
> abline(h=100, col="green") # frecuencia = 100%
> abline(v=median(VARIABLECONTINUA), col="red") # mediana
> abline(v=quantile(VARIABLECONTINUA, 0.25), col="black")# Cuantil Q1
> abline(v=quantile(VARIABLECONTINUA, 0.5),col="red")# Cuantil Q2 (es la
misma mediana)
> abline(v=quantile(VARIABLECONTINUA, 0.75),col="blue")# Cuantil Q3
> abline(v=max(VARIABLECONTINUA), col="brown") # valor máximo
>
> # Donde se unen las líneas rojas es la mediana, lo cual indica que hay una
probabilidad del 50% de que los datos sean iguales o inferiores a esta.
>
> #Distribución emprica
> ECDF=ecdf(VARIABLECONTINUA)
> ECDF
Empirical CDF
Call: ecdf(VARIABLECONTINUA)
x[1:20] = 4, 4.1, 4.2, ..., 5.8, 6
> minimos
[1] 4
> maximos
[1] 6
>
> # Al igual que con la gráfica anterior, cuando ejecute el próximo comando y le
aparezca la gráfica "Distribución empírica", por favor NO LA CIERRE
> # Vuelva al código ubicando el cursor en el marco azul de este (donde aparece
el nombre del código), para que no pierda el orden que lleva en la ejecución de los
comandos
> # Los siguientes comandos que inician con la palabra "abline", crearán líneas
sobre la gráfica que muestran información adicional sobre ella.
> # Si cierra la gráfica,cuando ejecute los comandos que inician con "abline" le
aparecerá un error.
>
> # Gráfico de Distribución empírica:
> plot(ECDF,col="red",lwd=3,xlab="VARIABLE CONTINUA",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="PERIODO 764 -
DISTRIBUCIÓN EMPÍRICA")
> abline(h=0.5, col="red") # la línea horizontal de color rojo, indica el 50% de
la frecuencia de la variable
> abline(v=median(VARIABLECONTINUA), col="red", ) # la línea vertical de color
rojo indica la mediana de la variable
> median(VARIABLECONTINUA) # valor de la mediana en la variable elegida
[1] 5
> abline(v=mean(VARIABLECONTINUA), col="blue", ) # la línea vertical de color
azul indica la media de la variable
>
> # CÁLCULO DE PROBABILIDADES
>
> # En el siguiente comando, indique el valor de la media de la variable elegida:
> media= 5.062
> # Ahora indique el valor de la varianza de la variable elegida:
> varianza= 0.29955
> sigma=sqrt(varianza)
>
> # Dentro del rango de valores de la variable elegida, indique aquel del que
quiere conocer su probabilidad.
> # Reemplace el valor de 2700 por uno que se encuentre dentro del rango de
datos en el que se encuentra la variable que eligió:
>
> valor=7.5
> pnorm(valor,media,sigma)
[1] 0.9999958
> 1-pnorm(valor,media,sigma)
[1] 4.204431e-06
>
> # Responda a todas las preguntas solicitadas en la guía de la Fase 5
>
> # Preparado por:
>
> # Luis Alberto Cáceres
> # Director de Curso
> # Director de Curso
>

También podría gustarte