Tarea-9 NN
Tarea-9 NN
Tarea-9 NN
Nombres:
20-08-2023
Apellidos:
Desarrollo de la Actividad
1. Los datos que se muestran en el archivo reg1.csv son rendimiento de kilometraje de gasolina (en millas por galon) y
desplazamiento del motor (em centímetros cubicos) para una muestra de 20 automóviles.
a) Cree una variable EngineDispIn3 que contenga el desplazamiento del motor en pulgadas cubicas. Una pulgada cubica
es equivalente a 16.3871 centımetros cubicos. Redondee al entero mas cercano.
e) Encuentre una estimación del rendimiento medio de kilometraje de gasolina en carretera para un automóvil con un
desplazamiento del motor de 150 pulgadas cúbicas.
f) Obtenga el valor ajustado de y y el residuo correspondiente para un automóvil, el Ford Escort, con un
desplazamiento del motor de 114 pulgadas cubicas.
c) Encuentre el precio de venta medio dado que los impuestos pagados son x = 7,50.
f ) Elabore una gr´afica de probabilidad normal de los residuales e interprete esta pre- sentaci´on.
g) Grafique los residuos y y contra x parece que se cumple el supuesto contra varianzaconstante?
h) ¿Qu´e proporci´on de la variabilidad total se explica por el modelo de regresi´on?
3. Se cree que la cantidad de libras de vapor utilizadas por mes por una planta qu´ımica est´a
relacionada con la temperatura ambiente promedio (en grados Farenheit) para ese mes. El
uso y la temperatura del año pasado se muestran en el archivo reg3.csv.
a. Suponiendo que un modelo de regresi´on lineal simple es apropiado, ajustar el modelo de
regresi´on que relaciona el uso de vapor (y) con la temperatura media (x).
b. ¿Cu´al es la estimaci´on del uso de vapor esperado cuando la temperatura promedio es de
55 ◦F?
g) Elabore una gráfica de probabilidad normal de los residuales e interprete esta pre-
sentaci´on.
h) Grafique los residuos contra ˆy y contra x. ¿Parece que se cumple el supuesto de
varianza constante?
|
3
|
4
|
5
|
5. Con el conjunto de datos tourism.csv realice los siguientes ejercicios. Para los ejercicios b,
c y d investigue sobre la regresi´on lineal múltiple. Adicionalmente investigue sobre los
supuestos de los modelos de regresi´on y como verificarlos en R.
a) Le gustaría saber si la edad de los huéspedes influye en la cantidad gastada por día (conjunto
de datos turismo.xlsx). Ejecute una regresi´on lineal con la edad como independiente y los
gastos como variable dependiente. Verifique el cumplimiento de los supuestos.
6
|
7
|
c) Finalmente añada la variable sexo. Ejecute el nuevo modelo de regresión y verifique los
supuestos.
8
|
9
|
d) Finalmente añada la variable sexo. Ejecute el nuevo modelo de regresión y verifique los supuestos.
10
|
11
|
# EJER 1
#### 1A ####
reg1$EngineDispIn3<-round(reg1$EngineDisp/16.3871)
#### 1B ####
library(tidyverse)
ggplot(data = reg1, aes(EngineDispIn3,MPG)) +
geom_point() +
#### 1C ####
cor(reg1$MPG,reg1$EngineDispIn3)
#### 1D ####
library(dplyr)
x <- lm(MPG ~ EngineDispIn3, data = reg1) %>% summary()
12
|
#### 1E ####
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
y_hat
#### 1F ####
actual_FrdEsc<-reg1$MPG[which(reg1$EngineDispIn3==114)]
adjst_FrdEsc<-b0+b1*(114)
actual_FrdEsc," - ",
adjst_FrdEsc," = ",actual_FrdEsc-adjst_FrdEsc)
#### 1G ####
x $r.squared
# EJER 2
#### 2A ####
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
#### 2B ####
y_hat
#### 2C ####
adj5.89 <- b0+b1*(5.8980)
13
|
#### 2D ####
y_hat<-b0+b1*r2$Tax_miles
y<-r2$Precio_miles
geom_point(colour="blue") +
colour="green",size=2)
#### 2E ####
r<-y_hat-y
#### 2F ####
qqnorm(r,main="Test de normalidad",pch=20,col="purple")#19
qqline(r,col="green")
#### 2G ####
"sÃ-"
#### 2H ####
x$r.squared
# EJER 3
#### 3A ####
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
#### 3B ####
14
|
b0+b1*55
#### 3C ####
b1
#### 3D ####
y47_hat<-b0+b1*47
y47_hat
y47<-r3$Libras_Miles[which(r3$Temp==47)]
y47
r<-y47-y47_hat
#### 3E ####
geom_point(colour="blue",size=2) +
geom_smooth(method = lm, se = F,
colour="purple",lwd=0.5,lty=10)+
colour="green",size=1)
#### 3F ####
r<-r3$Libras_Miles-y_hat
#### 3G ####
qqnorm(r,main="Test de normalidad",pch=20,col="purple")#19
qqline(r,col="green")
#### 3H ####
geom_point(colour="red")
"sÃ-"
#### 3I ####
15
|
x$r.squared
# EJER 4
#### 4A ####
df<-tail(df[order(-df$UTILIDAD),],1000)
df$UTILIDAD<-df$UTILIDAD*-1
geom_point() +
#### 4B ####
cor(df$EMPLEADOS,df$UTILIDAD)
#### 4C ####
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
x$r.squared
las utilidades"
#### 4D ####
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
b2 <- x$coefficients[3,1]
x$r.squared
#### 4E ####
16
|
df$SECTOR<-as.factor(df$SECTOR)
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
b2 <- x$coefficients[3,1]
b3 <- x$coefficients[4,1]
x$r.squared
# EJER 5
#### 5A ####
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
geom_point() +
y_hat<-b0+b1*df$age
y<-df$expenses
geom_point() +
x$r.squared
#### 5B ####
17
|
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
b2 <- x$coefficients[3,1]
b3 <- x$coefficients[4,1]
x$r.squared
#### 5C ####
df$accommodation<-as.factor(df$accommodation)
x
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
b2 <- x$coefficients[3,1]
b3 <- x$coefficients[4,1]
b4 <- x$coefficients[5,1]
x$r.squared
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
b2 <- x$coefficients[3,1]
b3 <- x$coefficients[4,1]
18
x$r.squared
#### 5D ####
df$sex<-as.factor(df$sex)
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
b2 <- x$coefficients[3,1]
b3 <- x$coefficients[4,1]
b4 <- x$coefficients[5,1]
b5 <- x$coefficients[6,1]
x$r.squared
b0 <- x$coefficients[1,1]
b1 <- x$coefficients[2,1]
b2 <- x$coefficients[3,1]
b3 <- x$coefficients[4,1]
b4 <- x$coefficients[5,1]
x$r.square
19