Guia 08 Regresion Multiple

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

GUÍA 8

REGRESIÓN MÚLTIPLE
Ramiro Guerrón Varela
19 de marzo de 2021

1. En un estudio sobre la población de un parásito se hizo un recuento de parásitos en 15 localizaciones con diversas
condiciones ambientales. Los datos obtenidos son los siguientes:

Tabla 1: Crecimiento de Parásitos


Temperatura 15 16 24 13 21 16 22 18 20 16 28 27 13 22 23
Humedad 70 65 71 64 84 86 72 84 71 75 84 79 80 76 88
Recuento 156 157 177 145 197 184 172 187 157 169 200 193 167 170 192

Responda cada una de las siguientes preguntas, use MS-EXCEL o R.

a) Realice una prueba de normalidad de cada una de las variables.


b) Realice un diagrama de dispersión (plot) entre las variables
c) Halle la ecuación de regresión lineal usando el método de mı́nimos cuadrados.
d ) Halle el coeficiente de determinación
e) Halle el coeficiente de determinación ajustado.
f ) Realice una prueba de hipótesis ANOVA de independencia.
g ) Encuentre la matriz de correlación e identifique si hay un problema de colinealidad.
h) Encuentre la matriz de Varianzas-Covarianzas
i ) Realice un diagrama de residuos
j ) Realice una prueba de normalidad de los residuos.
k ) Seleccione el mejor modelo y justifique su respuesta.

2. Se desea modelar los gastos de los hogares Y en una ciudad en términos de los ingresos X1 y el número de miembros
en cada hogar, X2 , usando el modelo de regresión lineal múltiple y = β0 + β1 x1 + β2 x2 + , donde x1 , x2 e y son valores
de las variables X1 , X2 , Y , respectivamente. Los datos se encuentran en la base Gastos Hogares.csv

Tabla 2: Gastos Hogares

Gastos Ingresos Miembros


4089 5500 3
3232 3100 2
5173 3300 4
4815 5100 5
1937 3200 2
4143 5600 2
2804 3800 1
3421 4100 2
4837 6700 4
4183 5200 3
4281 2600 3
4292 4900 4
2550 2800 1
2587 3400 2
4287 6600 3
5038 6400 4
4485 4300 6
2521 2200 2
3068 4500 1
4244 3800 5
5751 6300 6
3696 2200 3
5374 5600 7
3093 4300 2

Responda cada una de las siguientes preguntas, use MS-EXCEL o R.

a) Realice una prueba de normalidad de cada una de las variables.


b) Realice un diagrama de dispersión (plot) entre las variables
c) Halle la ecuación de regresión lineal usando el método de mı́nimos cuadrados.
d ) Halle el coeficiente de determinación
e) Halle el coeficiente de determinación ajustado.
f ) Realice una prueba de hipótesis ANOVA de independencia.
g ) Encuentre la matriz de correlación e identifique si hay un problema de colinealidad.
h) Encuentre la matriz de Varianzas-Covarianzas
i ) Realice un diagrama de residuos
j ) Realice una prueba de normalidad de los residuos.
k ) Seleccione el mejor modelo y justifique su respuesta.

3. La empresa Venagra (CasoV enagra), relacionada con la venta de instrumentos para la agricultura, ha sufrido en
estos últimos meses una baja en las ventas de sus productos. Después de varias reuniones entre los directivos de las
diferentes secciones se ha determinado que un estudio de los diversos factores relacionados con los vendedores, y que
podrı́an explicar la variabilidad de las ventas que se realizan, ayudarı́a en las decisiones a tomar para la solución de este
problema. Para ello, el gerente de personal ha decidido usar las ventas del último mes como la variable dependiente (Y )
y como variables independientes, que podrı́an explicar a la variable dependiente, a las siguientes: X1 = resultado de
una prueba de aptitud para las ventas, en una escala del 0 al 100 (prueba) X2 = edad en años (edad) X3 = experiencia
en años (experiencia) X4 = promedio de las calificaciones de la escuela secundaria (promedio) El gerente de personal
tomó una muestra de 30 casos y los datos fueron los siguientes:

Tabla 3: Caso Venagra

Ventas Prueba Edad Experiencia Promedio


45 11 26,32 0 14,09
48 20 26,07 1 14,7
62 26 27,61 0 16,52
72 32 31,45 3 15,69
60 65 27,9 2 13,75
62 81 26,87 1 14,07
56 43 26,47 0 13,4
59 66 27,17 0 14,74
65 49 27,34 1 14,18
68 65 27,49 1 13,73
55 55 25,17 0 13,69
46 11 27,05 1 14,27
54 50 27,96 0 14,75
77 100 27,56 3 14,01
66 76 31,16 0 14,3
36 13 29,2 0 12,11
59 45 27,28 2 13,76
39 21 26,71 2 11,79
61 74 27,98 1 13,79
50 5 26,6 2 15,16
58 9 26,76 0 14,8
59 99 26,26 1 13,62
50 25 27,01 1 12,97
55 59 30,49 2 13,84
49 24 27,89 1 13,78
64 90 32,65 2 14,4
62 35 31,11 1 15,5
40 15 26,16 1 12,5
62 33 27,01 3 13,94
79 90 26,98 4 15,75
Responda cada una de las siguientes preguntas, use MS-EXCEL o R.

a) Realice una prueba de normalidad de cada una de las variables.


b) Realice un diagrama de dispersión (plot) entre las variables
c) Halle la ecuación de regresión lineal usando el método de mı́nimos cuadrados.
d ) Halle el coeficiente de determinación
e) Halle el coeficiente de determinación ajustado
f ) Realice una prueba de hipótesis ANOVA de independencia.
g ) Encuentre la matriz de correlación e identifique si hay un problema de colinealidad.
h) Encuentre la matriz de Varianzas-Covarianzas
i ) Realice un diagrama de residuos
j ) Realice una prueba de normalidad de los residuos.
k ) Seleccione el mejor modelo y justifique su respuesta.

4. La empresa EMCO opera 200 tiendas en diferentes lugares del paı́s para la venta de artefactos electrónicos para el
hogar. Los últimos informes indican que la curva de ventas mensuales Y, en miles de dólares, ha descendido a tal punto
que ha tenido que cerrar algunas de las tiendas que regenta, en perjuicio de un buen número de empleados que han
sido despedidos. El gerente de comercialización, con el fin de enfrentar el problema que ha ocasionado el descenso de
las ventas, ha determinado que es necesario un estudio estadı́stico que permita determinar las variables que pueden
explicar la variabilidad de las ventas, como parte del análisis general, y es ası́ como después de una serie de reuniones
con los conocedores del negocio ha determinado que las siguientes variables podrı́an explicar las ventas: X1 = Área del
terreno, en m2, que ocupa la tienda X2 = Cantidad de habitantes que existen en 10 manzanas a la redonda de la tienda
respectiva X3 = Número de lı́neas de buses que pasan por la calle en donde se encuentra la tienda X4 = Número de
tiendas similares en 10 manzanas a la redonda que venden artefactos electrónicos para el hogar
Los datos obtenidos de la muestra son los siguientes:

Tabla 4: Add caption


Y X1 X2 X3 X4
123,42 554,33 116492 5 6
94,87 516,23 93301 4 10
88,96 545,5 102017 4 9
105,81 478,95 117726 3 10
70,63 426,51 81628 4 11
80,22 537,48 93139 2 9
112,04 464,79 10327 7 10
92,28 386,71 89387 3 8
101,37 506,58 100578 2 8
96,96 624,6 95784 4 9
84,06 437,68 96206 9 14
131,11 486,17 122482 5 9
116,38 532,02 114116 5 9
74,18 426,78 99753 4 7
92,05 505,27 80422 4 11
83,98 509,51 78049 4 13
64,96 502,82 78608 5 5
100,6 575,67 97846 5 12
139,97 488,64 113808 5 20
90,2 514,13 103838 6 11
118,85 486,99 8818 5 16
87,21 472,63 105459 7 12
71,6 475,35 8801 3 10
130,57 616,05 11603 8 7
123,34 523,8 107504 6 11
89,75 514,81 103723 5 10
116,27 514,64 107182 2 16

Responda cada una de las siguientes preguntas, use MS-EXCEL o R.

a) Realice una prueba de normalidad de cada una de las variables.


b) Realice un diagrama de dispersión (plot) entre las variables
c) Halle la ecuación de regresión lineal usando el método de mı́nimos cuadrados.
d ) Halle el coeficiente de determinación
e) Halle el coeficiente de determinación ajustado
f ) Realice una prueba de hipótesis ANOVA de independencia.
g ) Encuentre la matriz de correlación e identifique si hay un problema de colinealidad.
h) Encuentre la matriz de Varianzas-Covarianzas
i ) Realice un diagrama de residuos
j ) Realice una prueba de normalidad de los residuos.
k ) Seleccione el mejor modelo y justifique su respuesta.

También podría gustarte