Tarea 3 Regresión Lineal Múltiple
Tarea 3 Regresión Lineal Múltiple
Tarea 3 Regresión Lineal Múltiple
Este nos permite establecer la relación que se produce entre una variable
dependiente Y y un conjunto de variables independientes (X1, X2, ... XK).
Hipótesis
Para poder obtener y utilizar herramientas estadísticas que nos permitan
tomar decisiones objetivas y razonadas, necesitamos que el modelo se
ajuste a unas determinadas hipótesis. Estas hipótesis iniciales del modelo
son las siguientes:
Por un lado, si alguna de las variables explicativas fuera combinación lineal de las
otras, el modelo, obviamente, podría simplificarse. Pero eso no es lo más
importante.
* Número de datos= n
*Número de parámetros= k+2
4.1. Algoritmo.
Paso 0. Inicialización.
a. Partir de una variable dependiente Y, y de un conjunto Xk de
variables independientes sugeridas por al menos una teoría que
explique el fenómeno.
b. Preguntar al analista:
b1. ¿Cuál es el nivel de significación a utilizar para las pruebas estadísticas?: 1% o
5%.
b2. ¿Cuáles son los signos esperados en la regresión múltiple para los k
coeficientes de cada variable independiente?
b3. ¿Existe alguna restricción teórica a satisfacer entre los coeficientes? En caso
de ser afirmativa la respuesta indicar la(s) restricción(es).
Ir al paso 1.
Ir al paso 2.
Ir al paso 4.
Ejemplos:
1.- “Una desea estimar los gastos en alimentación de una familia en base a
la información que proporcionan las variables regresoras X1 =“ingresos
mensuales” y X2 =“número de miembros de la familia”. Para ello se recoge una
muestra aleatoria simple de 15 familias cuyos resultados son los de la tabla
adjunta (El gasto e ingreso está dado en cientos de miles de pesetas)”.
043 21 3 129 89 3
031 11 4 035 24 2
032 09 5 035 12 4
046 16 4 078 47 3
125 62 4 043 35 2
044 23 3 047 29 3
052 18 6 038 14 4
029 10 5
Por tanto:
De donde:
El modelo de regresión lineal que se obtiene es:
Calculo de scR
~ 122
= 0'00816 = 0'0903
Tabla Anova,
de donde
Tabla ANOVA
Tabla ANOVA
El coeficiente de determinación,
Este coeficiente es una medida de la relación lineal existente entre las variables
gasto e ingreso. También se puede calcular a partir del coeficiente de
determinación de la siguiente regresión
este coeficiente mide la relación entre las variables gasto e ingreso libres de la
influencia de la variable tamaño.
Análogamente se obtiene que:
= = 0'07649
nh = = 13'073
La varianza del estimador es
= R2 = 0'0060 . = 0'0065
= 0'0803
Algunos gráficos de interés que ayudan a resolver el problema son los siguientes:
Gráficos parciales de las componentes
Gráficos de residuos
2.- Una medición sobre 12 individuos nos permite conocer datos sobre su peso,
altura, contorno de cintura (en cm.) y su edad.
Vamos a ajustar un nuevo modelo de regresión lineal (múltiple, en este caso) que
incorpore la información de estas nuevas variables. En primer lugar, vamos a crear
dos vectores numéricos, uno para cada variable nueva
> cintura <- c(62, 75, 60, 71, 66, 62, 79, 74, 70, 66, 71, 69)
> edad <- c(25, 31, 29, 64, 44, 41, 37, 35, 34, 29, 19, 50)
> head(datos)
peso altura cintura edad
1 74 168 62 25
2 92 196 75 31
3 63 170 60 29
4 72 175 71 64
5 58 162 66 44
6 78 169 62 41
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 6.024 on 8 degrees of freedom
Multiple R-squared: 0.7464, Adjusted R-squared: 0.6513
F-statistic: 7.85 on 3 and 8 DF, p-value: 0.009081
Bibliografía:
http://wpd.ugr.es/~bioestad/guia-de-r/practica-3/#7
http://humanidades.cchs.csic.es/cchs/web_UAE/tutoriales/PDF/Regresion_line
al_multiple_3.pdf
https://www.uam.es/personal_pdi/ciencias/horra/AnalisisDatos-
Apuntes/Regresion-Multiple.pdf
Metodología para selección de modelos de... (PDF Download Available).
Available from:
https://www.researchgate.net/publication/259822092_Metodologia_para_selecc
ion_de_modelos_de_regresion_lineal_multiple_basada_en_metodos_multiobje
tivo
http://dm.udc.es/asignaturas/estadistica2/secprac_5_2.htm