Regresión Lineal Multiple
Regresión Lineal Multiple
Regresión Lineal Multiple
1. DATOS ATÍPICOS
Los valores atípicos pueden deberse a errores en la recolección de datos validos que
muestran un comportamiento diferente, pero reflejan la aleatoriedad de la variable en
estudio. Es decir, valores que pueden haber aparecido como parte del proceso, aunque
parezca extraño. Si los valores atípicos son parte del proceso, deben conservarse. En
cambio, si ocurren por algún tipo de error (medida confiable…) lo adecuado es su
eliminación.
CAUSAS COMUNES DE LOS VALORES ATÍPICOS
Los valores atípicos a veces son subjetivos y existen numerosos métodos para clasificarlos.
La detención de valores atípicos se puede realizar a nivel univariante usando gráficos
sencillos como histogramas o diagramas de caja y bigotes. A nivel bivariante se puede
localizar mediante análisis de dispersión o análisis de los residuos. En el ámbito
multivariante se puede descubrir los valores atípicos mediante un análisis de la matriz de
residuos
El método más habitual por su sencillez y resultado es el test de tukey que toma como
referencia la diferencia entre el primer cuartil (Q1 ) y el tercer cuartil (Q 3 ), o rango
intercuartilico. En un diagrama de caja se considera un valor atípico el que se encuentra
1.5 veces esa distancia de uno de esos cuartiles (atípico leve) o a 3 veces esa distancia
(atípico extremo). Se trata de un método paramétrico que supone que la población es
normal
Los modelos lineales múltiples siguen la siguiente ecuación:
Dónde:
𝛽0 = 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑜
VNE = Y t Y − β̂t X t Y
7. VARIANZA
Se descompone la variabilidad de la variable dependiente (y) en dos componentes o
fuentes de variabilidad una componente va a representar la variabilidad explicada por el
modelo de regresión y la otra componente va a representar la variabilidad no explicada por
el modelo y por tanto atribuye a factores aleatorios
n
nσ = ∑(yi − y̅)2
2
i=1
Es decir, la variabilidad de (y) es la suma de cuadrática de los valores que toma la variable
respecto a la media de la variable
Sumando y restando el valor pronosticado por el modelo de regresión obtenemos la
siguiente expresión
n n n