Regresión Lineal
Regresión Lineal
Regresión Lineal
1.-Diagrama de Esparcimiento
Es una ilustración gráfica que se utiliza en el análisis de regresión está constituido por una dispersión de puntos
tal que cada punto representa un valor de la variable independiente (medido a lo largo del eje horizontal) y un
valor asociado de la variable dependiente (medido a lo largo del eje vertical). Se le conoce con el nombre de
nube de puntos o diagrama de dispersión.
La construcción del diagrama de esparcimiento constituye el primer paso para investigar la relación existente
entre dos variables, la posición y forma de esta nube proporciona la idea del tipo de relación existente entre dos
variables, de este modo se facilita la elección de la correspondiente función matemática.
Ahora bien, graficada y visualizada la forma del diagrama de esparcimiento, interesa analizar y expresar el tipo
de relación entre las variables. Para expresar esta relación se elige una función matemática que mejor
represente o se ajuste al diagrama de esparcimiento.
1.1. Regresión
Es el método estadístico que investiga y define la relación funcional entre dos o más variables
EI propósito de la regresión lineal es estimar la relación que existe entre dos variables X y Y, se expresa: Y = f(x)
“Y depende de X”
Es la variable cuyo valor se supone conocido y se utiliza para predecir o explicar el valor de otra variable de
interés, se simboliza por X. se le conoce con los nombres: VARIABLE EXPLICATORIA, VARIABLE PREDICTORIA.
VARIABLE REGRESORA, VARIABLE CONTROL O ESTIMULO.
Es la variable cuyo valor se supone desconocido y que se explica o predice con ayuda de otra variable, se
simboliza por Y, recibe los nombres: VARIABLE EXPLICATIVA, VARIABLE PREDECIDA, VARIABLE REGRESANDO O
VARIABLE RESPUESTA.
Ajustar una función de regresión significa buscar o definir la función que exprese con mayor precisión la
relación entre variables. Gráficamente será aquella función que mejor se adecue a la nube de puntos.
EI problema de ajuste de una función de regresión a un conjunto de n valores (X,Y), comprende tres pasos:
1. Graficar el diagrama de esparcimiento o nube de puntos.
2. Definir la forma de la función de regresión (recta, parábola, exponencial, etc.)
3. Determinar el valor numérico de los parámetros de la función elegida.
Técnica empleada para llegar a la ecuación de regresión minimizando la suma de los cuadrados de las
distancias verticales entre los valores verdaderos y los valores pronosticados Y.
1.5. Regresión Simple Lineal
Significa buscar o definir la función que exprese con mayor precisión la relación entre la variable .Gráficamente
será aquella función que mejor se adecue a la nube de puntos En este sentido ,es recomendable como primer
paso construir el “diagrama o nube de puntos “,luego analizar su forma y decidir el tipo de función
matemática para la línea de regresión.
Analíticamente, la relación 𝑌̂=f(x), permite obtener valores estimados 𝑌̂ a partir de los valores reales de X
,entonces el problema de ajuste de una función es la que la diferencia o sesgo (𝑒1 ) entre los valores reales de Y
y los estimados 𝑌̂ sea mínimo, para cada valor se tendría :e= Y- 𝑌̂.Entonces se trata de un problema de
minimización, el mismo que se resuelve con el Método de los Mininos Cuadrados .
El ajuste de funciones de regresión simple, se puede utilizar diversas funciones matemática conocida, tales
como:
Cada una de estas funciones tiene una forma particular para un conjunto determinado de valores (X, Y) y
definido por el valor de los parámetros o coeficientes de la respectiva ecuación. Por una nube de puntos puede
pesar una infinidad de líneas o funciones de esa familia habrá una que es la función que mejor se ajusta a la
nube de puntos.
La operación parea determinar la función de regresión óptima, se conoce como “ajuste de una función de
regresión”.
El problema de ajuste de una función de regresión a un conjunto de n valores (X, Y) comprende tres pasos:
A regresión lineal se le conoce como Regresión de la recta, la que se define de la siguiente manera:
Y = a + b(x)± e
𝑌̂=a + b(X)
Tales parámetros, como se ha mencionado en el ítem anterior, se calcularán utilizando el método por mínimos
cuadrados, que se define basado en la ecuación de la recta, de la siguiente manera.
∑ 𝑌=a(n) +b ∑ 𝑥
∑ 𝑋𝑌=a∑ 𝑥 +b ∑ 𝑥 2
Para hallar los parámetros respectivos (a y b), basados en el método de cálculo por mínimo cuadrado, el alumno
puede utilizar cualquiera de las siguientes soluciones.
Ejercicios
1.-Hallar la ecuación de la recta con las variables :X (números de vendedores) e Y (valor de ventas realizadas al
mes en miles). La información que se tiene es la siguiente:
Números de vendedores(X) 2 4 5 10 12 15 16
Venta en miles (Y) 6,4 8,5 9,3 16,4 18,6 20,2 25,2
Solución:
Con el método de mínimos cuadrados, primero se calculan las sumatorias correspondientes a la ecuación de la
recta:
X Y XY 𝑥2
2 6,4
4 8,5
5 9,3
10 16,4
12 18,6
15 20,2
16 25,2
∑
2.-Hallar la ecuación de la recta con las variables :X (números de gastos por inversión) e Y (utilidades anuales en
miles). La información que se tiene es la siguiente:
Y = a + b(x) +𝑐(𝑥 2 ) ±e
c=Curvatura (es el arco que determina la curva; si es negativa, la curva es convexa y si es positivo, la curva es
cóncava.
Tales parámetros, se calculará utilizando el método de minios cuadrados que se define basado en la ecuación de
la parábola de la siguiente manera:
∑ 𝑌=a (n) +b ∑ 𝑋+ c ∑ 𝑋 2
∑ 𝑋𝑌=a∑ 𝑋 +b ∑ 𝑋 2 + c ∑ 𝑋 3
∑ 𝑋 2 𝑌=a∑ 𝑋 2 +b ∑ 𝑋 3 + c ∑ 𝑋 4
EJERCICCIOS
1.-Hallar la ecuación de la parábola con las variables :X (números de vendedores) e Y (valor de ventas realizadas
al mes en miles). La información que se tiene es la siguiente:
Números de vendedores(X) 2 4 5 10 12 15 16
Venta en miles (Y) 6,4 8,5 9,3 16,4 18,6 20,2 25,2
Solución:
Con el método de mínimos cuadrados, primero se calculan las sumatorias correspondientes a la ecuación de la
recta:
X Y XY 𝑥2 𝑥3 𝑥4 𝑥2𝑌
2 6,4
4 8,5
5 9,3
10 16,4
12 18,6
15 20,2
16 25,2
∑