Regresión Lineal

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

REGRESIÓN LINEAL

1.-Diagrama de Esparcimiento

Es una ilustración gráfica que se utiliza en el análisis de regresión está constituido por una dispersión de puntos
tal que cada punto representa un valor de la variable independiente (medido a lo largo del eje horizontal) y un
valor asociado de la variable dependiente (medido a lo largo del eje vertical). Se le conoce con el nombre de
nube de puntos o diagrama de dispersión.
La construcción del diagrama de esparcimiento constituye el primer paso para investigar la relación existente
entre dos variables, la posición y forma de esta nube proporciona la idea del tipo de relación existente entre dos
variables, de este modo se facilita la elección de la correspondiente función matemática.

GRÁFICO Nº 1.1 DIAGRAMAS DE ESPARCIMIENTO PARA DATOS BIDIMENSIONALES

Ahora bien, graficada y visualizada la forma del diagrama de esparcimiento, interesa analizar y expresar el tipo
de relación entre las variables. Para expresar esta relación se elige una función matemática que mejor
represente o se ajuste al diagrama de esparcimiento.
1.1. Regresión

Es el método estadístico que investiga y define la relación funcional entre dos o más variables

1.2. Función o Modelo de Regresión

Ecuación matemática que representa el modelo estadístico correspondiente.

1.3. Regresión Lineal

EI propósito de la regresión lineal es estimar la relación que existe entre dos variables X y Y, se expresa: Y = f(x)
“Y depende de X”

1.3.1. Variable Independiente.

Es la variable cuyo valor se supone conocido y se utiliza para predecir o explicar el valor de otra variable de
interés, se simboliza por X. se le conoce con los nombres: VARIABLE EXPLICATORIA, VARIABLE PREDICTORIA.
VARIABLE REGRESORA, VARIABLE CONTROL O ESTIMULO.

1.3.2. Variable Dependiente.

Es la variable cuyo valor se supone desconocido y que se explica o predice con ayuda de otra variable, se
simboliza por Y, recibe los nombres: VARIABLE EXPLICATIVA, VARIABLE PREDECIDA, VARIABLE REGRESANDO O
VARIABLE RESPUESTA.

1.3.3. Ajuste de una Función de Regresión

Ajustar una función de regresión significa buscar o definir la función que exprese con mayor precisión la
relación entre variables. Gráficamente será aquella función que mejor se adecue a la nube de puntos.

EI problema de ajuste de una función de regresión a un conjunto de n valores (X,Y), comprende tres pasos:
1. Graficar el diagrama de esparcimiento o nube de puntos.
2. Definir la forma de la función de regresión (recta, parábola, exponencial, etc.)
3. Determinar el valor numérico de los parámetros de la función elegida.

1.3.4. Método de Mínimos Cuadrados

Técnica empleada para llegar a la ecuación de regresión minimizando la suma de los cuadrados de las
distancias verticales entre los valores verdaderos y los valores pronosticados Y.
1.5. Regresión Simple Lineal

1.5.1. Ecuación de Regresión


Expresión matemática que define la relación entre dos variables. Se le denomina también ecuación de
estimación o ecuación de pronóstico
1.5.2. Ajuste en una función de regresión simple

Significa buscar o definir la función que exprese con mayor precisión la relación entre la variable .Gráficamente
será aquella función que mejor se adecue a la nube de puntos En este sentido ,es recomendable como primer
paso construir el “diagrama o nube de puntos “,luego analizar su forma y decidir el tipo de función
matemática para la línea de regresión.
Analíticamente, la relación 𝑌̂=f(x), permite obtener valores estimados 𝑌̂ a partir de los valores reales de X
,entonces el problema de ajuste de una función es la que la diferencia o sesgo (𝑒1 ) entre los valores reales de Y
y los estimados 𝑌̂ sea mínimo, para cada valor se tendría :e= Y- 𝑌̂.Entonces se trata de un problema de
minimización, el mismo que se resuelve con el Método de los Mininos Cuadrados .
El ajuste de funciones de regresión simple, se puede utilizar diversas funciones matemática conocida, tales
como:

• La línea Recta : 𝑌̂=a + bx


• La Parábola : 𝑌̂=a + bx +c𝑥 2
• La Curva Potencial: 𝑌̂=b𝑥 𝑎
• La Curva Exponencial 𝑌̂= a𝑏 𝑥
𝑎
• La Hipérbola Equilátera 𝑌̂=𝑥
1
• La Curva Logística 𝑌̂
= a + b𝑐 𝑥
• La Curva Gompertz 𝑌̂=a𝑏 𝑐𝑥

Cada una de estas funciones tiene una forma particular para un conjunto determinado de valores (X, Y) y
definido por el valor de los parámetros o coeficientes de la respectiva ecuación. Por una nube de puntos puede
pesar una infinidad de líneas o funciones de esa familia habrá una que es la función que mejor se ajusta a la
nube de puntos.

La operación parea determinar la función de regresión óptima, se conoce como “ajuste de una función de
regresión”.
El problema de ajuste de una función de regresión a un conjunto de n valores (X, Y) comprende tres pasos:

1°Graficar el diagrama de esparcimiento o una nube de puntos (X, Y).


2°Definir la forma de la función de regresión (recta, parábola, exponencial, etc.)
3°Determinar el valor numérico de los parameros de la función elegida.

REGRESIÓN LÍNEA SIMPLE

A regresión lineal se le conoce como Regresión de la recta, la que se define de la siguiente manera:

Y = a + b(x)± e

A partir de esta definición; se puede estimar el valor de “Y”, no considerando el error

𝑌̂=a + b(X)

En la ecuación, los parámetros son:

a=Origen (Es el valor de 𝑌̂,cuando x=0)


b= Pendiente (Es la variación constante o negativa de 𝑌̂,por cada valor que cambie X)

Tales parámetros, como se ha mencionado en el ítem anterior, se calcularán utilizando el método por mínimos
cuadrados, que se define basado en la ecuación de la recta, de la siguiente manera.

∑ 𝑌=a(n) +b ∑ 𝑥

∑ 𝑋𝑌=a∑ 𝑥 +b ∑ 𝑥 2

Para hallar los parámetros respectivos (a y b), basados en el método de cálculo por mínimo cuadrado, el alumno
puede utilizar cualquiera de las siguientes soluciones.

a) Solución por eliminación de uno de los parámetros para encontrar el otro.:


Para este caso utiliza las ecuaciones simultaneas, en donde con un valor artificial negativo se iguala el
coeficiente de una de las incógnitas de la ecuación para eliminarlos. Operación que se repite hasta quedarse
con una incógnita, que es fácil de despejar en una ecuación.
b) Solución a través de matrices y determinantes, que concluye en:
∑ 𝑌 ∑ 𝑋 2 −∑ 𝑋𝑌 ∑ 𝑋 𝑛 ∑ 𝑋𝑌−∑ 𝑋 ∑ 𝑌
a= 𝑛 ∑ 𝑥 2 −∑ 𝑋 ∑ 𝑋
b= 𝑛 ∑ 𝑋 2 −∑ 𝑋 ∑ 𝑋

c) Solución a través de las medias, que concluye en

a = 𝑌̂ - b 𝑋̅ b= [(∑ 𝑋𝑌 − 𝑛𝑋̅ 𝑌̅ ) /(∑ 𝑋 2 − 𝑛𝑋̅ 2 ]

Ejercicios
1.-Hallar la ecuación de la recta con las variables :X (números de vendedores) e Y (valor de ventas realizadas al
mes en miles). La información que se tiene es la siguiente:

Números de vendedores(X) 2 4 5 10 12 15 16
Venta en miles (Y) 6,4 8,5 9,3 16,4 18,6 20,2 25,2

Solución:

Con el método de mínimos cuadrados, primero se calculan las sumatorias correspondientes a la ecuación de la
recta:

X Y XY 𝑥2
2 6,4
4 8,5
5 9,3
10 16,4
12 18,6
15 20,2
16 25,2

2.-Hallar la ecuación de la recta con las variables :X (números de gastos por inversión) e Y (utilidades anuales en
miles). La información que se tiene es la siguiente:

Números de gastos por 5 11 4 5 3 2


inversión (X)
Utilidades anuales en miles s 31 40 30 34 25 20
(Y)
REGRESIÓN DE LA PARÁBOLA

Se conoce a la regresión de la parábola como regresión Parabólica que se define:

Y = a + b(x) +𝑐(𝑥 2 ) ±e

A partir de esta definición, se puede estimar el valor de Y, no considerando el error

𝑌̂=a + b(X) +𝑐(𝑥 2 )

En la ecuación, los parámetros son:


a = origen (Es el valor 𝑌̂ cuando x=0)
b= Pendiente ( es la variación constante positiva (hacia arriba ) o negativa (hacia abajo ) de 𝑌̂ ,por cada valor
que cambie x).

c=Curvatura (es el arco que determina la curva; si es negativa, la curva es convexa y si es positivo, la curva es
cóncava.

Tales parámetros, se calculará utilizando el método de minios cuadrados que se define basado en la ecuación de
la parábola de la siguiente manera:

∑ 𝑌=a (n) +b ∑ 𝑋+ c ∑ 𝑋 2

∑ 𝑋𝑌=a∑ 𝑋 +b ∑ 𝑋 2 + c ∑ 𝑋 3

∑ 𝑋 2 𝑌=a∑ 𝑋 2 +b ∑ 𝑋 3 + c ∑ 𝑋 4

EJERCICCIOS

1.-Hallar la ecuación de la parábola con las variables :X (números de vendedores) e Y (valor de ventas realizadas
al mes en miles). La información que se tiene es la siguiente:

Números de vendedores(X) 2 4 5 10 12 15 16
Venta en miles (Y) 6,4 8,5 9,3 16,4 18,6 20,2 25,2

Solución:

Con el método de mínimos cuadrados, primero se calculan las sumatorias correspondientes a la ecuación de la
recta:

X Y XY 𝑥2 𝑥3 𝑥4 𝑥2𝑌
2 6,4
4 8,5
5 9,3
10 16,4
12 18,6
15 20,2
16 25,2

También podría gustarte