Reporte Sobre Regresión Lineal Simple

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Reporte sobre Regresión Lineal Simple.

Introducción

Al trabajar con dos variables que presentan entre sí una relación en su

comportamiento de manera tal que una de ellas podría ser, en parte, explicada por

la otra. Nos da la oportunidad de emplearlo en la relación entre el precio de dos

bienes o el ingreso comparado con el gasto que presenta un individuo.

En todo momento nuestra relación será lineal, lo que implica que sea constante en

todo el proceso de posibles valores.

Un modelo de regresión es un modelo que permite describir cómo influye una

variable 𝑥 sobre otra variable 𝑦.

𝑥: Variable independiente o explicativa o exógena

𝑦: Variable dependiente o respuesta o endógena}

Interesa cuantificar la intensidad de la relación lineal entre dos variables.

El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de

Pearson r, cuyo valor oscila entre -1 y +1.

Figura 1.
Variables
no correlacionadas (r=0)
Figura 1.1
Variables
no lineal (r=0)

Interesa cuantificar la intensidad de la relación lineal entre dos variables.

El parámetro que nos da tal cuantificación es el coeficiente de correlación lineal de

Pearson r, cuyo valor oscila entre 1 y +1.

Figura 1.2 Correlación lineal negativa y positiva

Como se observa en los diagramas anteriores, el valor se r se aproxima a +1

cuando la correlación tiende a ser lineal directa (mayores valores de x significan

mayores valores de y)
El valor de r se aproxima a -1 cuando la correlación tiende a ser lineal inversa

(mayores valores de X significan menores valores de Y)

Regresión lineal simple

Es una técnica que comprende una forma de estimación y análisis de datos

muestrales para saber sí y cómo se relacionan entre sí 2 o más variables en una

población.

Sirve para hacer posibles predicciones mediante aproximaciones; puede que no sea

exacta y se pueden visualizar mediante gráficas.

(Imagen de gráfica)

Enfoque de estudio

● Predecir el desempeño de un alumno según su desempeño en los primeros

semestres.

● Distancia de un automóvil precisa para detenerse a partir de su velocidad.

● Peso de las personas según su altura.

● Número de errores a lo largo de una semana de producción.

● Precio de una vivienda en función de su superficie.

Dada una colección de datos muestrales pareados, la línea de regresión (o línea de

mejor ajuste, o línea de mínimos cuadrados) es la línea recta que “mejor” se ajusta

al diagrama de dispersión de datos. (El criterio específico para la línea recta de

“mejor ajuste” es la propiedad de los “mínimos cuadrados”)


Un diagrama de dispersión es una gráfica en la que los pares de datos (x, y) se

trazan como puntos individuales es una cuadrícula con eje horizontal 𝑥 y eje vertical

𝑦.

La ecuación de regresión

𝑦 = 𝑏0 + 𝑏1𝑥

describe algebraicamente la línea de regresión. La ecuación de regresión expresa

una relación entre x (llamada variable explicativa, variable predictora, o variable

independiente) y 𝑦 (llamada variable de respuesta o variable dependiente).

Dos características importantes son:

● La pendiente de la recta.

● La localización de la recta en algún punto.

Objetivos de la regresión lineal

● Usar datos pareados para encontrar la ecuación de la línea de regresión.

● Encontrar el mejor valor predicho de una variable dado algún valor de la otra

variable.

Hacer predicciones

Con frecuencia, las ecuaciones de regresión son útiles para predecir el valor de una

variable, dado algún valor específico de la otra variable. Al hacer predicciones, es

necesario tener en cuenta lo siguiente:

● Modelo malo: Si la ecuación de regresión no parece ser útil para hacer

predicciones, no use la ecuación de regresión para realizarlas, Para los


malos modelos, el mejor valor predicho de una variable es simplemente su

media muestra.

● Buen modelo: Utilice la ecuación de regresión para realizar predicciones sólo

si la gráfica de la línea de regresión sobre el diagrama de dispersión confirma

que la línea de regresión se ajusta razonablemente bien a los puntos.

● Correlación: Use la ecuación de regresión para realizar predicciones sólo si el

coeficiente de correlación lineal r indica que existe una correlación lineal

entre las dos variables.

● Alcance: Utilice la línea de regresión para realizar predicciones sólo si los

datos no van más allá del alcance de los datos muestrales disponibles. (La

predicción fuera del alcance de los datos muestrales disponibles se llama

extrapolación, y podría dar lugar a predicciones erróneas).

Residuos y propiedad de los mínimos cuadrados

Se ha establecido que la ecuación de regresión representa la línea recta que “mejor”

se ajusta a los datos. El criterio para determinar la línea que es mejor que todas las

demás se basa en la distancias verticales entre los puntos de datos originales y la

línea de regresión. Tales distancias se denominan residuos.

Definición

Para un par de valores muestrales 𝑥 y 𝑦, el residuo es la diferencia entre el valor

muestral observado de 𝑦 y el valor de 𝑦 que se predice usando la ecuación de

regresión. Es decir, Residuo = 𝑦 observada - 𝑦 predicha = 𝑦 - 𝑦


Figura 1. Residuos y cuadrados de los residuos

En la Figura 1. se observa que los residuos son -5, 11, -13 y 7, por lo que la suma

de cuadrados es

2 2 2 2
(− 5) + 11 + (− 13) + 7 = 364

Podemos visualizar la propiedad de mínimos cuadrados haciendo referencia a la

Figura 1. donde los cuadrados de los residuos se representan mediante las áreas

cuadradas sombreadas. La suma de estas áreas es 354, que es la suma más

pequeña posible. Al usar cualquier otra línea recta, los cuadrados sombreados se

combinarán para producir un área más grande que el área combinada de 364.
Referencias

1. Triola, M. F., Lossi, L., & Murrieta Murrieta, J. E. (2018). Estadística (12a ed.).

Pearson.

2. Charles Henry, B. & Brase, C. P. (2019). Estadística básica.. Cengage Learning.

https://libcon.rec.uabc.mx:6012/es/ereader/uabc/120157?page=13

También podría gustarte