Regresión Lineal PYE

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

PROBABILIDAD Y ESTADÍSTICA

Escuela: Universidad Politécnica del Centro

Integrantes:
 ALFONSO MARES HILDA DEL CARMEN-004036
 CASTELLANOS JIMÉNEZ JOSÉ DAVID-004043
 LEÓN ORTÍZ ALEXIS DE JÉSUS-003054
 MAGAÑA LÁZARO FERNANDA-004068
https://www.youtube.com/watch?v=IShnM9GvR60

Catedrático: Ing. Geofísica Petrolera


Camacho Morales Alejandro Grado y grupo: G-1 “6” Villahermosa, Tab; 12 de Julio de 2021
Introducción a la regresión lineal
En la práctica a menudo se requiere resolver problemas que
implican conjuntos de variables de las cuales se sabe que
tienen alguna relación inherente entre sí.

Un variable independiente es una variable que representa


una cantidad que se modifica en un experimento.

A menudo X es la variable que se utiliza para representar la


variable independiente en una ecuación.

Una variable dependiente representa una cantidad cuyo


valor depende de cómo se modifica la variable
independiente.

A menudo Y es la variable que se utiliza para representar la


variable dependiente en una ecuación.
La relación lineal
Una forma razonable de relación entre la respuesta Y y el regresor X.

Análisis de regresión
El concepto de análisis de regresión se refiere a encontrar la mejor
relación entre Y y X

Regresión
simple

Regresión
múltiple
Β0: Es la intersección
Β1: Es la pendiente.
Una relación lineal
El modelo de regresión lineal simple (RLS)

Si la relación es exacta y no contiene ningún componente aleatorio o probabilístico,


entonces se trata de una relación determinista entre dos variables científicas.

Hemos limitado el uso del término análisis de regresión a los casos en los que las relaciones
entre las variables no son deterministas, es decir, no son exactas.

En otras palabras, debe existir un componente aleatorio en la ecuación que relaciona las
variables. Este componente aleatorio toma en cuenta consideraciones que no son medibles
o, de hecho, que los científicos o los ingenieros no comprenden

Un análisis de la relación entre X y Y requiere el planteamiento de un modelo


estadístico
El modelo debe incluir al conjunto {(xi , yi ); i = 1, 2,..., n} de datos que implica n pares de valores (x, y). La
base para el uso de un modelo estadístico se relaciona con la manera en que la variable aleatoria Y cambia
con X y el componente aleatorio.

La respuesta Y se relaciona con la variable independiente x a través de la ecuación.

La cantidad , que a menudo recibe el nombre de error aleatorio o alteración aleatoria, tiene varianza
constante. Es común que a esta parte se le denomine suposición de varianza homogénea.

Si E() = 0 implica que para una x específica, los valores de y se distribuyen


alrededor de la recta verdadera o recta de regresión de la población y = β0 +
β1 x.

Si se elige bien el modelo y la aproximación lineal es buena dentro de los


rangos de los datos, entonces son razonables los errores positivos y negativos
que rodean a la regresión verdadera.
La recta de regresión ajustada

Un aspecto importante del análisis de regresión es, en términos sencillos, estimar los parámetros β0 y
β1 , es decir, estimar los llamados coeficientes de regresión.

Diagrama de dispersión con rectas de regresión.

En el diagrama de dispersión de la figura ilustra la recta de regresión ajustada y una recta hipotética
de regresión verdadera.
MÉTODO DE MÍNIMOS CUADRADOS
𝑦𝑟
Es un método que permite ajustar una recta de regresión estimada a una muestra de
𝑦𝑒
datos u observaciones tomadas y denotadas por las variables x y y. Lo cual permite el
ෝ = 𝒃𝟎 + 𝒃𝟏 𝒙
cálculo de los valores pronosticados a partir de la recta ajustada: 𝒚

Residual: es el error de ajuste del modelo 𝑦ො = 𝑏0 + 𝑏1 𝑥. Fig. Gráfico con error en regresión lineal

Dado un conjunto de datos de regresión {(𝑥𝑖 , 𝑦𝑖 , ); i=1,2,…,n} y un modelo ajustado

𝑦ෝ𝑖 = 𝑏0 + 𝑏1 𝑥, el i-énesimo residual 𝑒𝑖 es dado por: 𝒆𝒊 = 𝒚𝒊 - 𝒚ෝ𝒊 , i=1,2,…,n.

 Para un conjunto de n residuales grande el ajuste del modelo no es bueno.


 Los residuales pequeños indican un ajuste adecuado.

Fig. Gráfico con todos los errores en


regresión lineal
MÉTODO DE MÍNIMOS CUADRADOS Ejemplo: Se desea predecir la nota en función de la cantidad de horas a la
semana que se estudió para un examen. Para ello se tomó una muestra de 6
alumnos, cuyos resultados se muestran en el siguiente tabla. A) Estime la recta
Este método consiste en minimizar la suma de los de regresión lineal.
cuadrados de los errores:

Horas de Notas (y) 1.De acuerdo a las fórmulas se debe


estudio (x) calcular la sumatoria de los valores totales
de x, y, x*y y x^2
3 8

Debemos calcular b0 y b1 , los estimados de β0 y β1 , 6 10 Horas de Notas (y) X*Y X^2


estudio (x)
de manera que la suma de los cuadrados de los 8 15
residuales sea mínima mediante la estimación de los 2 8 3 8 24 9
coeficientes de regresión. 6 10 60 36
1 5
6 12 8 15 120 64

Tabla 1 de las notas que 2 8 16 4


obtuvieron 6 alumnos.
1 5 5 1
6 12 72 36
𝛴 = 26 58 297 150

Tabla 2 con valores de x y y de acuerdo al método de SSC.


5.Graficar la recta de regresión lineal estimada.
16
14 y = 1.2232x + 4.3661
12
10

Nota
2.Sustituir los siguientes datos en las fórmulas dadas. 8
6
6 6 6 6 4
2 2
෍ 𝑋𝑖 = 26 ෍ 𝑌𝑖 = 58 ෍ 𝑋𝑖 ∗ 𝑌𝑖 ∗= 297 ෍ 𝑋𝑖 = 150
0
𝑖=1 𝑖=1 𝑖=1 𝑖=1 0 2 4 6 8 10
Horas de estudio
3.Sustituiyendo.
Fig. Gráfica dela recta de regresión lineal estimada
6 297 − 26 (58) 274
𝑏1 = 𝑏1 = 224= 1.2232
6 150 −(26)2
El coeficiente de regresión nos da información sobre el
58 −(1.2232)(26) 26.1968
𝑏0 = 𝑏0 = = 4.36 comportamiento de la variable Y frente a la variable X, de
6 6
manera que:
4.La recta de regresión estimada esta dada por: a) Si 𝑏𝑥/𝑦 = 0 , para cualquier valor de X la variable Y
es constante.
ෝ = 𝟒. 𝟑𝟔 + 𝟏. 𝟐𝟐𝟑𝟐𝒙
𝒚
b) Si 𝑏𝑥/𝑦 > 0 , si aumenta X, también aumenta Y.
c) Si 𝑏𝑥/𝑦 <0 , si aumenta X, el valor de Y disminuye.
CONCEPTO DE LOS ESTIMADORES
Un estimador es un estadístico que intenta predecir el valor de algún parámetro de cierta población, es
decir, se quiere generalizar el resultado obtenido en la muestra para toda la población.
PROPIEDADES DE LOS ESTIMADORES
Estimadores de mínimos cuadrados tanto para β0 como para β1 son
Insesgado: la media de su insesgados.
distribución muestral es igual al
parámetro de su población.

Eficiente: el que tenga la varianza


más pequeña. La varianza del error 𝜎 2 ,refleja una variación aleatoria del error
experimental alrededor de la recta de regresión.

Consistente: a medida que n


aumenta, el valor estadístico se
aproxima al valor del parámetro.

El error cuadrado medio, describe un tipo de media (división


Suficiente: cuando ningún otro entre n – 2) de los residuales cuadrados.
estimador puede proporcionar mas
información sobre el parámetro.
Inferencias sobre los coeficientes de regresión
Además de tan sólo estimar la relación lineal entre X y Y para fines de predicción, el experimentador podría estar interesado en hacer ciertas inferencias acerca
de la pendiente y la intersección.

Los estimadores β0 + β1 dependen de la muestra seccionada, por lo tanto son variables aleatorias y presentan una distribución de probabilidad.

Es importante tener en cuenta el efecto de la variable independiente para la variable


dependiente, es equivalente a contrastar si el coeficiente β1 , es o no significativamente
diferente de cero.
Estas distribuciones de probabilidad de los
estimadores pueden utilizarse para construir
Un β1 =0 Implicaría la ausencia de relación lineal entre las variables.
intervalos de confianza o contrastes sobre los
parámetros del modelo de regresión. Contrastes para β1

 Hasta ahora solo hemos obtenido


estimaciones puntuales de los coeficientes de
regresión.
 Usando intervalos de confianza podemos
obtener una medida de la precisión de dichas
estimaciones.
 Usando contrastes de hipótesis podemos  SSxx= (x-x)2
comprobar si un determinado valor puede ser  SSyy=(x-y)2
el autentico valor del parámetro.
 SSxy=(x-x)(y-y)
Intervalo de confianza para β1

Queremos ahora obtener el intervalo de confianza para β1 de nivel 1 – α .


Como α2 es desconocida, la estimamos con s2e.

Que nos permite obtener el intervalo de confianza para β1


Ejemplo

El inventor de un nuevo material aislante quiere determinar la magnitud de la compresión


(Y) que se producirá en una pieza de 2 pulgadas de espesor cuando se somete a diferentes
cantidades de presión (x).Para ello prueba 5 piezas de material bajo diferentes presiones.
La longitud del intervalo disminuirá si:
Los pares de valores observados (x,y) se muestran en la siguiente tabla:
 Aumenta el tamaño de la muestra.

 Aumenta la varianza de las xi

 Disminuye la varianza residual

𝑆𝐶𝐸 𝑥−𝑥 2
𝑆𝑒 = √ 𝑆𝑥2 =
𝑛−2 𝑛−1

Vamos a contrastar si el efecto de la presión sobre la compresión es o no significativo ( a=0.05)


Ejemplo

Ejemplo

SSxx= (x-x)2
SSyy=(x-y)2
SSxy=(x-x)(y-y)

𝛽1 = 0.7

𝛽0 = 𝑦 − − 𝛽1𝑥 − 𝛽0 = 2 − 0.7 ∗ 3 𝛽0 = −0.1


𝑆𝑆𝑌𝑌 − 𝛽1𝑆𝑆𝑥𝑦 𝛽1 − 𝑏1
𝑆𝑅2 = 𝑡=
𝑛−2 𝑆𝑅2/𝑆𝑆𝑥𝑥
0.7−0
6− 0.7 ∗7 𝑡= 0.267/10
=3.7
𝑆𝑅2 = = 0.367
3

𝑡0.975.3 = 3.18
Y=-0.1 + 0.7x
𝑆𝑆𝑥𝑥 = 10 3.7>3.18
Predicción
Recordemos que el modelo ajustado de la recta de regresión es y=. Β0+ β1. Ejemplo: Predecir el valor en la compresión para un nivel de presión igual a 6
E[Y/X=x]= β0+ β1x, puede interpretarse como:

1. Predicción del valor que tomara y cuando X=x


2. Como la estimación del valor medio en Y para el valor X=x

Ambas cantidades están sujetas a incertidumbre, que será tanto mayor


cuanto peor sea el ajuste realizado mediante la recta de regresión.
La recta de regresión ajustada era Y=-0.1+0.7X,
Establecemos entonces. Un intervalo de confianza estas cantidades
Con lo cual para un x=6, se predice un valor de Y
Proposición: podemos decir que con un (1-a)x100% de confianza que
cuando X=x, el valor predicho en Y o el valor medio estimado en Y, Y=-0.1+0.7*6= 4.1
E[Y/X=x], se encuentran en el intervalo.
REFERENCIAS BIBLIOGRÁFICAS

 Cardona Madariaga, D. F. (s. f.). Inferencia estadística Módulo de regresión lineal simple. Facultad de Administración. Recuperado 9 de julio de 2021, de

https://www.urosario.edu.co/Administracion/documentos/Documentos-de-Investigacion/BI_147-Web.pdf

 Liliana Orellana. (2008). Análisis de regresión lineal simple. UBA. http://www.dm.uba.ar/materias/estadistica_Q/2011/1/clase%20regresion%20simple.pdf

 M. Carmen Carollo Limeres. (2011–2012). Regresión lineal simple. Universidad de Santiago de Compostela.

http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-DPTO/MATERIALES/Mat_50140116_Regr_%20simple_2011_12.pdf

 RONALD E. WALPOLE, RAYMOND H. MYERS, SHARON L. MYERS, & KEYING YE. (2012). Probabilidad y estadística para ingenierías y ciencias

(Novena edición, Vol. 1). pe. https://vereniciafunez94hotmail.files.wordpress.com/2014/08/8va-probabilidad-y-estadistica-para-ingenier-walpole_8.pdf

También podría gustarte