Regresion Lineal Multiple

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 13

Nombre de la Licenciatura: Administración de empresas

Nombre de la Materia: ESTADISTICA II

Nombre del alumno(a): DIAZ HERNANDEZ ANGEL ADRIAN


LOPEZ POOT AXEL ISRAEL

Número de control: 17530154


20530074

Nombre de la tarea: REGRESION LINEAL MULTIPLE

Unidad #:2

Nombre del profesor (a): Efraín Briones Castro

Fecha:19 DE OCTUBRE DEL 2023

Ejemplo de aplicación del análisis de regresión múltiple con software

1
Considere un estudio diseñado para examinar el papel que juega la televisión en la
vida de un grupo preseleccionado de personas de edades superiores a los 65 años. El
propósito de dicho estudio es proporcionar información que permita hacer una
programación adecuada a las necesidades de este grupo. Una muestra de n=25
personas mayores, de edades superiores a los 65 años fue seleccionada y a cada
persona le fue solicitada la siguiente información:

• Y= el número promedio de horas diarias que pasa frente al televisor.  X1= su


estado civil (X1= 1 si vive con su cónyuge y X1=0 si no)
• X2= su edad
• X3= escolaridad del entrevistado en número de años de asistencia a la escuela.

Horas Estado civil Edad Escolaridad


Individuo
Y X1 X2 X3
1 0.5 1 73 14
2 0.5 1 66 16
3 0.7 0 65 15
4 0.8 0 65 16
5 0.8 1 68 9
6 0.9 1 69 10
7 1.1 1 82 12
8 1.6 1 83 12
9 1.6 1 81 12
10 2 0 72 10
11 2.5 1 69 8
12 2.8 0 71 16
13 2.8 0 71 12
14 3 0 80 9
15 3 0 73 6
16 3 0 75 6
17 3.2 0 76 10
18 3.2 0 78 6
19 3.3 1 79 6
2
20 3.3 0 79 4
21 3.4 1 78 6
22 3.5 0 76 9
23 3.6 0 65 12
24 3.7 0 72 12
25 3.7 0 80 6

Encuentre la ecuación de predicción de mínimos cuadrados para los datos de la tabla


anterior:

Excel

Deberá de tener activado el complemento de análisis de datos, ubicado en la pestaña


de datos de la barra de herramientas.

En caso de no tenerlo activado, de clic al botón de office, opciones de Excel y


complementos y active herramientas de datos:

3
Una vez activado el complemento para encontrar la ecuación de predicción siga los
siguientes pasos:

a) Capture los datos correctamente en una hoja de trabajo de Excel.


b) En la pestaña de Datos de la derecha, sele Análisis de datos a su vez en la
ventana desplegada la opción: regresión
c) En la ventana de regresión para "Rango Y de entrada" seleccione la columna de
los datos de la variable independiente o de respuesta y para "Rango X de entrada",
las columnas de sus variables predictoras o independientes.
d) De clic al botón aceptar.

El resultado del análisis que arroja Excel es el siguiente:

4
En la pantalla anterior podemos identificar los coeficientes de β0, β1, β2, y β3 por lo
tanto:

Y = β 0 + β 1X1 + β 2X2 + β 3X3

Y = 1.495 - 1.176X1 + 0.039X2 - 0.152X3……ecuación de predicción para la tabla de


datos.

Para este modelo particular, β0, β1, β2, β3 representan el cambio en el valor esperado
de Y, por un cambio unitario en X1, X2, X3. Por ejemplo, β2= 0.039 es el cambio medio
estimado en el tiempo que se pasa diario frente al televisor si la edad X 2 del
entrevistado aumenta un año. El coeficiente β1 de la variable indicadora X1 representa
la diferencia en tiempos medios pasados frente al televisor entre entrevistados que
viven con su cónyuge y aquellos que viven solos. El estimador de β 1 es - 1.176 horas.
Esto es, se estima que los entrevistados que viven solos (X 1=0) ven en promedio
1.176 horas más al día que los que viven con su cónyuge (X1=1).

Coeficiente de correlación múltiple y de determinación

5
En la pantalla de resultados de Excel del análisis de regresión aparece el resumen de
las estadísticas, por ejemplo:

Estadísticas de la regresión

Coeficiente de correlación múltiple 0.79097037


Coeficiente de determinación R^2 0.625634126

El coeficiente de correlación múltiple (R) es la generalización del coeficiente de


correlación simple r. Observe que R= 0.79097037 para el ejemplo del estudio de la
televisión.

El segundo renglón del listado, llamado R cuadrada, da el valor del coeficiente de


determinación múltiple R2, cuyo valor es de 0.625634126. Este último valor es de más
fácil interpretación. Al igual que r2, R2 toma valores en un intervalo de:

0 ≤ R2 ≤ 0

Un valor pequeño de R2 quiere decir que las variables X1, X2,….., Xk o t i u e o po a


información para la predicción de Y; un valor de R 2 cercano a 1 quiere decir que X1,
….., Xk proporcionan casi toda la información necesaria para la predicción de Y.

En el caso de R2 para el estudio de televisión su resultado de 0.6256 nos dice que solo
el 62.56% de la variación total de los valores de Y en relación a su promedio, puede
ser explicada por medio del modelo. El resto, un 37.44%, queda no explicado.
El ajuste relativamente pobre de este modelo puede deberse quizás a que "Y" el
promedio de horas diarias pasadas frente al televisor, sea una función de muchas
otras variables, por ejemplo podría haberse incluido la variable Xa que mide la afición
del entrevistado a la lectura y una variable indicatoria Xs que valga 1 si el entrevistado
trabaja y O si no trabaja.
Se puede pensar en otras variables o incluso otro modelo de predicción.

6
Uso de la ecuación de predicción

En la mayoría de las investigaciones en negocios, resulta ser de mucha importancia el


uso de toda la ecuación de predicción. La ecuación de predicción puede ser de valor
en tres formas:

1. Puede utilizarse para estimar el valor medio de Y para valores dados de dos
variables predictoras.
2. Puede utilizarse para predecir algún valor futuro de Y para valores dados de X 1,
X2,..,
Xk .
3. Si una ecuación de predicción proporciona un buen ajuste a los datos (R 2 es
grande) y el número de variables predatorias no es muy grande, entonces es
posible que la ecuación en si sea de ayuda para entender mejor el proceso bajo
investigación.

Las estimaciones para el valor medio de Y o las predicciones para valores específicos
de Y para valores dados de X1,…., Xk se obtienen sustituyendo los valores de X1,….,
Xk en la ecuación de predicción.

Para aplicar esto considere para el ejemplo de investigación de televisión, el valor


promedio de Y para tres individuos cuando las variables X tomen los siguientes
valores:

Horas Estado civil Edad Esco laridad


Individuo
Y X1 X2 X3
1 0 67 13
2 0 81 5
3 1 81 5

Utilice la ecuación de predicción determinada en nuestro ejemplo:

Y = 1.495 - 1.176X1 + 0.039X2 - 0.152X3

7
Transcribiendo la tabla anterior en Excel y programando la formula en cada una de las
celdas de Y (número promedio de horas diarias que pasa frente al televisor) se tienen
los siguientes resultados:

Horas Estado civil Edad Esco laridad


Individuo
Y X1 X2 X3
1 2.1365 0 67 13
2 3.8985 0 81 5
3 2.7225 1 81 5

Intervalo de confianza para Y

Se puede construir un intervalo de confianza y de predicción para Y con un


procedimiento similar al empleado para el modelo lineal simple visto en el tema
anterior; sin embargo, las fórmulas para ellos son demasiados complejos para
presentarlas en este tema. Por suerte, en algunos paquetes de regresión para
computadora, el cómputo de estos intervalos se da como opción al usuario.

Paquete estadístico Minitab

Este paquete presenta un ambiente de trabajo similar al de una hoja de cálculo, pero a
diferencia contiene herramientas especializadas para el análisis estadístico. Por
ejemplo para el caso del estudio de televisión veamos algunas de las pantallas
principales para realizar dicho análisis:

a) En esta pantalla se capturaron los datos del estudio en la hoja de trabajo y se aplico
la opción Estadísticas, Regresión, Regresión.

8
b) El sistema pide a continuación identificar la variable de respuesta y las predatorias:

9
c) Un resultado básico de este análisis se muestra a continuación:

Análisis de regresión: Horas vs. Estado civil, Edad, Escolaridad

La ecuación de regresión es
Horas = 1.50 - 1.18 Estado civil + 0.0388 Edad - 0.152 Escolaridad

Predictor Coef Coef. de EE T P


Constante 1.495 2.637 0.57 0.577
Estado civil -1.1757 0.3156 -3.73 0.001
Edad 0.03876 0.03193 1.21 0.238
Escolaridad -0.15228 0.05011 -3.04 0.006

S = 0.753636 R-cuad. = 62.6% R-cuad. (Ajustado) = 57.2%

Se puede observar en el recuadro anterior la ecuación de predicción y el valor del


coeficiente de determinación calculado hasta ahora con Excel.

d) Minitab permite calcular intervalos de confianza para Y, por ejemplo construya un


intervalo de confianza del 95% para Y para el individuo 1 cuando X tengan los valores
mostrados en la tabla:

10
Horas Estado civil Edad Esco laridad
Individuo
Y X1 X2 X3
1 0 67 13
2 0 81 5
3 1 81 5

Posteriormente introducir el NC del 95% y los valores de X como se indica en la


pantalla siguiente:

11
El resultado se resume a continuación:

Valores pronosticados para nuevas


observaciones

Nueva
Obs Ajuste Ajuste SE IC de
95% 1 2.113 0.263
(1.566, 2.659)

Es decir, podemos afirmar que "con una confianza del 95% las horas diarias
pasadas frente a un televisor de un individuo sin cónyuge, con edad de 67
años y una escolaridad de 13
años está entre 1.6 y 2.7 hrs"

12
13

También podría gustarte