Ejercicio de Regresión Lineal Simple

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

Ejercicio de Regresión Lineal Simple

La gerencia de una cadena de almacenes de entrega de paquetes quiere diseñar un modelo


para predecir las ventas semanales (en miles de dólares) para cada tienda individual basado en
el número de clientes que realizaron alguna compra. Entre todas las tiendas de la cadena se
escogió una muestra aleatoria de 20, obteniéndose los siguientes datos.

Ventas
Tienda Clientes
Semanales
1 907 11,20
2 926 11,05
3 506 6,84
4 741 9,21
5 789 9,42
6 889 10,08
7 874 9,45
8 510 6,73
9 529 7,24
10 420 6,12
11 679 7,63
12 872 9,43
13 924 9,46
14 607 7,64
15 452 6,92
16 729 8,95
17 794 9,33
18 844 10,23
19 1010 11,77
20 621 7,41

a) Realizar un diagrama de dispersión a partir de los datos entregados.


b) Calcular los coeficientes de regresión y definir el modelo de regresión lineal.
c) Determinar el error típico del modelo y el coeficiente de determinación e
interpretar su resultado.
d) Interpretar la pendiente del modelo.
e) Calcular el valor del pronóstico para cuando = 750.
f) Determine la significancia global del modelo con una significación del 5%.
g) Determine la significancia de los parámetros con una significación del 5%.
h) Con un 95% de confianza determine los intervalos de confianza para los parámetros ,
interprete los resultados.
Desarrollo

1)

a) Como se pide generar un modelo que estime las ventas semanales a partir del número de
clientes que realizan un compra, podemos decir que las ventas corresponden a la variable
regresada (o explicada) y los clientes corresponden a la variable regresora (o explicativa) .
A partir de los datos del enunciado, tenemos el siguiente gráfico de dispersión:

Clientes v/s Ventas Semanales


12,00
Ventas Semanales

10,00
8,00
6,00
4,00
2,00
0,00
0 200 400 600 800 1000 1200
Clientes

b) Para calcular los coeficientes sabemos que:

= − ∙ ̅

∑ ∙ − ∙ ∙ ̅
=
∑ − ∙ ̅

Utilizando los datos del enunciado tenemos:

̅ = 731,15 = 8,8055

∙ = 134127,90 = 11306209

Con los que podemos determinar y a su vez, :

134127,90 − 20 ∙ 8,8055 ∙ 731,15


= ≈ 0,00873
11306209 − (731,15)

= 8,8055 − 0,00873 ∙ 731,15 ≈ 2,423

Por lo que nuestro modelo de regresión lineal queda definido como:

= 2,423 + 0,00873 ∙

= 2,423 + 0,00873 ∙
c) Primero calculamos las sumas de los cuadrados, sabiendo que = 8,8055:

Observación − ( − ) − ( − ) − ( − )

1 11,20 10,34 0,86 0,74 1,54 2,36 2,39 5,73


2 11,05 10,51 0,54 0,30 1,70 2,89 2,24 5,04
3 6,84 6,84 0,00 0,00 -1,97 3,86 -1,97 3,86
4 9,21 8,89 0,32 0,10 0,09 0,01 0,40 0,16
5 9,42 9,31 0,11 0,01 0,50 0,26 0,61 0,38
6 10,08 10,18 -0,10 0,01 1,38 1,90 1,27 1,62
7 9,45 10,05 -0,60 0,36 1,25 1,55 0,64 0,42
8 6,73 6,88 -0,15 0,02 -1,93 3,73 -2,08 4,31
9 7,24 7,04 0,20 0,04 -1,76 3,11 -1,57 2,45
10 6,12 6,09 0,03 0,00 -2,72 7,38 -2,69 7,21
11 7,63 8,35 -0,72 0,52 -0,46 0,21 -1,18 1,38
12 9,43 10,04 -0,61 0,37 1,23 1,51 0,62 0,39
13 9,46 10,49 -1,03 1,06 1,68 2,83 0,65 0,43
14 7,64 7,72 -0,08 0,01 -1,08 1,17 -1,17 1,36
15 6,92 6,37 0,55 0,30 -2,44 5,94 -1,89 3,56
16 8,95 8,79 0,16 0,03 -0,02 0,00 0,14 0,02
17 9,33 9,35 -0,02 0,00 0,55 0,30 0,52 0,28
18 10,23 9,79 0,44 0,19 0,99 0,97 1,42 2,03
19 11,77 11,24 0,53 0,28 2,43 5,93 2,96 8,79
20 7,41 7,84 -0,43 0,19 -0,96 0,92 -1,40 1,95

= ( − ) = 4,53

= ( − ) = 46,83

= ( − ) = 51,36

Donde se cumple que = + .

El error típico está definido como:

= 4,53
− −1 = 18 ≈ 0,5017

Nota: corresponde al número de coeficientes de regresión menos 1, para el caso de la


regresión lineal simple, = 1.
Finalmente, calculamos el valor de :

= = 46,83 51,36 ≈ 0,912

Es decir, el 91,2% de la variabilidad en las ventas semanales es explicada por el número de


clientes que realizan una compra.

d) La pendiente del modelo nos indica que por cada cliente que realiza una compra, las ventas
semanales aumentan en 0,00873 miles de dólares, u 8,73 dólares.

e) para calcular el valor del pronóstico solo hace falta reemplazar el valor de en la ecuación
de la recta de regresión:

( ) = 2,423 + 0,00873 ∙

(750) = 2,423 + 0,00873 ∙ 750 = 8,9705

El pronóstico de ventas con 750 clientes es de 8,9705 miles de dólares, u 8907,5 dólares.
f) Para determinar la significancia global del modelo, utilizamos el siguiente test de hipótesis:

Hipótesis:

: = =0

: ≠0

Para = 0,1

Estadístico de Prueba:

Región de Rechazo:

: > ( ; ; )

( ; ; ) = ( ; ; , ) ≈ 4,414

∴ :{ > 4,414}

Evaluación del Estadístico:

= = 46,83 1 = 46,83

= 4,53
− −1 = 18 ≈ 0,2517

∴ = 46,83 0,2517 ≈ 186,0548 ∈

Decisión:

Se rechaza la hipótesis nula, ya que el valor del estadístico pertenece a la región de rechazo.

Conclusión:

El modelo de regresión lineal es estadísticamente significativo.


g) Para determinar la significancia de los parámetros individuales, realizamos el siguiente test
de hipótesis para cada parámetro, donde = 0,1:

Hipótesis:

: =0

: ≠0

Estadístico de Prueba:

Región de Rechazo:

: | |> ;

; = ( ; , ) ≈ 2,101

∴ : {| | > 2,101}

Evaluación del Estadístico:

Para :

1 ̅ 1 (731,15)
= ∙ + = 0,5017 ∙ + ≈ 0,4812
( − 1) ∙ 20 19 ∙ (179,85)

2,423
= = ≈ 5,035 ∈
0,4812

Para :

1 1
= ∙ = 0,5017 ∙ ≈ 0,00064
( − 1) ∙ 19 ∙ (179,85)

0,00873
= = = 13,641 ∈
0,00064

Decisión:

Se rechaza las hipótesis nulas, ya que el valor de ambos estadísticos pertenecen a la región
de rechazo.

Conclusión:

Ambos parámetros son significativos para el modelo.


h) Un intervalo de confianza para un parámetro del modelo de regresión lineal está dado
por:

= ± ( ; ) ∙

Calculando el valor de , tenemos que:

( ; ) = ( ; , ) = 1,734

Por lo tanto, los intervalos de confianza para ambos parámetros quedaran definidos como:

( ) % = 2,423 ± 1,734 ∙ 0,4812 ≈ [1,589; 3,257]

( ) % = 0,00873 ± 1,734 ∙ 0,00064 ≈ [0,00762; 0,00984]

Como el valor 0 no se encuentra en ninguno de los intervalos, podemos decir con un 95% de
confianza que ambos coeficientes son significativos.

También podría gustarte