Ejercicio 14: Matrícula Alumno

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

Matrícula Alumno

Ejercicio 14
Descripción:
Objetivo del ejercicio:
Obtener una ecuación de regresión por medio de la transformación de la variable independiente.

Descripción del ejercicio:
Por medio de este ejercicio los alumnos transformarán la variable independiente con el fin de obtener una mejor
ecuación de regresión ajustada.

Requerimientos para el ejercicio:

Excel o cualquier paquete estadístico como Minitab o SPSS. Consulta los recursos de apoyo del tema 13-15.

 Instrucciones para el alumno:
Realizar los siguientes ejercicios empleando un software estadístico o Excel. En tus resultados debes presentar
evidencia de los análisis estadísticos realizados. Los problemas se pueden realizar en pareja o de manera
individual.

1. Una cadena de comida rápida ha experimentado un cambio importante en sus ventas como resultado de una
campaña de publicidad exitosa. En consecuencia, la gerencia ahora necesita un nuevo modelo de regresión para
sus ventas. Los siguientes datos se recolectaron en las doce semanas posteriores al inicio de la campaña de
publicidad.

Tiempo Ventas

(miles de
Semanas
dólares)
(X) (Y)
1 4618
2 3741
3 5836
4 4367
5 5118
6 8887
7 19746
8 34215
9 50306
10 65717
11 86434
12 105464

a. Usa Excel o Minitab para determinar la ecuación que mejor se ajuste a sus ventas.
b. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.
c. ¿Estás satisfecho con el modelo como pronosticador de ventas (Y)? Explica. Realiza
todas las etapas de una prueba de hipótesis con α = 0.05.
d. Transforma la variable independiente (X²) y ahora corre de nuevo el modelo con X y X² como
variables explicativas. ¿Es este modelo cuadrático un mejor ajuste para los datos? Explica. Realiza
todas las etapas de una prueba de hipótesis con α = 0.05.
e. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema. Compáralo con el obtenido en el inciso b
¿Cuál modelo prefieres? ¿Por qué?

2. Un editor de libros de texto universitarios realizó un estudio para relacionar la ganancia por libro (Y) con el costo
de venta (X) para un periodo de seis años. Se obtuvieron los siguientes datos (en miles de dólares, ajustados por la
inflación):
Utilidad por
libro
dólares, (Y) 16.5 22.4 24.9 28.8 31.5 35.8

Costo de
venta por libro 5 5.6 6.1 6.8 7.4 8.6
en dólares, (X)

a. Ajusta un modelo cuadrático.
b. ¿Proporcionan los datos suficiente evidencia para indicar una curvatura entre (Y) y (X)? Realiza todas las etapas de la prueba de hipótesis con α = 0.05.
c. Encuentra el coeficiente de determinación en la salida de Excel e interpreta su valor en el contexto del problema.
d. Utiliza la ecuación de predicción para estimar la utilidad media del libro cuando el costo de venta por libro es de $6500 (expresa dicho costo en miles de
dólares antes de sustituirlo en la ecuación).

3. Un agrónomo está interesado en la producción de algodón recopilada en los siguientes datos referentes al número de bellotas por planta durante la estación de crecimiento. 
Aquí Y es la media del número de bellotas por planta y X es el tiempo medido en semanas.

Y, bellotas 110 470 1040 1100 1000


X, semanas 1 4 7 9 12

a. Utiliza Excel o cualquier otro paquete estadístico como Minitab para obtener un diagrama de dispersión.
b. Ajusta un modelo cuadrático, es decir X y X2. ¿Proporcionan los datos suficiente evidencia para indicar una curvatura entre el número de bellotas (Y) y el tiempo en s
c. Encuentra el coeficiente de determinación en la salida del software que elegiste e interpreta su valor en el contexto del problema.
d. Utiliza la ecuación de predicción para estimar el número de bellotas cuando el número de semanas es de 8, 10 y 14.

Nota para el alumno: Considera que tu ejercicio debe estar documentado (proceso) y
fundamentado.
Entregable(s): Resultados de ejercicio y proceso.

Criterios de evaluación de la actividad:
1. Obtención de los coeficientes de regresión.
2. Obtención de la ecuación de regresión ajustada con un modelo cuadrático.
3. Conclusiones sobre el mejor modelo de regresión.
1. Una cadena de comida rápida ha experimentado un cambio importante en sus ventas como resultado de una campaña de publicidad exitosa. En consecuencia, la gerencia ahora necesita un nuevo modelo de regresión para sus ventas. Los siguientes datos se recolectaron en las doce semanas posteriores al inicio de la campaña de publicidad.

Tiempo Ventas
Semanas (miles de dólares)
(X) (Y)
1 4618
2 3741
3 5836
4 4367
5 5118
6 8887
7 19746
8 34215
9 50306
10 65717
11 86434
12 105464

a. Usa Excel o Minitab para determinar la ecuación que mejor se ajuste a sus ventas.  Y= -26231.7727 + 9092.8496 * X

SUMMARY OUTPUT Resumen

Estadísticas de la regresión Estadísticas de la regresión

Coeficiente de correlación multiple Coeficiente de correlación múltiple 0.911478053

Coeficiente de determinación R2 Coeficiente de determinación R^2 0.830792241


Adjusted R Square R^2 ajustado 0.813871465
Standard Error Error típico 15517.8643
Observations Observaciones 12

ANOVA ANÁLISIS DE VARIANZA

df Suma de cuadrados MS F Significance F Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regression Regresión 1 11823227811 11823227811 49.09894477 3.68408E-05
Residual Residuos 10 2408041123 240804112.3
Total Total 11 14231268934

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%
Intercept Intercepción -26232.77273 9550.585265 -2.746718866 0.020593891 -47512.80282 -4952.742639 -47512.80282 -4952.742639
X Variable 1 Variable X 1 9092.84965 1297.669003 7.00706392 3.68408E-05 6201.462928 11984.23637 6201.462928 11984.23637

La ecuación de mejor ajuste es:

b. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.

En este caso, el 83.08% de la variación en las ventas explica por X1(el tiempo en semanas) . En la práctica, 0 ≤ R2 ≤ 1, y el valor de R2 debe interpretarse en relación con los extremos, 0 y 1.

c. ¿Estás satisfecho con el modelo como pronosticador de ventas (Y)? Explica. Realiza todas las etapas de una prueba de hipótesis con
α = 0.05.

Para evaluar el modelo se realiza la prueba de hipótesis, con un nivel de significancia de 0.05:

1) Establecimiento de hipotésis
𝐻0 : 𝛽1 =0  (El tiempo en semanas X1  no afectan las ventas Y).
En oposición a:
Ha : βi ≠ 0 (Al menos una variable independiente X, el tiempo en semanas X1,  afectan las ventas Y).

2) Estadística de prueba

𝐶𝑀 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛
𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
𝐶𝑀 𝐸𝑟𝑟𝑜𝑟

Revisamos el inciso anterior y buscamos (cuadrados medios=CM):


CM Regresión=
Fcalculada= 49.0989
CM Error=

3) Regla de decisión
Rechazar H0 si Fcalculada es mayor que Fteórica: 4.96

El valor de Fteórica puede obtenerse en la tabla siguiente:

1
𝐹10(0.05)=4.96

4) Conclusión

Puesto que Fcalculada =     49.0989       es mayor que Fteórica = 4.96 1
𝐹10(0.05)=4.96

d. Transforma la variable independiente (X²) y ahora corre de nuevo el modelo con X y X² como variables explicativas. ¿Es este modelo cuadrático un mejor ajuste para los
datos? Explica. Realiza todas las etapas de una prueba de hipótesis con α = 0.05.

Ventas Tiempo
(miles de dólares) Semanas
(Y) (X) (X²)
4618 1 1
3741 2 4
5836 3 9
4367 4 16
5118 5 25
8887 6 36
19746 7 49
34215 8 64
50306 9 81 5577
65717 10 100 74.6793144
86434 11 121 35.23584108
105464 12 144
78
Resumen 6084 12 6.5
42.25
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.997808129
Coeficiente de determinación R^2 0.995621062
R^2 ajustado 0.994647964
Error típico 2631.388454
Observaciones 12

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 14168951087 7084475544 1023.146389 2.4331E-11
Residuos 9 62317846.77 6924205.197
Total 11 14231268934

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0%
Intercepción 13980.75 2719.6158 5.140707744 0.000610715 7828.551639 20132.94836 7828.551639
Variable X 1 -8141.517233 961.8665489 -8.464289815 0.000014065 -10317.41054 -5965.62393 -10317.41054
Variable X 2 1325.720529 72.02753593 18.40574597 1.88668E-08 1162.782923 1488.658136 1162.782923

Prueba para determinar si la variable X1 tiene efecto en las ventas.
1) Establecimiento de hipotésis
𝐻0 : 𝛽1 =0  (Tiempo en semanas X1 no afectan  las ventas Y).
En oposición a:
Ha : β1 ≠ 0 (El tiempo en semanas X1 no afectan las ventas Y).

2) Estadística de prueba
𝑆𝑏 = 35.2358
1
𝑏𝑖−𝛽𝑖
𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎= 𝑡𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎= | -8141.5172 - 0|= -231.0581057
𝑆𝑏
𝑖

3) Regla de decisión
Rechazar H0 si |tcalculada|=      -231.0581               es mayor que tteórica: 2.2622

En donde tteórica se obtiene de la tabla:
𝑡𝑡𝑒ó𝑟𝑖𝑐𝑎=𝑡∝ /2 (𝑛−𝑘−1)=𝑡0.05/2 (9)=𝑡0.025(9)=2.2622

4) Conclusión
Puesto que |tcalculada |=                es mayor que tteórica = 2.2622

e. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema. Compáralo con el obtenido en el inciso b ¿Cuál modelo prefieres? ¿Por qué?

0.9956 el modelo es confiable ya que es de 99%

En este caso, el 99.56 % de las dos variables explican de manera adecuada a las ventas en miles de dolares con base en el número de semanas. En la práctica, 0 ≤ R2 ≤ 1, y el valor de R2 debe interpretarse en relación con los extremos, 0 y 1.
2. Un editor de libros de texto universitarios realizó un estudio para relacionar la ganancia por libro (Y) con el costo de venta (X) para un periodo de seis años. Se obtuvieron los siguientes datos (en miles de dólares, ajustados por la inflación):

x y
5 16.5
Utilidad por libro
dólares, (Y) 16.5 22.4 24.9 28.8 31.5 35.8 5.6 22.4 Resumen
6.1 24.9
Costo de venta por
5 5.6 6.1 6.8 7.4 8.6
libro en dólares, (X) 6.8 28.8 Estadísticas de la regresión
7.4 31.5 Coeficiente de correlación múltiple 0.997752156
a. Ajusta un modelo cuadrático. 8.6 35.8 Coeficiente de determinación R^2 0.995509364
Graficamente R^2 ajustado 0.992515606
Error típico 0.594378522
Utilidad por libro vs Costo de venta x x² y Observaciones 6
5 25 16.5
40
5.6 31.36 22.4 ANÁLISIS DE VARIANZA
y = -0.8198x2+ 16.334x - 44.192
35 2 6.1 37.21 24.9 Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
R = 0.9955
30 6.8 46.24 28.8 Regresión 2 234.9551425 117.4775713 332.5284008 0.000300927
25
7.4 54.76 31.5 Residuos 3 1.059857483 0.353285828
8.6 73.96 35.8 Total 5 236.015
20

15 Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%
10 Intercepción -44.19249551 8.286882177 -5.33282537 0.012887935 -70.56505308 -17.81993795 -70.56505308 -17.81993795
5 Variable X 1 16.33386317 2.489910423 6.560020399 0.007203888 8.409856941 24.25786939 8.409856941 24.25786939
Variable X 2 -0.819769195 0.18239471 -4.494479005 0.020558128 -1.400230567 -0.239307824 -1.400230567 -0.239307824
0
0 1 2 3 4 5 6 7 8 9 10

b. ¿Proporcionan los datos suficiente evidencia para indicar una curvatura entre (Y) y (X)? Realiza todas las etapas de la prueba de hipótesis con α = 0.05.

Si se puede observar en la grafica, que se tiene suficiente información.
Para evaluar el modelo se realiza la prueba de hipótesis, con un nivel de significancia de 0.05:

1) Establecimiento de hipotésis
𝐻0 : 𝛽1 =0  (El costo de venta X1,  utilidad por libro Y).
En oposición a:
Ha : βi ≠ 0 (Al menos una variable independiente X, el costo de venta X1,  utilidad por libro Y).

2) Estadística de prueba

𝐶𝑀 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛
𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
𝐶𝑀 𝐸𝑟𝑟𝑜𝑟

Revisamos el inciso anterior y buscamos (cuadrados medios=CM):


CM Regresión=
Fcalculada= 332.5284
CM Error=

3) Regla de decisión
Rechazar H0 si Fcalculada es mayor que Fteórica: 9.55

El valor de Fteórica puede obtenerse en la tabla siguiente:

4) Conclusión

Puesto que Fcalculada =       332.5284         es mayor que Fteórica = 9.55
9.55

c. Encuentra el coeficiente de determinación en la salida de Excel e interpreta su valor en el contexto del problema.

Coeficiente de determinación (R²)= 0.9955 por lo tanto el modelo es confiable


100%

d. Utiliza la ecuación de predicción para estimar la utilidad media del libro cuando el costo de venta por libro es de $6500 (expresa dicho
costo en miles de dólares antes de sustituirlo en la ecuación).

27.34237
3. Un agrónomo está interesado en la producción de algodón recopilada en los siguientes datos referentes al número de bellotas por planta durante la estación de crecimiento. 
Aquí Y es la media del número de bellotas por planta y X es el tiempo medido en semanas.

Y, bellotas 110 470 1040 1100 1000


X, semanas 1 4 7 9 12

a. Utiliza Excel o cualquier otro paquete estadístico como Minitab para obtener un diagrama de dispersión.

X, semanas Y, bellotas 1200


1 110
4 470 1000
7 1040
800
9 1100
12 1000
600
15 820
400

200

0
0 2 4 6 8 10 12 14 16

b. Ajusta un modelo cuadrático, es decir X y X2. ¿Proporcionan los datos suficiente evidencia para indicar una curvatura entre el número de bellotas (Y) y el tiempo en semanas (X)? Realiza todas las etapas de la prueba de hipótesis con α = 0.05.

X, semanas X2 Y, bellotas
1 1 110 Resumen
4 16 470
7 49 1040 Estadísticas de la regresión
9 81 1100 Coeficiente de correlación múltiple 0.977337846
12 144 1000 Coeficiente de determinación R^2 0.955189265
15 225 820 R^2 ajustado 0.925315441
Error típico 106.667444
Observaciones 6

ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 727599.5025 363799.7512 31.97412147 0.009485781
Residuos 3 34133.83085 11377.94362
Total 5 761733.3333

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%
Intercepción -175.5472637 125.4355823 -1.399501326 0.256141472 -574.7392691 223.6447417 -574.7392691 223.6447417
Variable X 1 244.2164179 35.9695123 6.789539315 0.006531793 129.7453764 358.6874594 129.7453764 358.6874594
Variable X 2 -11.87810945 2.171917061 -5.468951676 0.012017317 -18.79011888 -4.96610003 -18.79011888 -4.966100026

Para evaluar el modelo se realiza la prueba de hipótesis, con un nivel de significancia de 0.05:

1) Establecimiento de hipotésis
𝐻0 : 𝛽1 =0  (Semanas X1,  bellotas Y).
En oposición a:
Ha : βi ≠ 0 (Al menos una variable independiente X, semanas X1,  bellotas Y).

2) Estadística de prueba

𝐶𝑀 𝑅𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛
𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎=
𝐶𝑀 𝐸𝑟𝑟𝑜𝑟

Revisamos el inciso anterior y buscamos (cuadrados medios=CM):


CM Regresión=
Fcalculada= 21.27
CM Error=

3) Regla de decisión
Rechazar H0 si Fcalculada es mayor que Fteórica: 19

El valor de Fteórica puede obtenerse en la tabla siguiente:

4) Conclusión

Puesto que Fcalculada =     21.27      es mayor que Fteórica = 19 19.00

c. Encuentra el coeficiente de determinación en la salida del software que elegiste e interpreta su valor en el contexto del problema.

Coeficiente de determinación (R²)= 0.9551 el modelo es confiable ya que representa un 95%


96%

d. Utiliza la ecuación de predicción para estimar el número de bellotas cuando el número de semanas es de 8, 10 y 14.

8 64 1017.985075
10 100 1078.80597
14 196 915.3731343

También podría gustarte