Foro 3
Foro 3
Foro 3
HONDURAS-VS
ECONOMETRIA
SECCION 1500
Cesar Alfonso Rosales Amaya
CUENTA 20152006471
FORO #3
1. Primera Pregunta
R. El método de los mínimos cuadrados se utiliza para calcular la recta de regresión lineal que
minimiza los residuos, esto es, las diferencias entre los valores reales y los estimados por la
recta. Se revisa su fundamento y la forma de calcular los coeficientes de regresión con
este método.
2. Segunda Pregunta
Defina la diferencia entre el error y el residual, ¿En qué consiste esta diferencia?
R. El error por lo general se refiere al grado en que las funciones, fórmulas y estadísticos no
pueden explicar o modelar totalmente un valor real o teórico. En otras palabras, el error es la
diferencia entre un valor real y uno pronosticado. Si bien puede existir cierto grado de error o
incertidumbre en los análisis estadísticos, la identificación y cuantificación del error puede al
menos ayudarnos a explicar su presencia.
Error residual La variabilidad que queda una vez identificados todos los efectos principales y
las interacciones
Primera, al principio, esto sirve para simplificar el análisis e introducir poco a poco al lector a
las complejidades del análisis de regresión.
Segunda, en situaciones experimentales tal vez no sea irreal suponer que los valores de X son
fijos.
Tercera, como se muestra en el capítulo 13, aunque las variables X sean estocásticas, los
resultados estadísticos de la regresión lineal basada en el caso de las regresoras fijas también
son válidos cuando las variables X son aleatorias, en tanto se cumplan algunas condiciones;
una de ellas es que la regresora X y el término de error ui sean independientes.
3. Tercera Pregunta
El valor medio de la perturbación ui es igual a cero: Dado el valor de Xi, la media o el valor
esperado del término de perturbación aleatoria ui es cero. Simbólicamente, tenemos que
E(ui|Xi) 0 (3.2.1) O, si X no es estocástica,
E(ui) 0
perturbación, es la misma sin importar el valor de X. Simbólicamente, tenemos que var(ui) E [ui
−E(ui|Xi)]2
El número de observaciones n debe ser mayor que el número de parámetros por estimar:
Sucesivamente, el número de observaciones n debe ser mayor que el número de variables
explicativas.
La naturaleza de las variables X: No todos los valores X en una muestra determinada deben
ser iguales. Técnicamente, var(X) debe ser un número positivo. Además, no puede haber
valores atípicos de la variable X, es decir, valores muy grandes en relación con el resto de las
observaciones.
Cuarta Pregunta
Si E (Ui / Xi) ≠ 0, es decir el valor esperado de los errores dado los diferentes valores de X es
diferentes de 0, ¿Cuál es el problema? ¿Y por qué se complica la estimación?
R. Establece que el valor de la media de ui, que depende de las Xi dadas, es cero.
Geométricamente, este supuesto se representa mediante una gráfica, como en la fi gura 3.3,
que muestra algunos valores de la variable X y las poblaciones Y asociadas a cada uno de ellos.
Puede observar que cada población Y correspondiente a un X dado está distribuida alrededor
de su media (que se representa por los puntos dentro de un círculo sobre la FRP), con algunos
valores de Y por encima y por debajo de ésta. Las distancias por encima y por debajo de los
valores medios no son otra cosa que la ui. La ecuación (3.2.1) requiere que el promedio o valor
medio de estas desviaciones correspondientes a cualquier X dado sea cero.
Es importante señalar que el supuesto 3 implica que no hay sesgo de especificación o error de
especificación en el modelo del análisis empírico. En otras palabras, el modelo de regresión
está especificado correctamente.
También observe que si la media condicional de una variable aleatoria, dada otra variable
aleatoria, es cero, la covarianza entre las dos variables es cero y, por tanto, las dos variables no
están correlacionadas. En consecuencia, el supuesto 3 implica que Xi y ui no están
correlacionadas.
5. Quinta Pregunta.
Sea niños la cantidad de hijos que ha tenido una mujer, y educ los años de educación que tiene
esta mujer. Un modelo sencillo para relacionar fertilidad con años de educación es
Niños = Bo + Bi educ +u
¿Qué tipo de factores son los contenidos en u? ¿Es posible que estos factores estén
correlacionados con el nivel de educación?
R. Son aquellas variables no observadas ya sea por falta de información o la dificultad que hay
para medir la variable. Estas variables no observadas pueden estar directamente
correlacionadas con el nivel de educación, como lo es el índice de pobreza.
¿Es posible que con un análisis de regresión simple se halle el efecto Ceteris Paribus de
educación sobre l fertilidad? Explique
R. No es posible. La fertilidad tiene distintas variables que explican tanto contextuales como
personales que explican la razón por la cual puede tener o no más niños. Al no contemplar
esto dentro del modelo, no hay forma que dentro de la regresión simple se pueda hallar un
efecto causal de una variable sobre la otra.
Segunda parte
1. Primera Pregunta
La propensión marginal a consumir estimada (PMgC) del ingreso no es más que la pendiente,
B1, mientras que la propensión media a consumir (PMeC) es consline = Bo linc + B1. Usando las
observaciones sobre el ingreso anual y consumo de 100 familias (ambos medidos en dólares),
se obtiene la ecuación siguiente:
N= 100, R2 = 0.692
1.Intrprete el intercepto en esta ecuación y analice su signo y su magnitud
R. El intercepto de la ecuación comprende que cuando el incremento sea igual a 0 (inc =0) se
prevé que el negativo sea $ 124.84, es decir -124.84 es el nivel de consumo de alguien con inc
= 0. No tiene mucho sentido que el signo sea negativo ya que técnicamente una familia no
puede tener un consumo negativo, debido a esto nuestra función se convierte en un débil
predictor de consumo de niveles muy bajos de ingresos.
Cons = 25465,16
3. Con inc en el eje x, trace una grafica la PMgC estimada y la PMeC estimada
Segunda pregunta
La base de datos BWGHT.RAW contiene cifras sobre los hijos nacidos de mujeres en Estados
Unidos. Las dos variables de interés son la variable independiente, peso en onzas del niño al
nacer (bwght) y la variable explicativa, cantidad promedio diaria de cigarros consumidos por la
madre durante el embarazo (cigs). La siguiente ecuación de regresión simple se estimo con
datos de n = 1,388 nacimientos
¿Cuál es el peso al nacer que se predice si cigs =? Y cuando cigs = 20 (un paquete por día )
Analice la diferencia
R. Una regresión puede arrojar resultados significativos, sin embargo, no necesariamente toda
regresión explica una relación causal. Pueden existir otros factores que ayuden a determinar el
peso del niño, los cuales no están estando dentro de este modelo.
Para que el peso al nacer predicho sea de 125 onzas ¿Cual tiene que ser el valor de cigs?
R. El resultado de cigarrillos consumidos para que el peso sea 125 onzas es negativo, lo cual no
tiene sentido. Esto se da debido a que el peso con el que se trabaja es mayor al peso del recién
nacido, en caso de que la madre no consuma cigarrillos durante el embarazo.
R. 1176 de 1388 mujeres no fumaron cigarrillos durante el embarazo. Este porcentaje del 85%
no nos ayuda a entender directamente nuestros resultados en el inciso 11, dado que la
proporción de mujeres que no fumaron al estar embarazadas no es una variable que hayamos
considerado para elaborar la regresión. Sin embargo, debido a que en la regresión se
consideran las variables “Bwght” (dependiente) y “cigs” (independiente); siendo la variable
“cigs” la cantidad de cigarrillos que consumen las madres, la proporción obtenida ayuda a
predecir la cantidad de infantes que pesarán aproximadamente 119.77, que será igual a la
cantidad de madres que no consumieron cigarros. 𝑏𝑤𝑔ℎ𝑡𝑖 = 119,77 - 0,514𝑐𝑖𝑔𝑠.
Tercera pregunta
Usando los datos de Kiel y McClain (1995) sobre las casas vendidas en 1988 en Andover,
Massachusetts, en la ecuación siguiente se relaciona el precio de las casas (price) con la
distancia a un incinerador de basura construido recientemente (dist):
log(price) 9.40
0.312 log(dist) n 135, R2 0.162.
R. Si se eligió ubicar el incinerador en un área alejada de barrios más caros, entonces log (dist)
esta positivamente correlacionada con la calidad de la vivienda. Esto quebrantaría el modelo
de regresión lineal y la estimación de los mínimos cuadrados seria sesgada.
iii) ¿Qué otros factores relacionados con una casa afectan su precio? ¿Pueden estos factores
estar correlacionados con la distancia al incinerador?