Econometria Notas
Econometria Notas
Econometria Notas
Econometría 1
Mario Ankalli Conejo
Notas
P Y 0 P S S S 18
{ = } = {( , , )} =
∑i 0 P Y
3
=
{ = i 1} =
Distribución de probabilidades
fdp ⟹ f xi p X xi Pi donde i 1 2 K
( ) = ( = ) = = , ,...,
∑iK1 Pi
=
= 1
Definición en Wooldridge
Es una variable aleatoria que solo toma una cantidad finita o una cantidad infinita de valores.
La noción de “infinita contable” significa que aunque la variable
aleatoria pueda tomar una cantidad infinita de valores, éstos se pueden poner en
correspondencia
uno a uno con los enteros positivos.
Definición en Ross
Se dice que una variable aleatoria que puede tomar como máximo un número contable de
valores posibles es discreta. Para una variable aleatoria discreta X, definimos la función de
densidad de probabilidad p(a) de X por
pa P X a
( ) = { = }
La función de masa de probabilidad p(a) es positiva como máximo para un número contable
de valores de a. Es decir, si X debe asumir uno de los valores x1, x2, . . . , entonces
p xi 0 para i 1 2
( ) ⩾ = , ,...
p x 0 para los dem s valores de x
( ) = á
∑i 1 p xi
∞
=
( ) = 1
{ = } { > }.
Solución: Dado ∑i 0 p i
∞
=
( ) = 1, tenemos
c∑ i
i
1
∞
𝜆
=
i0 !
Dado que ∑ xi
=
i
ex , se obtiene
∞
i0 =
!
ce 1 o c e- c i e-
𝜆
𝜆
𝜆
i
i i
𝜆 𝜆
= = ∴ =
! !
Dado p a PX a
( ) = { = }
(a) P X 0 e 0
- 0 -
e
𝜆
𝜆
𝜆
{ = } = =
!
(b) P X 2 1-P X 2
{ > } = { ⩽ }
= 1-P X 0 -P X 1 -P X 2
{ = } { = } { = }
1- e 0 - e 1 - e 2 1-e- - e- - 2e
- 0 - 1 - 2
𝜆
𝜆
𝜆
𝜆
2- 𝜆
𝜆 𝜆
𝜆
𝜆 𝜆
= = 𝜆
! ! !
Propiedades de la FDA:
Para todo número c ⟹ P X (c 1-F c
> ) = ( )
Definición Wooldridge
Una variable X es una variable aleatoria continua si la probabilidad de que la variable
aleatoria tome cualquier valor real es cero. Esta definición es un poco contraintuitiva, ya que
en cualquier aplicación se observará algún valor de la variable aleatoria. La idea es que los
valores que puede tomar una variable aleatoria continua X son tantos que no es posible
contarlos o hacerlos coincidir con los enteros positivos, de manera que la consistencia lógica
indica que X puede tomar cada uno de estos valores con probabilidad cero.
Definición Ross
También existen variables aleatorias cuyo conjunto de valores posibles es incontable. Dos
ejemplos son el tiempo que un tren llega a una parada específica y la vida útil de un
transistor. Sea X una variable aleatoria de este tipo. Decimos que X es una variable aleatoria
continua si existe una función no negativa f , definida para todo real x - , que tiene ∈ ( ∞, ∞)
= { ∈ ( ∞, ∞)} = ∫
- ∞
( )
b
Pa X b
{ ⩽ ⩽ )} = ∫
a f x dx
( )
Por tanto si establecemos a = b obtendríamos
a
PX a
{ = )} = ∫
a f x dx 0
( ) =
Distribuciones conjuntas:
Definición de Wooldridge
Sean X y Y variables aleatorias discretas. Entonces (X,Y) tiene una distribución conjunta,
descrita
completamente por la función de densidad de probabilidad conjunta de (X,Y):
fx y x y P X x Y y
,
( , ) = ( = , = ),
Hay un caso en el que la fdp conjunta se obtiene con facilidad si se cuenta con las fdp de X
y de Y. En particular, se dice que las variables aleatorias X y Y son independientes si y solo
si,
fx y x y fx x fy y
,
( , ) = ( ) ( )
PX x Y y PX x PY y
( = , = ) = ( = ) ( = );
PX x yPY y.
( = ) ( = )
Distribuciones condicionales:
Definición Wooldridge
En econometría, usualmente interesa saber cómo está relacionada una variable, a la que se le
llamará Y, con otra u otras variables. Por ahora, suponga que sólo interesa el efecto de una
variable, llámesele X. Lo más que se puede saber acerca de cómo afecta X a Y está contenido
en la distribución condicional de Y dada X. Esta información está resumida en la función de
densidad de probabilidad condicional, definida por
fY X y x fX Y x y fX x
|
( | ) = ,
( , )/ ( )
donde el lado derecho se lee como “la probabilidad de que Y y dado que X x”. Cuando Y = =
razones
antes vistas, sino que las probabilidades condicionales se encuentran calculando áreas bajo
la fdp condicional.
Una característica importante de las distribuciones condicionales es que, si X y Y son
variables
aleatorias independientes, conocer el valor que toma X no dice nada acerca de la probabilidad
de que Y tome diversos valores (y viceversa). Es decir,
fY X y x fY y y fX Y x y fX x
|
( | ) = ( ) |
( | ) = ( ).
Ejemplo 2a
Un estudiante está tomando un examen de recuperación con límite de tiempo de una hora.
Suponga que la probabilidad de que el estudiante termine el examen en menos de x horas es
x/2, para todo 0... x... 1. Entonces, dado que el estudiante todavía está trabajando después
de 0,75 horas, ¿cuál es la probabilidad condicional de que el estudiante termine el examen en
menos de x horas? se usa la hora?
Solución. Sea Lx el evento de que el estudiante termine el examen en menos de x horas,
0 x 1 , y sea F el evento de que el estudiante use la hora completa. Como F es el evento de
… …
PF( ) = P L1c = 1 P L1
− ( ) = 05
,
Ahora, el evento de que el estudiante todavía está trabajando en el tiempo .75 es el
complemento del evento L.75, por lo que la probabilidad deseada se obtiene de
P FL0c 75 PF 05
P F L0c 75 .
{ }
0 625 0 8
.
P L0c 75 P L0c 75
| = = = = .
.
.
. .
∫
[ ] =
-
∞
( )
Dada una variable aleatoria X y una función g(.), se puede crear una nueva variable aleatoria
g(X). Por ejemplo, si X es una variable aleatoria, entonces también X 2 y log X (si X 0) son ( ) >
variables aleatorias. El valor esperado de g X es, otra vez, un simple promedio ponderado:
( )
Eg X
[ ( )] = ∑j k1 g xj fx xj
=
( ) ( ),
Eg X g x fx x dx
∞
∫
[ ( )] =
- ∞
( ) ( )
Propiedades
Propiedad 1: Para toda constante c,
Ec c[ ] =
aleatorias X1 X2 Xn entonces
{ , ,..., },
E a1 X1 a2 X2
[ + + ... + an Xn a1 E X1 a2 E X2
] = [ ]+ [ ] + ... + an E Xn
[ ] = ∑i n1 aiE xi
=
[ ]
pizzería en un día determinado. Éstas son variables aleatorias cuyos valores esperados son
E X1 25, E X2 57 y E X3 40. Los precios de las pizzas pequeñas, medianas y grandes
( ) = ( ) = ( ) =
5 50 25 7 60 57 9 15 40 936 70
= . ( )+ . ( )+ . ( ) = . ,
es decir, $936.70. El ingreso real en un día determinado será, por lo general, distinto de este
valor, pero este es el valor esperado.
Medidas de tendencia central: Varianza
Dada una variable aleatoria X, sea E X . Hay varias maneras de medir qué tan lejos está
𝜇 = ( )
X
de su valor esperado, pero la forma más sencilla para manipular algebraicamente es el
cuadrado de la diferencia, X- 2 . (Al elevar al cuadrado se elimina el signo de la distancia
( 𝜇)
medida; el valor positivo que se obtiene corresponde a la noción intuitiva de distancia y trata
de manera simétrica a valores mayores y menores que .) Esta distancia también es una 𝜇
variable aleatoria, pues cambia con cada valor que toma X. Así como se necesita un número
que resuma la tendencia central de X, también se requiere uno que indique qué tan lejos, en
promedio, está X de . Este número es la varianza, que da la distancia esperada de X a su
𝜇
media:
Var X E X-
( ) = ( 𝜇)
2 .
𝜎 E X2 -2X 2 E X2 -2 E X E 2
2 = 𝜇+𝜇 = 𝜇 ( )+ 𝜇
= E X2 -2 2 2 E X2 - 2 E X2 - E X 2
𝜇 +𝜇 = 𝜇 = [ ( )]
Propiedades
Propiedad 1: Si y solo si existe una constante c tal que P X ( = c 1, en cuyo caso E X c
) = ( ) =
entonces
Var X c 0
( = ) =
Esta propiedad indica que la varianza de cualquier constante es cero y que si una variable
aleatoria
tiene varianza cero, entonces es una constante.
Propiedad 2: Para cualesquiera constantes a y b,
Var aX b Var aX Var b a2Var X
( + ) = ( )+ ( ) = ( )
Esto significa que sumar una constante a una variable aleatoria no modifica la varianza, pero
multiplicar una variable aleatoria por una constante aumenta la varianza en un factor igual al
cuadrado de la constante.
Ejemplo
Si X denota temperatura en grados Celsius y Y 32 9 5 X es temperatura en grados = +( / )
𝜎X,
o simplemente , cuando se sobreentiende la variable aleatoria. De las propiedades VAR.1 y
𝜎
Esta última propiedad hace que resulte más natural trabajar con la desviación estándar
que con la varianza.
Ejemplo
Suponga que X es una variable aleatoria medida en miles de dólares, como por ejemplo,
ingreso. Si se define Y 1 000X , entonces Y es ingreso medido en dólares. Suponga que
= ,
que la de X.
Estandarización de una variable aleatoria
Suponiendo una variable aleatoria X, se define una nueva variable aleatoria tal que
Z X-=
𝜎
𝜇
,
𝜎 𝜎
E Z aE X b a b
( ) = ( )+ = 𝜇+ =
𝜇
𝜎
- µ
𝜎
= 0
Var Z a2Var X
( ) = ( ) = 𝜎
2 /𝜎
2 = 1
Estructura de datos
Por último, recordar que CORRELACIÓN no es CAUSALIDAD. ØEn la Causalidad aplica el
concepto de CeterisParibus: el efecto de una variable sobre otra, si todos los otros factores
relevantes se mantienen constante.
Modelo de regresión simple (clase 2/7/2022)
Qué es regresión?
En econometría nosotros queremos saber como los datos de dos o más variables regresan o se
ajustan a una función lineal, el modelo de regresión lineal es una función lineal que mejor se
ajusta a los datos..
y = β 0 +β 1x +𝜇
donde,
Y: Variable dependiente, regresando, predicha, endógena o de respuesta
X: Variable independiente, regresor, de política, decisión o exógena
β 1 : Impacto de X sobre Y, cambio en Y ante un incremento marginal en X
β 0 : Intersecto
𝜇 : Término de error o perturbación, representa factores distintos a x que afectan y
Supuestos:
1. Linealidad en parámetros: 0 y 1 tienen exponente 1.
β β
Cov x 0.
(𝜇| ) =
= E 0 1x x E x
(β +β | )+ (𝜇| )
0 1x
= β +β
Es importante entender que la ecuación dice cómo varía el valor promedio de y de acuerdo
con la variación de x; esta ecuación no dice que y sea igual a 0 1 x para cada una de las
β +β
unidades de la población.
A la parte 0 1 x , que representa E y x , se le llama parte sistemática de y, es decir, es la
β +β ( | )
Es decir que la varianza de Y es igual para cada valor de x. (Gráficamente las funciones de
campana son las mismas para cada valor de x)
Estimación del Modelo por Mínimo Cuadrados Ordinarios (MCO)
Estimar los parámetros de este modelo: 0 y 1 .β β
yi 0 1 xi i
= β +β +𝜇
𝜇 i yi - 0 - 1 xi
= β β
𝜇 i yi - 0 1 xi
= (β +β )
𝜇i es el término de error
yi es la variable real
(β 0 1 xi es la estimación
+β )
∑ni 1
∂
=
∂β 0
𝜇
2
i
= ∑i n1 2 yi - 0 - 1xi
=
β β ( -1 0) =
∑ni 1
∂
=
∂β 1
𝜇
2
i
= ∑i n1 2 yi - 0 - 1xi
=
β β ( -xi 0 ) =
∂∑ni 1 𝜇
2
i
Depejamos 0 de
𝛽
=
∂β 0
∑ni 1
∂
=
∂β 0
𝜇
2
i
= ∑i 1 2 yi - 0 - 1xi
n
=
β β ( -1 0) =
-2∑ yi - 0 - 1 xi 0
n
β β =
i1
=
∑i 1 yi - ∑i 1 0 - ∑i 1 1xi
=
n n
=
β
n
=
β = 0
∑i n1 0 ∑i n1 yi - ∑i n1 1xi
=
β =
= =
β
n0 β = ∑i n1 yi - ∑i n1 1xi
= =
β
∑ni 1 yi - ∑ni 1 1 xi β
0 n
= =
β =
∑ni 1 yi ∑ni 1 xi
0 n -1 n
= =
β = β
0 y⏨- 1 x⏨
β = β
Donde
∑ni 1 yi
n es el promedio ponderado de y
=
∑ni 1 xi
n es el promedio ponderado de x
=
∑ni 1
∂ 𝜇
2
i
Depejamos 1 de
𝛽
=
∂β 1
∑ni 1
∂
=
∂β 1
𝜇
2
i
= ∑i 1 2 yi - 0 - 1xi
n
=
β β ( -xi 0 ) =
∑i 1 yi - 0 - 1xi
n
=
β β ( xi 0
) =
∑i n1 yixi - ∑i n1 yi - 1xi
= =
β ∑
n
x⏨- 1 xi2
i1
β
=
= 0
=
β β
=
= 0
β ∑
n
i1
=
n
1 xi - 1 x⏨ xi
2
i1
β ∑ ∑i 1 yixi - x⏨∑i 1 yi
=
=
n
= =
n
β 1 ∑
n
i1=
∑
n
xi - x⏨ xi
2
i1
∑
n
i1
∑
n
yixi - x⏨ yi
i1=
=
= =
= =
= =
Nota adicional
cov x y ∑ yi -n-1
( ,
y⏨ xi - x⏨
) =
( )( )
var x ∑ x i - x
⏨ 2 ( )
n-1 ( ) =
Reemplazando en B0
∑ni 1 yi ∑ni 1 xi
0 n -1 n
= =
β = β
= =
= =
∑i 1 xi -nx⏨
=
= =
𝜇 i = yi - yi
yi = β 0 1 Xi
+β
∑i n1 i
=
𝜇 = 0
yi = 𝛽 0 +𝛽 1 xi
⏨yi = 𝛽 0 +𝛽 1 x⏨i
2
( Yi - ⏨Y 2 ) = ( Yi - ⏨Y )+𝜇 i
= ( Yi - Y⏨ 2 2 Yi - Y⏨
) + ( i
)𝜇 + 𝜇
2
i
∑ Yi - Y⏨ 2 ∑ Yi - Y⏨ 2 2∑ Yi - Y⏨ i ∑ i2
( ) = ( ) + ( )𝜇 + 𝜇
∑ Yi - ⏨Y 2 ∑ Yi - ⏨Y 2 ∑ i2
( ) ( ) 𝜇
⏨⏨
STC ⏨⏨
SEC ⏨⏨
SRC
= +
Interpretaciones:
La proporción de las variaciones de la variable Y que son explicadas por las variaciones de la
variable x o nuestro modelo.
Si multiplicamos el R 2 por 100%, sería el porcentaje de variaciones de la variable Y
explicadas por las variaciones de la variable x o nuestro modelo
Ej.
Si 100R 2 =70% entonces un 70% de las variaciones de la variable Y explicadas por las
variaciones de la variable x o nuestro modelo
Unidades de medición en las variables y los estimadores MCO
Suponga que regreso ingreso en 1000 dólares sobre añis de educación
Luego cambio las unidades de medición bien de la variable dependiente o independiente. Por
ejemplo, ingreso en dólares ahora, o educación en meses.
Propiedades de la distribución de los Estimadores MCO
Insesgamiento
Para 0𝛽
𝛽 0 = y⏨- 1 x⏨
𝛽
Probar
E 𝛽 0 = 𝛽 0
Dado yi
∑ yi
= 𝛽 0 +𝛽 1 Xi +𝜇 i y y⏨ =
n
𝛽 0 = y⏨- 1 x⏨𝛽
𝛽 0 = ∑ 0 1xi i - 1 x⏨
1
n (𝛽 +𝛽 +𝜇 ) 𝛽
0
1 ∑ 0 ∑ 1xi ∑ i - 1 x⏨
𝛽 =
n 𝛽 + 𝛽 + 𝜇 𝛽
0 0 1 x⏨ n ∑ i - 1 x⏨
𝛽
1
= 𝛽 +𝛽 + 𝜇 𝛽
1 - 1 x⏨ n ∑ i
𝛽 0 0= 𝛽
1+ 𝛽 𝛽 + 𝜇
Valor esperado
E 𝛽 0 = E 0
[𝛽 ] + E x⏨ E n1 ∑
𝛽 1- 1 𝛽 + 𝜇 i
E 0 0 x⏨E 1 - 1
1E i
𝛽 = 𝛽 +
n 𝛽 𝛽 + [𝜇 ]
E 𝛽 0 = 𝛽 +
1
0 x⏨ 1 - 1 n E i
(𝛽 𝛽 )] + [𝜇 ]
E 𝛽 0 = 𝛽 0 ∴ es insesgado
Varianza
𝛽 0 = y⏨- 1 ⏨x𝛽
∑ di i donde d x - x
i ⏨
𝜇
𝛽 1 = 𝛽 1 +
STCx i , = ( )
Supuesto RLS5:
Var i xi Var
(𝜇 | ) = (𝜇 ) = 𝜎i 2
Varianza 1 𝛽
= ∑ STCdi x 2 2 𝜎 =
𝜎
STCx
2 ∑
2
d 2
i =
𝜎
2
STCx2 STCx STCx
=
𝜎
2
2 1 ∑n 2 SRC
𝜎 =
n-2 i 1 =
𝜇
i =
n-2
Estimador de la varianza de 1 𝛽
2
Var 𝛽 1 =
STCx
𝜎
Y = 𝛽 ␒1 Xi +𝜇 i
Queremos minimizar el error
Min∑
n
2
𝜇
i
i1
=
Estimadores:
Y = 𝛽 1X
∑ Yi Xi
1
𝛽 =
∑ Xi2
Modelo de regresión lineal simple
Supuestos de Gauss-Markov
Estimadores MCO de la Regresión Múltiple
• Inclusión de más factores que explican la variable dependiente
• Mayor número de variables independientes, mejor R 2
• RLM acepta que variables independientes están correlacionadas, incluir más factores
flexibiliza el supuesto cov x 0.
( , 𝜇) =
• Teniendo una muestra aleatoria, podemos escribir este modelo de regresión múltiple
para cada individuo u observación
Yi = 𝛽 0 +𝛽 1 Xi1 +𝛽 2 Xi2 + ... + 𝛽 k Xik +𝜇 ; K 12 k
= , ,...,
Se quiere
0
Min
𝛽 ,..., 𝛽 k
∑ i2 𝜇
= 𝛽 +𝛽 + ... + 𝛽 +𝜇 n
En forma matrcial
Y1 1 1 X11 X1k
Y2 X21 X2k
𝜇 𝛽 ...
2 2 X
Y
𝜇 𝛽 ...
= . ; 𝜇 = . ; 𝛽 = . ;
n k ×
= .
Yn Xn1 Xnk
. . . .
𝜇 n 𝛽 k ...
0 k
∑
Min 2
i
𝛽 ,..., 𝛽
𝜇
Donde ∑ i2 t 𝜇 = 𝜇 𝜇
Min ∑ 2 Min t S
∴
i 𝜇 = 𝜇 𝜇 = (𝛽)
0 k
𝛽 ,..., 𝛽 0 k 𝛽 ,..., 𝛽