Clase 1 - Causalidad
Clase 1 - Causalidad
Clase 1 - Causalidad
CAUSAL:
TEORÍA
Y
APLICACIONES
A
LA
ECONOMÍA
POLÍTICA
Y
DESARROLLO
GIANMARCO
LEÓN
UNIVERSIDAD
POMPEU
FABRA
Y
BARCELONA
GSE
2
CONTENIDO
DEL
CURSO
1. Introducción
a
la
causalidad
en
econometría
a. Causalidad
y
correlación
b. El
modelo
de
resultados
potenciales
c. ATE,
TOT,
ITT
2. Diseños
experimentales:
Experimentos
y
Causalidad
3. Revisión
de
econometría
básica,
selección
sobre
observables
y
no
observables,
y
métodos
de
regresión
a. Variables
instrumentales
b. Métodos
de
regresión
discontinua
c. Métodos
de
diferencias
en
diferencias
4. Economía
política:
Instituciones
y
Crecimientos
económico,
y
modelos
de
Comportamiento
Político:
a. Los
Votantes
b. Candidatos
5. Economía
del
Desarrollo:
Capital
Humano,
Salud
y
Educación
3
MATERIALES
1. Syllabus
2. Diapositivas
de
clase
3. BibliograXía
sugerida
4
FORMA DE TRABAJO
Mi
Trabajo:
Presentar
claramente
el
material
y
responder
las
preguntas
que
surjan
en
clase
Tú
trabajo:
1. Llegar
puntualmente
a
la
clase
2. Prestar
atención
y
hacer
todas
las
preguntas
relevantes
durante
la
clase
3. Leer
por
adelantado
los
materiales
para
la
clase
del
día
(dispositivas
y
referencias
sugeridas)
5
PREGUNTAS?
6
DE QUÉ SE TRATA LA ECONOMÍA
(Y LA ECONOMETRÍA)?
7
• Estos
dos
tipos
de
análisis
no
son
opuestos.
En
ocasiones
pueden
ser
complementarios,
pero
la
evidencia
empírica
más
interesante,
es
la
evidencia
que
nos
da
pistas
acerca
de
la
causalidad.
– La
reducción
del
tamaño
de
clase
mejora
la
performance
de
los
estudiantes?
– Hay
discriminación
racial
en
el
mercado
laboral?
– Qué
determina
el
crecimiento
económico?
– Cuál
será
el
nivel
de
inXlación
el
próximo
trimestre?
– Cómo
ha
evolucionado
la
desigualdad
alrededor
del
mundo
durante
el
siglo
XX?
8
a. Análisis
descriptivo
Establece
hechos
estilizados
de
la
realidad
económica
que
requieren
ser
explicados
por
un
razonamiento
teórico,
y
que
nos
va
a
dar
nuevas
perspectivas
sobre
fenómenos
económicos
b. Inferencia
Causal
Busca
determinar
el
efecto
de
ciertas
intervenciones
y/o
políticas,
o
estimar
el
las
respuestas
en
el
comportamiento
de
los
agentes
sugeridas
por
la
teoría
económica
9
2. DOS APROXIMACIONES A LA CAUSALIDAD
EN ECONOMETRÍA
• Dos
teorías
acerca
de
la
causalidad
en
econometría
(Pearl
2000):
o Modelos
estructurales
(Havelmo
1943,
Cowles
Commission)
10
• Modelos
Estructurales
o Utiliza
la
teoría
económica
para
motivar
el
análisis:
La
teoría
económica
nos
da
el
marco
general
de
acción
o El
énfasis
esta
en
el
problema
de
identiXicación
de
los
efectos
causales
de
eventos
o
situaciones
especíXicas
11
En
el
marco
de
acción
guiado
por
el
modelo
de
resultados
potenciales,
el
ideal
es
aproximarnos
a
un
experimento
aleatorio
controlado
• El
trabajo
empírico
en
microeconomía
aplicada
actualmente
se
basa
cada
vez
más
en
el
modelo
experimental
• Sin
embargo,
el
trabajo
en
la
frontera
del
conocimiento
en
esta
área
es
aquel
que
combina
diseños
experimentales
con
modelos
estructurales
(Card,
et
al.
2012,
Mullainathan
2012)
– Ver
Heckman
(2005)
y
Pearl
(2000)
para
una
discusión
más
XilosóXica
sobre
el
tema.
12
2. PROBLEMAS EN LA ESTIMACIÓN DE
EFECTOS CAUSALES
No
todas
las
correlaciones
son
relaciones
causales!!!
Hay
muchas
razones
por
las
cuales
podemos
observar
una
relación
empírica
entre
dos
variables
(X
e
Y):
o X
→
Y
causalidad
o Z
→
X
and
Z
→
Y
variables
omitidas
o Y
→
X
causalidad
reversa
o X
→
Y
and
Y
→
X
simultaneidad
o X*
→
Y
error
de
medición
o Correlación
espúrea
o Sesgo
de
selección
Ejemplo:
Cuál
es
el
efecto
del
nivel
de
educación
sobre
los
ingresos?
13
BUSCANDO EL CONTRAFACTUAL ADECUADO …
• Para
poder
determinar
el
efecto
causal
de
X
sobre
Y,
necesitamos
observar
que
es
lo
que
sucede
con
Y
cuando
modiXicamos
X,
manteniendo
todo
lo
demás
constante
en
el
entorno
(i.e.
Z)
• Para
poder
hacer
esta
comparación,
necesitamos
cambiar
X
en
la
vida
de
personas
reales
(llamemos
a
este
el
grupo
de
tratamiento),
y
observar
a
otro
grupo
de
personas
que
sea
idéntico
al
grupo
de
tratamiento,
excepto
por
el
hecho
que
para
ellos
X
no
cambió
(llamémosle
el
grupo
de
control)
• El
contrafactual
perfecto:
Observar
a
un
mismo
individuo
para
el
cual
hayamos
modiXicado
y
mantenido
constante
X
–
Es
imposible!
14
VARIABLES OMITIDAS
Cuando
aparece
el
problema
de
las
variables
omitidas?
1. La
causa
real
no
es
observada.
• ej.
altos
salarios
para
los
más
educados
están
realmente
explicados
por
una
mayor
habilidad
o
motivación,
pero
no
escolaridad
2. Cuando
los
individuos
seleccionan
su
propio
nivel
del
“tratamiento”
(deXinido
ampliamente)
• ej.
sesgo
de
selección
3. Asignación
no
aleatoria
del
tratamiento
• Debido
a
la
decisión
de
alguien
más,
el
grupo
de
control
no
es
un
buen
contrafactual
para
el
tratamiento.
Ej.
Focalización
de
programas
sociales
15
LA MISTERIOSA Z….
• Supongamos
que
estamos
interesados
en
estimar
el
efecto
de
un
cierto
tratamiento
sobre
una
población
(X=1),
en
relación
con
un
grupo
de
control
(X=0):
Yi = α + β X i + γ Zi + εi
• Pensemos
en
esta
relación
en
términos
del
ejemplo
canónico
de
el
efecto
de
la
educación
sobre
los
salarios:
El
salario
para
un
individuo
i
(Yi)
depende
de
su
nivel
de
educación
(Xi,
terminó=1,
no
terminó=0),
la
habilidad
del
individuo
(Zi,
alta=1
o
baja=0),
y
si
es
que
el
trabajador
i
se
levantó
de
la
cama
por
el
lado
correcto
(εi)
16
VARIABLES OMITIDAS: EN MATEMÁTICAS…
• Estamos
interesados
en
encontrar
el
efecto
de
X
sobre
Y,
manteniendo
Z
constante.
• Para
ello
comparamos
la
esperanza
condicional
de
nuestra
variable
de
interés
(Y)
para
los
tratados,
con
aquella
para
los
del
grupo
de
control:
E[Y | X =1 , Z]− E[Y | X =0 , Z]
• Para
hallar
esto,
tomemos
la
esperanza
condicional:
E[Y
| X ,Z] = E[α + β X + γ Z + ε ]
= E[α | X ,Z]+ E[ β X | X ,Z]+ E[γ Z | X ,Z]+ E[ε | X ,Z]
= α + β E[ X | X ,Z]+ γ E[Z | X ,Z]+ 0
17
VARIABLES OMITIDAS: EN MATEMÁTICAS…
18
VARIABLES OMITIDAS: EN MATEMÁTICAS…
19
VARIABLES OMITIDAS: EL SESGO
• De
la
expresión
anterior,
podremos
estimar
el
efecto
de
X
sobre
Y
sin
de
sesgo
sólo
en
el
caso
en
el
que
la
esperanza
de
Z
para
el
grupo
de
tratamiento
es
igual
a
la
misma
esperanza
para
el
grupo
de
control
• En
términos
de
nuestro
ejemplo,
si
es
que
la
habilidad
media
de
los
trabajadores
que
terminaron
secundaria
es
diferente
de
la
de
aquellos
que
no
terminaron
secundaria
(grupo
de
tratamiento
y
de
control),
no
será
posible
separar
el
efecto
real
del
tratamiento
de
aquel
de
los
distintos
niveles
de
habilidad
sobre
el
salario.
20
VARIABLES OMITIDAS: EL SESGO
De
que
depende
la
magnitud
del
sesgo
debido
a
las
variables
omitidas?
• Tomemos
el
modelo
anterior,
y
derivemos
una
expresión
para
el
estimador
β
si
es
que
dejamos
fuera
del
modelo
la
variable
Z:
Cov(Z, X )
β̂ = β + γ
Var( X )
Formalmente:
• Estamos
interesados
en
un
modelo
de
la
forma:
Y = X β
+ ε
• Como
es
claro
de
la
ecuación
de
forma
reducida,
X
esta
correlacionada
con
ε
• Ante
la
presencia
de
causalidad
reversa,
la
estimación
del
efecto
de
X
sobre
Y
por
MCO
estará
sesgada
• En
los
casos
en
los
que
la
causalidad
va
en
ambas
direcciones
(simultaneidad),
el
problema
es
similar
– Solución:
IV
23
ERROR DE MEDICIÓN
25
3. MODELO DE LOS RESULTADOS
POTENCIALES
• Este
modelo
fue
propuesto
inicialmente
en
Neyman
(1923),
y
luego
desarrollado
en
mas
en
detalle
en
Rubin
(1974,
entre
otros).
• Introduzcamos
un
poco
de
terminología:
– Supongamos
que
tenemos
N
individuos,
i
=
1,
…
,
N,
tomados
aleatoriamente
de
una
población
lo
suXicientemente
grande
– Estamos
interesados
en
estimar
el
efecto
de
un
tratamiento
binario
Di
en
un
resultado
Yi
• Di
=1
si
el
individuo
i
ha
sido
expuesto
al
tratamiento
• Di
=0
si
el
individuo
i
no
ha
ha
sido
expuesto
al
tratamiento.
– Dadas
las
posibilidades
(tratamiento
o
control),
existen
dos
potenciales
resultados
para
cada
individuo
i:
• Yi(0)
bajo
la
condición
de
control
• Yi(1)
bajo
la
condición
de
tratamiento
A
pesar
que
es
imposible
observar
al
mismo
tiempo
Yi(0)
e
Yi(1),
en
teoría,
podemos
pensar
en
ambos.
26
EL PROBLEMA FUNDAMENTAL DE LA
INFERENCIA CAUSAL
• DeJinición
1:
Efecto
Causal
Para
cada
individuo
i,
el
efecto
causal
de
D=1
es:
Δ = Y (1) − Y (0)
i i i
27
Necesitamos
pensar
en
términos
de
contrafactuales!
El
Problema
Fundamental
de
la
Inferencia
Causal
Grupo
Y(1)
Y(0)
Tratamiento
(D=1)
Observable
como
Y
Contrafactual
Control
(D=0)
Contrafactual
Observable
como
Y
La
solución
estadística
al
problema
fundamental
de
la
inferencia
causal
está
basada
en
la
estimación
del
efecto
promedio
del
tratamiento,
en
lugar
de
hacerlo
a
nivel
individual
28
Para
cada
individuo
i,
existen
las
variables
(Yi(0),
Yi
(1),
Di).
Sin
embargo,
solo
observamos
(Yi
,
Di),
donde:
(1) Yi = DY
i i (1) + (1 − Di )Yi (0)
30
• Notemos
que,
en
general:
E[Yi
(0)|Di
=
0]
≠
E[Yi
(0)|Di
=
1],
y
E[Yi
(1)|Di
=
1]
≠
E[Yi
(1)|Di
=
0]
• Esto
signiXica
que
los
individuos
que
reciben
el
estatus
de
control,
generalmente
tiene
diferentes
resultados
que
aquellos
en
el
estatus
de
tratamiento.
Por
ello,
el
resultado
promedio
para
un
individuo
en
el
grupo
de
control
E[Yi
(0)|Di
=
0]
no
es
necesariamente
igual
al
resultado
promedio
del
estatus
de
control
para
todos
los
individuos
E[Yi
(0)]
(una
combinación
entre
los
individuos
en
el
estatus
de
control
y
el
grupo
de
tratamiento).
• El
hecho
que
no
observemos
el
resultado
de
control
(Yi
(0))
para
los
individuos
en
el
grupo
de
tratamiento
no
previene
que
podamos
imaginarnos
la
existencia
de
estos
resultados
contrafactuales
– Ej:
Medicina
para
el
colesterol
31
• Sin
embargo,
existe
un
caso
particular
en
el
que
se
cumple:
32
2. EFECTO PROMEDIO DEL TRATAMIENTO SOBRE
LOS TRATADOS
(ATT)
33
• Supuesto
para
estimar
el
ATT:
E[Yi
(0)|Di
=
0]
=
E[Yi
(0)|Di
=1]
=
E[Yi
(0)],
pero
no
es
necesario
que
se
cumpla:
E[Yi
(1)|Di
=
1]
=
E[Yi
(1)|Di
=
0]
=
E[Yi
(1)]
34
EL PROBLEMA DE SELECCIÓN
• Supongamos
que
estamos
interesados
en
estimar
el
ATT
utilizando
datos
observacionales
• Calculemos
la
diferencia
de
medias
simple
(DdM),
o
estimador
naïve:
{
= τ ATT + E !"Yi (0) | Di = 1#$ − E !"Yi (0) | Di = 0#$
}
sesgo de seleccion 35
{ }
DdM = τ ATT + E !"Yi (0) | Di = 1#$ − E !"Yi (0) | Di = 0#$
sesgo de seleccion
37
• Recordemos:
38
• Para
calcular
el
ATT
necesitamos
saber:
E[Yi
(0)|Di=1]
Pregunta
Clave:
39
• En
general,
ninguna
de
estas
condiciones
se
cumplen
cuando
utilizamos
datos
observacionales
(no
experimentales)
debido
a
los
problemas
de
selección
• Sin
embargo,
existe
un
caso
importante
en
el
que
estas
condiciones
se
cumplen:
En
los
experimentos
aleatorizados
40
• Por
lo
tanto,
(8) E !"Yi (0) | Di = 0#$ = E !"Yi (0) | Di = 1#$ = E !"Yi (0)#$
41
• Cuando
tenemos
asignación
aleatoria
del
tratamiento:
ATE = ATT
• En
los
casos
en
los
que
la
asignación
no
es
aleatoria,
debemos
asumir
que
el
tratamiento
es
“tan
bueno
como
asignado
aleatoriamente”.
Este
supuesto
puede
ser
escrito
de
la
siguiente
manera:
(11) {Yi (1), Yi (0)} ⊥ Di
42
• Con
datos
no
experimentales,
debemos
asumir
alguna
forma
de
(11)
o Una
manera:
Argumentar
que
la
asignación
del
tratamiento
es
casi
tan
buena
como
aleatoria,
una
vez
que
controlamos
por
una
serie
de
variables.
A
esto
se
le
llama
selección
sobre
observables
(12) Yi (1),Yi (0) ⊥ Di | X
{ }
o Otra
forma:
Explotar
alguna
fuente
va
variación
exógena
en
los
datos
para
poder
argumentar
que
los
resultados
potenciales
son
independientes
de
asignación
a
la
condición
de
tratamiento.
A
esto
se
le
conoce
como
selección
sobre
no
observables
(13) {Yi (1),Yi (0)} ⊥ Di | X ,εi
43
RESULTADOS POTENCIALES EN MODELOS DE
REGRESIÓN
• Volvamos
a
escribir
los
resultados
observados
de
la
siguiente
manera:
(1') Yi = DY i i (1) + (1 − Di )Yi (0)
+ E(εi | Di = 1) − E(εi | Di = 0)
Sesgo de seleccion
45
• Cuando
el
tratamiento
es
asignado
aleatoriamente,
el
sesgo
de
selección
es
cero:
E(εi | Di = 1) − E(εi | Di = 0) = 0
Sesgo de seleccion
46
EL SUPUESTO DE LA UNIDAD DE TRATAMIENTO
ESTABLE (SUTVA)
• Implica
que:
los
resultaos
potenciales
para
un
individuo
no
son
afectados
por
cambios
potenciales
en
la
exposición
al
tratamiento
de
otros
individuos
(Morgan
y
Winship
2007,
sección
2.4)
47
“NO HAY CAUSALIDAD SIN
MANIPULACIÓN” (HOLLAND 1986)
• Tratamientos
mal
deXinidos
son
aquellos
que
no
pueden
ser
potencialmente
manipulados.
• Por
ejemplo:
o Ella
sacó
una
buena
nota
en
el
examen
porque
es
mujer
o Ella
sacó
una
buena
nota
en
el
examen
porque
estudió
o Ella
sacó
una
buena
nota
en
el
examen
porque
su
tutor
trabajo
mucho
con
ella
48
VENTAJAS DEL MARCO DE ANÁLISIS DE LOS
RESULTADOS POTENCIALES (IMBENS ET AL 2008)
• Nos
permite
deXinir
el
efecto
causal
antes
de
especiXicar
el
mecanismo
de
asignación,
sin
necesidad
de
hacer
supuestos
sobre
la
forma
funcional
o
las
distribuciones
49
5. DISEÑOS DE INVESTIGACIÓN Y CAUSALIDAD
Experimental
Regresión
Diseño
de
Selección
sobre
Investigación
Observables
Matching
No
Experimental
IV
Selección
sobre
No
Observables
Efectos
Fijos/DiD
Regresión
Discontinua
50
6. VALIDEZ EN ECONOMETRÍA
51
VALIDEZ INTERNA VS. VALIDEZ EXTERNA
52
AMENAZAS A LA VALIDEZ INTERNA
• Precedencia
Temporal
Ambigua:
falta
de
claridad
sobre
que
variable
ocurre
primero
• Selección:
Diferencias
sistemáticas
en
las
características
de
los
individuos
• Historia:
Eventos
que
ocurren
al
mismo
tiempo
que
el
tratamiento
• Maduración:
Cambios
que
ocurren
naturalmente
en
el
tiempo
que
pueden
ser
atribuidos
incorrectamente
al
tratamiento
• Atrición:
Perdida
de
tamaño
de
muestra
que
produce
sesgos
en
los
efectos
medidos
del
tratamiento
53
• Testing:
Exposición
al
test
puede
afectar
los
resultados
subsecuentes
del
test
mismo,
lo
cual
puede
estar
correlacionado
con
el
tratamiento
• Instrumentación:
La
naturaleza
de
la
medición
puede
cambiar
en
el
tiempo
o
condición,
de
forma
que
podemos
confundirla
con
el
tratamiento
54
AMENAZAS A LA VALIDEZ EXTERNA
55
• Interacción
del
efecto
causal
con
el
contexto:
Un
efecto
encontrado
en
un
contexto
especiXico
puede
no
mantenerse
si
es
que
estamos
en
un
contexto
diferente
56
Source:
Roe
and
Just
(2009)
57