Clase 1 - Causalidad

MICROECONOMETRÍA
CAUSAL:
TEORÍA Y APLICACIONES A LA ECONOMÍA
POLÍTICA Y DESARROLLO
GIANMARCO LEÓN
UNIVERSIDAD POMPEU FABRA Y
BARCELONA GSE
UNIVERSIDAD SAN MARTÍN DE PORRAS

LIMA, 14-‐18 DE ENERO DE 2013
PRESENTACIÓN
Profesor: Gianmarco León
Contacto:
E-‐mail: [email protected]
Teléfono: 973 84 00 64
Horarios de oXicina:
De lunes a viernes, entre las 5:30 y las 6:30pm. en el
aula 206
Mas información en:
https://sites.google.com/site/gianmarcoleon/
1
CLASES
Días de dictado:
Desde el lunes 14 al viernes 18 de Enero

Hora:
6:30 a 9:30pm. (con un intermedio de 15
minutos)

Ubicación: Aula 206
2
CONTENIDO DEL CURSO
1.  Introducción a la causalidad en econometría
a.  Causalidad y correlación
b.  El modelo de resultados potenciales
c.  ATE, TOT, ITT
2.  Diseños experimentales: Experimentos y Causalidad
3.  Revisión de econometría básica, selección sobre observables y no
observables, y métodos de regresión
a.  Variables instrumentales
b.  Métodos de regresión discontinua
c.  Métodos de diferencias en diferencias
4.  Economía política: Instituciones y Crecimientos económico, y
modelos de Comportamiento Político:
a.  Los Votantes
b.  Candidatos
5.  Economía del Desarrollo: Capital Humano, Salud y Educación
3
MATERIALES
1.  Syllabus
2.  Diapositivas de clase
3.  BibliograXía sugerida
4
FORMA DE TRABAJO
Mi Trabajo:
Presentar claramente el material y responder las
preguntas que surjan en clase

Tú trabajo:
1.  Llegar puntualmente a la clase
2.  Prestar atención y hacer todas las preguntas
relevantes durante la clase
3.  Leer por adelantado los materiales para la clase del
día (dispositivas y referencias sugeridas)
5
PREGUNTAS?
6
DE QUÉ SE TRATA LA ECONOMÍA
(Y LA ECONOMETRÍA)?
•  La economía se trata de hacer preguntas “económicas”

•  Para qué sirve la econometría?
La econometría nos da herramientas estadísticas que nos
ayudan a proveer evidencia cuantitativa para resolver
preguntas económicas interesantes
•  Cuáles son los tipos de análisis empíricos que se hacen
en economía? (Angrist y Krueger 1999)
–  Análisis descriptivos
–  Inferencia Causal
7
•  Estos dos tipos de análisis no son opuestos. En ocasiones
pueden ser complementarios, pero la evidencia empírica
más interesante, es la evidencia que nos da pistas acerca de
la causalidad.
•  Preguntas típicas en economía:

–  La reducción del tamaño de clase mejora la performance de los
estudiantes?
–  Hay discriminación racial en el mercado laboral?
–  Qué determina el crecimiento económico?
–  Cuál será el nivel de inXlación el próximo trimestre?
–  Cómo ha evolucionado la desigualdad alrededor del mundo
durante el siglo XX?
8
a.  Análisis descriptivo
Establece hechos estilizados de la realidad económica
que requieren ser explicados por un razonamiento
teórico, y que nos va a dar nuevas perspectivas sobre
fenómenos económicos

b.  Inferencia Causal
Busca determinar el efecto de ciertas intervenciones
y/o políticas, o estimar el las respuestas en el
comportamiento de los agentes sugeridas por la
teoría económica
9
2. DOS APROXIMACIONES A LA CAUSALIDAD
EN ECONOMETRÍA
•  Dos teorías acerca de la causalidad en econometría (Pearl
2000):
o  Modelos estructurales (Havelmo 1943, Cowles Commission)
o  Modelo de Resultados Potenciales (Neyman 1923, Rubin

1977, Holland 1986).

•  Pero para empezar, qué es causalidad?

“Un efecto causal está deXinido como el resultado de cierta acción o
tratamiento medido en un experimento aleatorio ideal. En tal
experimento, la única razón sistemática para que existan diferencias
en los resultados entre los grupos de tratamiento y de control, es el
tratamiento mismo.” (Stock and Watson 2007, traducción propia)

10
•  Modelos Estructurales

o  La teoría económica es la principal guía de el trabajo

empírico
o  El interés primario de este tipo de trabajo es de recuperar
parámetros fundamentales de la teoría que nos ayuden a
comprender patrones de comportamiento
•  Aproximación a partir del modelo de resultados

potenciales
o  Utiliza la teoría económica para motivar el análisis: La teoría
económica nos da el marco general de acción
o  El énfasis esta en el problema de identiXicación de los efectos
causales de eventos o situaciones especíXicas
11
En el marco de acción guiado por el modelo de
resultados potenciales, el ideal es aproximarnos a un
experimento aleatorio controlado
•  El trabajo empírico en microeconomía aplicada
actualmente se basa cada vez más en el modelo
experimental
•  Sin embargo, el trabajo en la frontera del
conocimiento en esta área es aquel que combina
diseños experimentales con modelos estructurales
(Card, et al. 2012, Mullainathan 2012)
–  Ver Heckman (2005) y Pearl (2000) para una discusión más
XilosóXica sobre el tema.
12
2. PROBLEMAS EN LA ESTIMACIÓN DE
EFECTOS CAUSALES
No todas las correlaciones son relaciones causales!!!

Hay muchas razones por las cuales podemos observar una relación
empírica entre dos variables (X e Y):
o  X → Y causalidad
o  Z → X and Z → Y variables omitidas
o  Y → X causalidad reversa
o  X → Y and Y → X simultaneidad
o  X* → Y error de medición
o  Correlación espúrea
o  Sesgo de selección

Ejemplo: Cuál es el efecto del nivel de educación sobre los ingresos?
13
BUSCANDO EL CONTRAFACTUAL ADECUADO …
•  Para poder determinar el efecto causal de X sobre Y,
necesitamos observar que es lo que sucede con Y cuando
modiXicamos X, manteniendo todo lo demás constante en el
entorno (i.e. Z)
•  Para poder hacer esta comparación, necesitamos cambiar
X en la vida de personas reales (llamemos a este el grupo
de tratamiento), y observar a otro grupo de personas que
sea idéntico al grupo de tratamiento, excepto por el hecho
que para ellos X no cambió (llamémosle el grupo de
control)
•  El contrafactual perfecto: Observar a un mismo individuo
para el cual hayamos modiXicado y mantenido constante X
– Es imposible!
14
VARIABLES OMITIDAS
Cuando aparece el problema de las variables omitidas?
1.  La causa real no es observada.
•  ej. altos salarios para los más educados están realmente
explicados por una mayor habilidad o motivación, pero no
escolaridad
2.  Cuando los individuos seleccionan su propio nivel del
“tratamiento” (deXinido ampliamente)
•  ej. sesgo de selección
3.  Asignación no aleatoria del tratamiento
•  Debido a la decisión de alguien más, el grupo de control no
es un buen contrafactual para el tratamiento. Ej.
Focalización de programas sociales
15
LA MISTERIOSA Z….
•  Supongamos que estamos interesados en estimar el efecto
de un cierto tratamiento sobre una población (X=1), en
relación con un grupo de control (X=0):
Yi = α + β X i + γ Zi + εi
•  Pensemos en esta relación en términos del ejemplo
canónico de el efecto de la educación sobre los salarios: El
salario para un individuo i (Yi) depende de su nivel de
educación (Xi, terminó=1, no terminó=0), la habilidad del
individuo (Zi, alta=1 o baja=0), y si es que el trabajador i se
levantó de la cama por el lado correcto (εi)
16
VARIABLES OMITIDAS: EN MATEMÁTICAS…
•  Estamos interesados en encontrar el efecto de X
sobre Y, manteniendo Z constante.
•  Para ello comparamos la esperanza condicional de
nuestra variable de interés (Y) para los tratados,
con aquella para los del grupo de control:
E[Y | X =1 , Z]− E[Y | X =0 , Z]
•  Para hallar esto, tomemos la esperanza
condicional:
E[Y | X ,Z] = E[α + β X + γ Z + ε ]
= E[α | X ,Z]+ E[ β X | X ,Z]+ E[γ Z | X ,Z]+ E[ε | X ,Z]
= α + β E[ X | X ,Z]+ γ E[Z | X ,Z]+ 0
17
Dependiendo de los distintos valores que pueden

tomar nuestra variable de tratamiento (X), asi
como la variable no observada (Z), la esperanza
matemática de la variable de interés genera 4
potenciales resultados:
E[Y | X =1 ; Z = 1] = α + β + γ
E[Y | X =1 ; Z = 0] = α + β
E[Y | X =0 ; Z = 1] = α + γ
E[Y | X =0 ; Z = 0] = α
18
•  Pero recordemos que Z no es observada, asi que

no podemos condicionar en ella, y por lo tanto, no
podemos calcular E[Y | X =1
, Z]−
E[Y
| X =0
, Z]
.
•  En cambio, solo es posible calcular:
E[Y | X =1 ]− E[Y | X =0] = α + β + γ E[Z | X = 1] − α + γ E[Z | X = 0] ( ) ( )

= β
 
(
+ γ E[Z | X = 1]− E[Z | X = 0]

)
Efecto real
Sesgo debido a la var iable omitida
19
VARIABLES OMITIDAS: EL SESGO
•  De la expresión anterior, podremos estimar el efecto
de X sobre Y sin de sesgo sólo en el caso en el que la
esperanza de Z para el grupo de tratamiento es igual a
la misma esperanza para el grupo de control
•  En términos de nuestro ejemplo, si es que la habilidad
media de los trabajadores que terminaron secundaria
es diferente de la de aquellos que no terminaron
secundaria (grupo de tratamiento y de control), no
será posible separar el efecto real del tratamiento de
aquel de los distintos niveles de habilidad sobre el
salario.
20
VARIABLES OMITIDAS: EL SESGO
De que depende la magnitud del sesgo debido a las variables
omitidas?
•  Tomemos el modelo anterior, y derivemos una expresión
para el estimador β si es que dejamos fuera del modelo la
variable Z:
Cov(Z, X )
β̂ = β + γ
Var( X )
•  La magnitud del sesgo, entonces dependerá de:

–  El tamaño de la correlación entre Z y X
–  La relación entre Z e Y
•  En base a los puntos anteriores, podemos darnos una idea
de (i) el signo del sesgo, y (ii) la magnitud del sesgo. Esto es
útil para la interpretación, sin embargo el sesgo es un
problema que no podemos evitar.
21
CAUSALIDAD REVERSA
Cuando se da la causalidad reversa?

La correlación entre Y y X es causada por una relación
causal que va de Y a X, y no de X a Y
Formalmente:
•  Estamos interesados en un modelo de la forma:
Y = X β + ε

•  La presencia de causalidad reversa implica un modelo

que va en la dirección contraria:
X = Yα + µ
22
•  Reemplazando una ecuación en la otra, y resolviendo
para X, encontramos la expresión en forma reducida
para X:
µ + αε
X=
1 − αβ
•  Como es claro de la ecuación de forma reducida, X esta
correlacionada con ε
•  Ante la presencia de causalidad reversa, la estimación
del efecto de X sobre Y por MCO estará sesgada
•  En los casos en los que la causalidad va en ambas
direcciones (simultaneidad), el problema es similar
–  Solución: IV
23
ERROR DE MEDICIÓN
•  La mayor parte de los datos que utilizamos para

estimar nuestras regresiones están medidos con error
•  Supongamos que el modelo causal es el siguiente:

Y = X *β +ε

•  Sin embargo, solo somos capaces de observar X*, que

equivale a X con cierto “ruido”:
X = X * + µ

•  Los sesgos implicados por errores de medición

dependen de el tipo de ruido que tengamos en los
datos.
–  Error de medición clásico: E(µ | X *) = 0

24
SIMILITUDES ENTRE LOS DISTINTOS
PROBLEMAS DE ESTIMACIÓN
•  Todos son problemas a los que nos enfrentamos a

diario, y que tienen expresiones coloquiales: variables
omitidas, causalidad reversa, etc.
–  Problema común: ej. la prensa!
•  Todos estos problemas tienen una misma expresión

en términos econométricos:
–  Una correlación entre X y el término de error
25
3. MODELO DE LOS RESULTADOS
POTENCIALES
•  Este modelo fue propuesto inicialmente en Neyman (1923), y
luego desarrollado en mas en detalle en Rubin (1974, entre
otros).
•  Introduzcamos un poco de terminología:
–  Supongamos que tenemos N individuos, i = 1, … , N, tomados
aleatoriamente de una población lo suXicientemente grande
–  Estamos interesados en estimar el efecto de un tratamiento binario
Di en un resultado Yi
•  Di =1 si el individuo i ha sido expuesto al tratamiento
•  Di =0 si el individuo i no ha ha sido expuesto al tratamiento.
–  Dadas las posibilidades (tratamiento o control), existen dos
potenciales resultados para cada individuo i:
•  Yi(0) bajo la condición de control
•  Yi(1) bajo la condición de tratamiento

A pesar que es imposible observar al mismo tiempo Yi(0) e Yi(1), en
teoría, podemos pensar en ambos.
26
EL PROBLEMA FUNDAMENTAL DE LA
INFERENCIA CAUSAL
•  DeJinición 1: Efecto Causal
Para cada individuo i, el efecto causal de D=1 es:
Δ = Y (1) − Y (0)
i i i

•  Proposición 1: El problema fundamental de la

inferencia causal (Holland 1986)
No es posible observar al mismo tiempo, y para el
mismo individuo los valores D=1 y D=0, así como los
valores Y(1) e Y(0). Por lo tanto, no es posible estimar el
efecto de de D sobre Y para cada individuo i
27
Necesitamos pensar en términos de contrafactuales!

El Problema Fundamental de la Inferencia Causal
Grupo Y(1) Y(0)
Tratamiento (D=1) Observable como Y Contrafactual
Control (D=0) Contrafactual Observable como Y

La solución estadística al problema fundamental de la
inferencia causal está basada en la estimación del efecto
promedio del tratamiento, en lugar de hacerlo a nivel
individual

28
Para cada individuo i, existen las variables (Yi(0), Yi (1), Di).
Sin embargo, solo observamos (Yi , Di), donde:

(1) Yi = DY
i i (1) + (1 − Di )Yi (0)
•  La distinción entre lo que existe conceptualmente y lo

que observamos es muy sutil, pero es clave para
entender el modelo de resultados potenciales y sus
extensiones
•  Comprender la distinción entre el Yi observado y los
valores contrafactuales, no observadas pero existentes,
(Yi(0) o Yi (1)) es la base para entender el material hacia
delante (o sea, si no entienden, pregunten ahora, o van a
estar perdidos en los próximos días!)
•  Por deXinición:
E[Yi | Di = 1] = E[Yi (1) | Di = 1]
E[Yi | Di = 0] = E[Yi (0) | Di = 0]
29
EFECTO PROMEDIO DEL TRATAMIENTO (ATE)
(2) τ ATE = E [Δi ] = E [Yi (1) − Yi (0)]

= E [Yi (1)] − E [Yi (0)]
•  Aún no lo podemos estimar! (Por qué?)

•  Versión condicional del ATE(X):
(2') τ ATE(X) = E "#Δ i | X $% = E "#Yi (1) −Yi (0) | X $%

= E "#Yi (1) | X $% − E "#Yi (0) | X $%
30
•  Notemos que, en general:
E[Yi (0)|Di = 0] ≠ E[Yi (0)|Di = 1], y
E[Yi (1)|Di = 1] ≠ E[Yi (1)|Di = 0]
•  Esto signiXica que los individuos que reciben el estatus de
control, generalmente tiene diferentes resultados que
aquellos en el estatus de tratamiento. Por ello, el
resultado promedio para un individuo en el grupo de
control E[Yi (0)|Di = 0] no es necesariamente igual al
resultado promedio del estatus de control para todos los
individuos E[Yi (0)] (una combinación entre los
individuos en el estatus de control y el grupo de
tratamiento).
•  El hecho que no observemos el resultado de control (Yi
(0)) para los individuos en el grupo de tratamiento no
previene que podamos imaginarnos la existencia de estos
resultados contrafactuales
–  Ej: Medicina para el colesterol 31
•  Sin embargo, existe un caso particular en el que se
cumple:
E[Yi (0)|Di = 0] = E[Yi (0)|Di = 1] = E[Yi (0)], y

E[Yi (1)|Di = 1] = E[Yi (1)|Di = 0] = E[Yi (1)]

•  Supongamos que la asignación a la condición de
tratamiento D se asigna aleatoriamente. En ese caso,
Y(0) e Y(1) son independientes de D. Esto implica
que la distribución condicional de Yi (0) (e Yi (1)),
dado Di es igual a la distribución incondicional, es
decir, necesariamente se cumplen las igualdades de
las ecuaciones de las líneas anteriores
32
2. EFECTO PROMEDIO DEL TRATAMIENTO SOBRE
LOS TRATADOS (ATT)
(3) τ ATT = E "#Δ i | Di = 1$% = E "#Yi (1) −Yi (0) | Di = 1$%

= E "#Yi (1) | Di = 1$% − E "#Yi (0) | Di = 1$%
•  Aún no lo podemos estimar!
•  Versión condicional del ATT(X):
(3') τ ATT(X) = E "#Δ i X , Di = 1$% = E "#Yi (1) −Yi (0) | X , Di = 1$%

= E "#Yi (1) | X , Di = 1$% − E "#Yi (0) | X , Di = 1$%
33
•  Supuesto para estimar el ATT:

E[Yi (0)|Di = 0] = E[Yi (0)|Di =1] = E[Yi (0)],
pero no es necesario que se cumpla:
E[Yi (1)|Di = 1] = E[Yi (1)|Di = 0] = E[Yi (1)]
•  En otras palabras, estamos dispuestos a asumir que el resultado

potencial de los individuos de control es independiente de la
condición de tratamiento, pero este no es el caso para los
individuos de tratamiento (i.e. el resultado potencial de los
individuos de tratamiento esta correlacionado con la asignación
a la condición de tratamiento)
•  Dicho de otro modo, no existe selección hacia la condición de
tratamiento basado en el valor de la variable de resultado para
los individuos de control, pero si hay selección en base a las
ganancias potenciales de estar en la condición de tratamiento
34
EL PROBLEMA DE SELECCIÓN
•  Supongamos que estamos interesados en estimar el
ATT utilizando datos observacionales
•  Calculemos la diferencia de medias simple (DdM), o
estimador naïve:
(5) DdM = E !"Yi | Di = 1#$ − E !"Yi | Di = 0#$

= E !"Yi (1) | Di = 1#$ − E !"Y (0) | Di = 0#$
= E !"Yi (1) | Di = 1#$ − E !"Yi (0) | Di = 1#$
+E !"Yi (0) | Di = 1#$ − E !"Y (0) | Di = 0#$
{
= τ ATT + E !"Yi (0) | Di = 1#$ − E !"Yi (0) | Di = 0#$

}
sesgo de seleccion 35
{ }
DdM = τ ATT + E !"Yi (0) | Di = 1#$ − E !"Yi (0) | Di = 0#$

sesgo de seleccion
•  El término del sesgo de selección captura la

diferencia en los resultados potenciales de los
tratados y no tratados
•  El resultado promedio para los individuos de
control E[Yi(0)|Di=0] no es necesariamente igual al
resultado promedio (incondicional) para todos los
individuos en la condición del control E[Yi (0)],
que es una combinación del resultado potencial de
los individuos tratados y no tratados.
–  Ej: tratamiento de colesterol
36
EL ESTÁNDAR DE ORO: LOS EXPERIMENTOS
•  Idea clave de esta sección del curso:

Cómo diseñar una estrategia de investigación que nos
permita aproximarnos lo mas posible a una situación en
la cual el tratamiento se asigna aleatoriamente
•  Angrist y Pischke (2009): La asignación aleatoria es el

diseño de investigación mas creíble e inXluyente, pues
puede resolver el problema de selección
37
•  Recordemos:
El Problema Fundamental de la Inferencia Causal

Grupo Y(1) Y(0)
Tratamiento (D=1) Observable como Y Contrafactual
Control (D=0) Contrafactual Observable como Y
•  Donde se cumple lo siguiente:

E !"Yi | Di = 1#$ = E !"Y (1) | Di = 1#$ = E !"Y (1) | Di = 0#$
E !"Yi | Di = 0#$ = E !"Yi (0) | Di = 0#$ = E !"Yi (0) | Di = 1#$
38
•  Para calcular el ATT necesitamos saber: E[Yi (0)|Di=1]
•  Para calcular el ATE, necesitamos saber ambos

contrafactuales (E[Yi (0)|Di=1] y E[Yi (1)|Di=0])
Pregunta Clave:

•  En que casos son ciertas las siguientes expresiones?
(6) E !"Yi (0) | Di = 1#$ = E !"Yi (0) | Di = 0#$
(7) E !"Yi (1) | Di = 0#$ = E !"Yi (1) | Di = 1#$
39
•  En general, ninguna de estas condiciones se cumplen
cuando utilizamos datos observacionales (no
experimentales) debido a los problemas de selección
•  Sin embargo, existe un caso importante en el que estas
condiciones se cumplen: En los experimentos
aleatorizados

En este caso, el tratamiento D es independiente de los

resultados potenciales Y(1) e Y(0)
40
•  Por lo tanto,
(8) E !"Yi (0) | Di = 0#$ = E !"Yi (0) | Di = 1#$ = E !"Yi (0)#$
(9) E !"Yi (1) | Di = 1#$ = E !"Yi (1) | Di = 0#$ = E !"Yi (1)#$

•  Con estas condiciones, podemos estimar el ATE:

(10) τ ATE = E "#Δ i $% = E "#Yi (1) −Yi (0)$% = E "#Yi (1)$% − E "#Yi (0)$%
= E "#Yi (1) | Di = 1$% − E "#Yi (0) | Di = 0$%
= E "#Yi | Di = 1$% − E "#Yi | Di = 0$%
41
•  Cuando tenemos asignación aleatoria del tratamiento:
ATE = ATT
•  En los casos en los que la asignación no es aleatoria,
debemos asumir que el tratamiento es “tan bueno
como asignado aleatoriamente”. Este supuesto
puede ser escrito de la siguiente manera:
(11) {Yi (1), Yi (0)} ⊥ Di
•  Es importante notar que para estimar el ATT se

requiere un supuesto menos fuerte que (11)
42
•  Con datos no experimentales, debemos asumir alguna
forma de (11)
o  Una manera: Argumentar que la asignación del tratamiento
es casi tan buena como aleatoria, una vez que controlamos
por una serie de variables. A esto se le llama selección sobre
observables

(12) Yi (1),Yi (0) ⊥ Di | X
{ }

o  Otra forma: Explotar alguna fuente va variación exógena en
los datos para poder argumentar que los resultados
potenciales son independientes de asignación a la condición
de tratamiento. A esto se le conoce como selección sobre no
observables
(13) {Yi (1),Yi (0)} ⊥ Di | X ,εi
43
RESULTADOS POTENCIALES EN MODELOS DE
REGRESIÓN
•  Volvamos a escribir los resultados observados de la
siguiente manera:
(1') Yi = DY i i (1) + (1 − Di )Yi (0)
= Yi (0) + {Yi (1) − Yi (0)} Di

•  Lo cual es análogo a:

(14) Yi = α + β Di + ε i
•  Re escribamos (1’) de la siguiente manera:

(1'') Yi = Yi (0) + {Yi (1) −Yi (0)} Di
= E{Yi (0)} + {Yi (1) −Yi (0)} Di +Yi (0) − E{Yi (0)}
     
44
α β εi
•  Tomando expectativas de (14), condicionando sobre
D:
(15) E(Yi | Di = 1) = α + β + E(εi | Di = 1)
E(Yi | Di = 0) = α + E(εi | Di = 0)
•  Estimando β usando MCO, tenemos:

(16) E(Yi | Di = 1) − E(Yi | Di = 0) = β

Efecto del tratamiento
+ E(εi | Di = 1) − E(εi | Di = 0)

Sesgo de seleccion
45
•  Cuando el tratamiento es asignado aleatoriamente, el
sesgo de selección es cero:
E(εi | Di = 1) − E(εi | Di = 0) = 0

Sesgo de seleccion
•  Con lo cual:
(17) E(Yi | Di = 1) − E(Yi | Di = 0) = β


Efecto del tratamiento
46
EL SUPUESTO DE LA UNIDAD DE TRATAMIENTO
ESTABLE (SUTVA)
•  Implica que:
los resultaos potenciales para un individuo no son
afectados por cambios potenciales en la exposición al
tratamiento de otros individuos (Morgan y Winship
2007, sección 2.4)

•  Una manera de entender SUTVA: no hay efectos de

equilibrio general debido al tratamiento
•  Ejemplo: Miguel y Kremer (Econometrica, 2004)
47
“NO HAY CAUSALIDAD SIN
MANIPULACIÓN” (HOLLAND 1986)
•  Tratamientos mal deXinidos son aquellos que no
pueden ser potencialmente manipulados.
•  Por ejemplo:
o  Ella sacó una buena nota en el examen porque es mujer
o  Ella sacó una buena nota en el examen porque estudió
o  Ella sacó una buena nota en el examen porque su tutor
trabajo mucho con ella
•  En que caso los resultados potenciales están

correctamente deXinidos?
48
VENTAJAS DEL MARCO DE ANÁLISIS DE LOS
RESULTADOS POTENCIALES (IMBENS ET AL 2008)
•  Nos permite deXinir el efecto causal antes de especiXicar el
mecanismo de asignación, sin necesidad de hacer
supuestos sobre la forma funcional o las distribuciones
•  Conecta el análisis de efectos causales a manipulaciones

especíXicas
•  Separa el modelo de los resultados potenciales de el
mecanismo de asignación al tratamiento
•  Permite formular los supuestos probabilísticos en
términos de variables potencialmente observables, en
lugar de hacerlo en términos de variables no observables
•  Es claro cuál es la fuente de incertidumbre en los
estimadores
49
5. DISEÑOS DE INVESTIGACIÓN Y CAUSALIDAD
Experimental
Regresión
Diseño de Selección sobre
Investigación Observables Matching
No Experimental
IV
Selección sobre
No Observables Efectos Fijos/DiD
Regresión
Discontinua
50
6. VALIDEZ EN ECONOMETRÍA
•  “Validez” se reXiere a aproximarse a la verdad a partir

de inferencia (Shadish, Cook y Campbell 2002).
•  Tipos de validez:
–  Validez interna
–  Validez Externa
–  Conclusión estadística de validez
–  Validez construida
•  Nos enfocaremos en las dos primeras
51
VALIDEZ INTERNA VS. VALIDEZ EXTERNA
•  DeJinición 2: Validez interna

Se reWiere a la validez acerca de inferencias sobre si es
que la covarianza observada entre X e Y reWleja una
relación causal de X a Y en la forma en la que las
variables fueron manipuladas o medidas

•  DeJinición 3: Validez Externa

Se reWiere a la validez de inferencias acerca de si una
relación causal se mantiene sobre variaciones en
personas, contextos, tratamientos y resultados
52
AMENAZAS A LA VALIDEZ INTERNA
•  Precedencia Temporal Ambigua: falta de claridad sobre que
variable ocurre primero
•  Selección: Diferencias sistemáticas en las características de
los individuos
•  Historia: Eventos que ocurren al mismo tiempo que el
tratamiento
•  Maduración: Cambios que ocurren naturalmente en el
tiempo que pueden ser atribuidos incorrectamente al
tratamiento
•  Atrición: Perdida de tamaño de muestra que produce
sesgos en los efectos medidos del tratamiento
53
•  Testing: Exposición al test puede afectar los resultados
subsecuentes del test mismo, lo cual puede estar
correlacionado con el tratamiento
•  Instrumentación: La naturaleza de la medición puede
cambiar en el tiempo o condición, de forma que
podemos confundirla con el tratamiento
54
AMENAZAS A LA VALIDEZ EXTERNA
•  Interacción de la relación causal con las unidades de

observación: Un efecto encontrado en un tipo de unidades
puede no mantenerse si es que otras fueran las unidades a
ser estudiadas
•  Interacción entre la relación causal sobre variaciones del
tratamiento: Un efecto encontrado con un tipo de
tratamiento puede no mantenerse cuando aplicamos otro
tipo de tratamiento
•  Interacción de la relación causal con el resultado: Un efecto
encontrado con un tipo de resultado puede no mantenerse
si es que medimos otro resultado
55
•  Interacción del efecto causal con el contexto: Un efecto
encontrado en un contexto especiXico puede no
mantenerse si es que estamos en un contexto
diferente
•  Mediación dependiente del contexto: Un mediador de la

relación causal en un contexto puede no ser el mismo
en otro contexto
56
Source: Roe and Just (2009) 57

Clase 1 - Causalidad

Cargado por

Copyright:

Formatos disponibles

Clase 1 - Causalidad

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase 1 - Causalidad

Cargado por

Copyright:

Formatos disponibles

MICROECONOMETRÍA

UNIVERSIDAD SAN MARTÍN DE PORRAS

• La economía se trata de hacer preguntas “económicas”

• Preguntas típicas en economía:

o Modelo de Resultados Potenciales (Neyman 1923, Rubin

• Pero para empezar, qué es causalidad?

o La teoría económica es la principal guía de el trabajo

• Aproximación a partir del modelo de resultados

Dependiendo de los distintos valores que pueden

• Pero recordemos que Z no es observada, asi que

• La magnitud del sesgo, entonces dependerá de:

Cuando se da la causalidad reversa?

• La presencia de causalidad reversa implica un modelo

• La mayor parte de los datos que utilizamos para

• Sin embargo, solo somos capaces de observar X*, que

• Los sesgos implicados por errores de medición

• Todos son problemas a los que nos enfrentamos a

• Todos estos problemas tienen una misma expresión

• Proposición 1: El problema fundamental de la

• La distinción entre lo que existe conceptualmente y lo

(2) τ ATE = E [Δi ] = E [Yi (1) − Yi (0)]

• Aún no lo podemos estimar! (Por qué?)

(2') τ ATE(X) = E "#Δ i | X $% = E "#Yi (1) −Yi (0) | X $%

E[Yi (0)|Di = 0] = E[Yi (0)|Di = 1] = E[Yi (0)], y

(3) τ ATT = E "#Δ i | Di = 1$% = E "#Yi (1) −Yi (0) | Di = 1$%

(3') τ ATT(X) = E "#Δ i X , Di = 1$% = E "#Yi (1) −Yi (0) | X , Di = 1$%

• En otras palabras, estamos dispuestos a asumir que el resultado

(5) DdM = E !"Yi | Di = 1#$ − E !"Yi | Di = 0#$

• El término del sesgo de selección captura la

• Idea clave de esta sección del curso:

• Angrist y Pischke (2009): La asignación aleatoria es el

El Problema Fundamental de la Inferencia Causal

• Donde se cumple lo siguiente:

• Para calcular el ATE, necesitamos saber ambos

• En que casos son ciertas las siguientes expresiones?

(6) E !"Yi (0) | Di = 1#$ = E !"Yi (0) | Di = 0#$

(7) E !"Yi (1) | Di = 0#$ = E !"Yi (1) | Di = 1#$

En este caso, el tratamiento D es independiente de los

(9) E !"Yi (1) | Di = 1#$ = E !"Yi (1) | Di = 0#$ = E !"Yi (1)#$

• Con estas condiciones, podemos estimar el ATE:

• Es importante notar que para estimar el ATT se

= Yi (0) + {Yi (1) − Yi (0)} Di

• Lo cual es análogo a:

• Re escribamos (1’) de la siguiente manera:

• Estimando β usando MCO, tenemos:

• Con lo cual:

(17) E(Yi | Di = 1) − E(Yi | Di = 0) = β

• Una manera de entender SUTVA: no hay efectos de

• En que caso los resultados potenciales están

• Conecta el análisis de efectos causales a manipulaciones

• “Validez” se reXiere a aproximarse a la verdad a partir

• Nos enfocaremos en las dos primeras

• DeJinición 2: Validez interna

• DeJinición 3: Validez Externa

• Interacción de la relación causal con las unidades de

• Mediación dependiente del contexto: Un mediador de la

También podría gustarte

•  La economía se trata de hacer preguntas “económicas”

•  Preguntas típicas en economía:

o  Modelo de Resultados Potenciales (Neyman 1923, Rubin

•  Pero para empezar, qué es causalidad?

o  La teoría económica es la principal guía de el trabajo

•  Aproximación a partir del modelo de resultados

•  Pero recordemos que Z no es observada, asi que

•  La magnitud del sesgo, entonces dependerá de:

•  La presencia de causalidad reversa implica un modelo

•  La mayor parte de los datos que utilizamos para

•  Sin embargo, solo somos capaces de observar X*, que

•  Los sesgos implicados por errores de medición

•  Todos son problemas a los que nos enfrentamos a

•  Todos estos problemas tienen una misma expresión

•  Proposición 1: El problema fundamental de la

•  La distinción entre lo que existe conceptualmente y lo

•  Aún no lo podemos estimar! (Por qué?)

•  En otras palabras, estamos dispuestos a asumir que el resultado

•  El término del sesgo de selección captura la

•  Idea clave de esta sección del curso:

•  Angrist y Pischke (2009): La asignación aleatoria es el

•  Donde se cumple lo siguiente:

•  Para calcular el ATE, necesitamos saber ambos

•  En que casos son ciertas las siguientes expresiones?

•  Con estas condiciones, podemos estimar el ATE:

•  Es importante notar que para estimar el ATT se

•  Lo cual es análogo a:

•  Re escribamos (1’) de la siguiente manera:

•  Estimando β usando MCO, tenemos:

•  Con lo cual:

•  Una manera de entender SUTVA: no hay efectos de

•  En que caso los resultados potenciales están

•  Conecta el análisis de efectos causales a manipulaciones

•  “Validez” se reXiere a aproximarse a la verdad a partir

•  Nos enfocaremos en las dos primeras

•  DeJinición 2: Validez interna

•  DeJinición 3: Validez Externa

•  Interacción de la relación causal con las unidades de

•  Mediación dependiente del contexto: Un mediador de la