Clase 1 - Causalidad

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 58

MICROECONOMETRÍA

 CAUSAL:    
TEORÍA  Y  APLICACIONES  A  LA  ECONOMÍA  
POLÍTICA  Y  DESARROLLO  

GIANMARCO  LEÓN  
UNIVERSIDAD  POMPEU  FABRA  Y  
BARCELONA  GSE  

UNIVERSIDAD  SAN  MARTÍN  DE  PORRAS  


LIMA,  14-­‐18  DE  ENERO  DE  2013  
PRESENTACIÓN  
Profesor:  Gianmarco  León  
Contacto:  
E-­‐mail:  [email protected]  
Teléfono:  973  84  00  64  
Horarios  de  oXicina:    
De  lunes  a  viernes,  entre  las  5:30  y  las  6:30pm.  en  el  
aula  206  
Mas  información  en:    
https://sites.google.com/site/gianmarcoleon/  
  1  
CLASES  
Días  de  dictado:    
Desde  el  lunes  14  al  viernes  18  de  Enero  
 
Hora:    
6:30  a  9:30pm.  (con  un  intermedio  de  15  
minutos)  
 
Ubicación:  Aula  206  

2  
CONTENIDO  DEL  CURSO  
1.  Introducción  a  la  causalidad  en  econometría  
a.  Causalidad  y  correlación  
b.  El  modelo  de  resultados  potenciales  
c.  ATE,  TOT,  ITT  
2.  Diseños  experimentales:  Experimentos  y  Causalidad  
3.  Revisión  de  econometría  básica,  selección  sobre  observables  y  no  
observables,  y  métodos  de  regresión  
a.  Variables  instrumentales  
b.  Métodos  de  regresión  discontinua  
c.  Métodos  de  diferencias  en  diferencias  
4.  Economía  política:  Instituciones  y  Crecimientos  económico,  y    
modelos  de  Comportamiento  Político:  
a.  Los  Votantes  
b.  Candidatos  
5.  Economía  del  Desarrollo:  Capital  Humano,  Salud  y  Educación  

3  
MATERIALES  

1.  Syllabus  
2.  Diapositivas  de  clase  
3.  BibliograXía  sugerida  

4  
FORMA DE TRABAJO  
Mi  Trabajo:  
Presentar  claramente  el  material  y  responder  las  
preguntas  que  surjan  en  clase  
 
Tú  trabajo:  
1.  Llegar  puntualmente  a  la  clase  
2.  Prestar  atención  y  hacer  todas  las  preguntas  
relevantes  durante  la  clase  
3.  Leer  por  adelantado  los  materiales  para  la  clase  del  
día  (dispositivas  y  referencias  sugeridas)  

5  
PREGUNTAS?  

6  
DE QUÉ SE TRATA LA ECONOMÍA
(Y LA ECONOMETRÍA)?  

•  La  economía  se  trata  de  hacer  preguntas  “económicas”  


•  Para  qué  sirve  la  econometría?  
La  econometría  nos  da  herramientas    estadísticas  que  nos  
ayudan  a  proveer  evidencia  cuantitativa  para  resolver  
preguntas  económicas  interesantes  
•  Cuáles  son  los  tipos  de  análisis  empíricos  que  se  hacen  
en  economía?  (Angrist  y  Krueger  1999)  
–  Análisis  descriptivos  
–  Inferencia  Causal  

7  
•  Estos  dos  tipos  de  análisis  no  son  opuestos.  En  ocasiones  
pueden  ser  complementarios,  pero  la  evidencia  empírica  
más  interesante,  es  la  evidencia  que  nos  da  pistas  acerca  de  
la  causalidad.  

•  Preguntas  típicas  en  economía:  


 

–  La  reducción  del  tamaño  de  clase  mejora  la  performance  de  los  
estudiantes?  
–  Hay  discriminación  racial  en  el  mercado  laboral?  
–  Qué  determina  el  crecimiento  económico?  
–  Cuál  será  el  nivel  de  inXlación  el  próximo  trimestre?  
–  Cómo  ha  evolucionado  la  desigualdad  alrededor  del  mundo  
durante  el  siglo  XX?  

8  
a.  Análisis  descriptivo  
 Establece  hechos  estilizados  de  la  realidad  económica  
que  requieren  ser  explicados  por  un  razonamiento  
teórico,  y  que  nos  va  a  dar  nuevas  perspectivas  sobre  
fenómenos  económicos  
 
b.  Inferencia  Causal  
 Busca  determinar  el  efecto  de  ciertas  intervenciones  
y/o  políticas,  o  estimar  el  las  respuestas  en  el  
comportamiento  de  los  agentes  sugeridas  por  la  
teoría  económica  

9  
2. DOS APROXIMACIONES A LA CAUSALIDAD
EN ECONOMETRÍA
•  Dos  teorías  acerca  de  la  causalidad  en  econometría  (Pearl  
2000):    
o  Modelos  estructurales  (Havelmo  1943,  Cowles  Commission)  

o  Modelo  de  Resultados  Potenciales  (Neyman  1923,  Rubin  


1977,  Holland  1986).    
 

•  Pero  para  empezar,  qué  es  causalidad?  


 “Un  efecto  causal  está  deXinido  como  el  resultado  de  cierta  acción  o  
tratamiento  medido  en  un  experimento  aleatorio  ideal.  En  tal  
experimento,  la  única  razón  sistemática  para  que  existan  diferencias  
en  los  resultados  entre  los  grupos  de  tratamiento  y  de  control,  es  el  
tratamiento  mismo.”  (Stock  and  Watson  2007,  traducción  propia)  
 

10  
•  Modelos  Estructurales  
 

o  La  teoría  económica  es  la  principal  guía  de  el  trabajo  


empírico  
o  El  interés  primario  de  este  tipo  de  trabajo  es  de  recuperar  
parámetros  fundamentales  de  la  teoría  que  nos  ayuden  a  
comprender  patrones  de  comportamiento  

•  Aproximación  a  partir  del  modelo  de  resultados  


potenciales  

o  Utiliza  la  teoría  económica  para  motivar  el  análisis:  La  teoría  
económica  nos  da  el  marco  general  de  acción  
o  El  énfasis  esta  en  el  problema  de  identiXicación  de  los  efectos  
causales  de  eventos  o  situaciones  especíXicas  

11  
En  el  marco  de  acción  guiado  por  el  modelo  de  
resultados  potenciales,  el  ideal  es  aproximarnos  a  un  
experimento  aleatorio  controlado  
•  El  trabajo  empírico  en  microeconomía  aplicada    
actualmente  se  basa  cada  vez  más  en  el  modelo  
experimental  
•  Sin  embargo,  el  trabajo  en  la  frontera  del  
conocimiento  en  esta  área  es  aquel  que  combina  
diseños  experimentales  con  modelos  estructurales  
(Card,  et  al.  2012,  Mullainathan  2012)  
–  Ver  Heckman  (2005)  y  Pearl  (2000)  para  una  discusión  más  
XilosóXica  sobre  el  tema.  

12  
2. PROBLEMAS EN LA ESTIMACIÓN DE
EFECTOS CAUSALES
No  todas  las  correlaciones  son  relaciones  causales!!!  
 
Hay  muchas  razones  por  las  cuales  podemos  observar  una  relación  
empírica  entre  dos  variables  (X  e  Y):  

o  X  →  Y        causalidad    
o  Z  →  X  and  Z  →  Y  variables  omitidas  
o  Y  →  X        causalidad  reversa  
o  X  →  Y  and  Y  →  X  simultaneidad  
o  X*  →  Y      error  de  medición  
o  Correlación  espúrea  
o  Sesgo  de  selección    
 
Ejemplo:  Cuál  es  el  efecto  del  nivel  de  educación  sobre  los  ingresos?  

13  
BUSCANDO EL CONTRAFACTUAL ADECUADO …  
•  Para  poder  determinar  el  efecto  causal  de  X  sobre  Y,  
necesitamos  observar  que  es  lo  que  sucede  con  Y  cuando  
modiXicamos  X,  manteniendo  todo  lo  demás  constante  en  el  
entorno  (i.e.  Z)  
•  Para  poder  hacer  esta  comparación,  necesitamos  cambiar  
X  en  la  vida  de  personas  reales  (llamemos  a  este  el  grupo  
de  tratamiento),  y  observar  a  otro  grupo  de  personas  que  
sea  idéntico  al  grupo  de  tratamiento,  excepto  por  el  hecho  
que  para  ellos  X  no  cambió  (llamémosle  el  grupo  de  
control)  
•  El  contrafactual  perfecto:  Observar  a  un  mismo  individuo  
para  el  cual  hayamos  modiXicado  y  mantenido  constante  X  
–  Es  imposible!    

14  
VARIABLES OMITIDAS  
Cuando  aparece  el  problema  de  las  variables  omitidas?  
1.  La  causa  real  no  es  observada.  
•  ej.  altos  salarios  para  los  más  educados  están  realmente  
explicados  por  una  mayor  habilidad  o  motivación,  pero  no  
escolaridad  
2.  Cuando  los  individuos  seleccionan  su  propio  nivel  del  
“tratamiento”  (deXinido  ampliamente)  
•  ej.  sesgo  de  selección  
3.  Asignación  no  aleatoria  del  tratamiento  
•  Debido  a  la  decisión  de  alguien  más,  el  grupo  de  control  no  
es  un  buen  contrafactual  para  el  tratamiento.  Ej.  
Focalización  de  programas  sociales  

15  
LA MISTERIOSA Z….
•  Supongamos  que  estamos  interesados  en  estimar  el  efecto  
de  un  cierto  tratamiento  sobre  una  población  (X=1),  en  
relación  con  un  grupo  de  control  (X=0):  

Yi = α + β X i + γ Zi + εi
•  Pensemos  en  esta  relación  en  términos  del  ejemplo  
canónico  de  el  efecto  de  la  educación  sobre  los  salarios:  El  
salario  para  un  individuo  i  (Yi)  depende  de  su  nivel  de  
educación  (Xi,  terminó=1,  no  terminó=0),  la  habilidad  del  
individuo  (Zi,  alta=1  o  baja=0),  y  si  es  que  el  trabajador  i  se  
levantó  de  la  cama  por  el  lado  correcto  (εi)  

16  
VARIABLES OMITIDAS: EN MATEMÁTICAS…
•  Estamos  interesados  en  encontrar  el  efecto  de  X  
sobre  Y,  manteniendo  Z  constante.  
•  Para  ello  comparamos  la  esperanza  condicional  de  
nuestra  variable  de  interés  (Y)  para  los  tratados,  
con  aquella  para  los  del  grupo  de  control:  
E[Y | X =1 , Z]− E[Y | X =0 , Z]
•  Para  hallar  esto,  tomemos  la  esperanza  
condicional:  
E[Y     | X ,Z] = E[α + β X + γ Z + ε ]
  = E[α | X ,Z]+ E[ β X | X ,Z]+ E[γ Z | X ,Z]+ E[ε | X ,Z]
  = α + β E[ X | X ,Z]+ γ E[Z | X ,Z]+ 0
17  
VARIABLES OMITIDAS: EN MATEMÁTICAS…

Dependiendo  de  los  distintos  valores  que  pueden  


tomar  nuestra  variable  de  tratamiento  (X),  asi  
como  la  variable  no  observada  (Z),  la  esperanza  
matemática  de  la  variable  de  interés  genera  4  
potenciales  resultados:  
E[Y | X =1 ; Z = 1] = α + β + γ
E[Y | X =1 ; Z = 0] = α + β
E[Y | X =0 ; Z = 1] = α + γ
E[Y | X =0 ; Z = 0] = α

18  
VARIABLES OMITIDAS: EN MATEMÁTICAS…

•  Pero  recordemos  que  Z  no  es  observada,  asi  que  


no  podemos  condicionar  en  ella,  y  por  lo  tanto,  no  
podemos  calcular    E[Y            |    X      =1
         ,    Z]−
           E[Y
             |    X      =0
         ,  Z]
       .    
•  En  cambio,  solo  es  posible  calcular:  
E[Y | X =1 ]− E[Y | X =0] = α + β + γ E[Z | X = 1] − α + γ E[Z | X = 0] ( ) ( )
   
= β
 
(
+ γ E[Z | X = 1]− E[Z | X = 0]

)
Efecto real
Sesgo debido a la var iable omitida

19  
VARIABLES OMITIDAS: EL SESGO
•  De  la  expresión  anterior,  podremos  estimar  el  efecto  
de  X  sobre  Y  sin  de  sesgo  sólo  en  el  caso  en  el  que  la  
esperanza  de  Z  para  el  grupo  de  tratamiento  es  igual  a  
la  misma  esperanza  para  el  grupo  de  control  
•  En  términos  de  nuestro  ejemplo,  si  es  que  la  habilidad  
media  de  los  trabajadores  que  terminaron  secundaria  
es  diferente  de  la  de  aquellos  que  no  terminaron  
secundaria  (grupo  de  tratamiento  y  de  control),  no  
será  posible  separar  el  efecto  real  del  tratamiento  de  
aquel  de  los  distintos  niveles  de  habilidad  sobre  el  
salario.  
20  
VARIABLES OMITIDAS: EL SESGO
De  que  depende  la  magnitud  del  sesgo  debido  a  las  variables  
omitidas?  
•  Tomemos  el  modelo  anterior,  y  derivemos  una  expresión  
para  el  estimador  β  si  es  que  dejamos  fuera  del  modelo  la  
variable  Z:  
Cov(Z, X )
β̂ = β + γ
Var( X )

•  La  magnitud  del  sesgo,  entonces  dependerá  de:  


–  El  tamaño  de  la  correlación  entre  Z  y  X  
–  La  relación  entre  Z  e  Y  
•  En  base  a  los  puntos  anteriores,  podemos  darnos  una  idea  
de  (i)  el  signo  del  sesgo,  y  (ii)  la  magnitud  del  sesgo.  Esto  es  
útil  para  la  interpretación,  sin  embargo  el  sesgo  es  un  
problema  que  no  podemos  evitar.  
21  
CAUSALIDAD REVERSA

Cuando  se  da  la  causalidad  reversa?  


 La  correlación  entre  Y  y  X  es  causada  por  una  relación  
 causal  que  va  de  Y  a  X,  y  no  de  X  a  Y  

Formalmente:  
•  Estamos  interesados  en  un  modelo  de  la  forma:  
Y = X β  + ε
 

•  La  presencia  de  causalidad  reversa  implica  un  modelo  


que  va  en  la  dirección  contraria:  
X = Yα + µ
22  
•  Reemplazando  una  ecuación  en  la  otra,  y  resolviendo  
para  X,  encontramos  la  expresión  en  forma  reducida  
para  X:  
µ + αε
X=
1 − αβ

•  Como  es  claro  de  la  ecuación  de  forma  reducida,  X  esta  
correlacionada  con  ε    
•  Ante  la  presencia  de  causalidad  reversa,  la  estimación  
del  efecto  de  X  sobre  Y  por  MCO  estará  sesgada  
•  En  los  casos  en  los  que  la  causalidad  va  en  ambas  
direcciones  (simultaneidad),  el  problema  es  similar  
–  Solución:  IV  
  23  
ERROR DE MEDICIÓN

•  La  mayor  parte  de  los  datos  que  utilizamos  para  


estimar  nuestras  regresiones  están  medidos  con  error  
•  Supongamos  que  el  modelo  causal  es  el  siguiente:  
 
Y = X *β +ε
 

•  Sin  embargo,  solo  somos  capaces  de  observar  X*,  que  


equivale  a  X  con  cierto  “ruido”:  
X = X  * + µ
 

•  Los  sesgos  implicados  por  errores  de  medición  


dependen  de  el  tipo  de  ruido  que  tengamos  en  los  
datos.  
–  Error  de  medición  clásico:   E(µ | X *) = 0
 
24  
SIMILITUDES ENTRE LOS DISTINTOS
PROBLEMAS DE ESTIMACIÓN

•  Todos  son  problemas  a  los  que  nos  enfrentamos  a  


diario,  y  que  tienen  expresiones  coloquiales:  variables  
omitidas,  causalidad  reversa,  etc.  
–  Problema  común:  ej.  la  prensa!  

•  Todos  estos  problemas  tienen  una  misma  expresión  


en  términos  econométricos:    
–  Una  correlación  entre  X  y  el  término  de  error  

25  
3. MODELO DE LOS RESULTADOS
POTENCIALES
•  Este  modelo  fue  propuesto  inicialmente  en  Neyman  (1923),  y  
luego  desarrollado  en  mas  en  detalle  en  Rubin  (1974,  entre  
otros).    
•  Introduzcamos  un  poco  de  terminología:  
–  Supongamos  que  tenemos  N  individuos,  i  =  1,  …  ,  N,  tomados  
aleatoriamente  de  una  población  lo  suXicientemente  grande  
–  Estamos  interesados  en  estimar  el  efecto  de  un  tratamiento  binario  
Di  en  un  resultado  Yi  
•  Di  =1  si  el  individuo  i  ha  sido  expuesto  al  tratamiento  
•  Di  =0  si  el  individuo  i  no  ha  ha  sido  expuesto  al  tratamiento.  
–  Dadas  las  posibilidades  (tratamiento  o  control),  existen  dos  
potenciales  resultados  para  cada  individuo  i:  
•  Yi(0)  bajo  la  condición  de  control  
•  Yi(1)  bajo  la  condición  de  tratamiento  
 
A  pesar  que  es  imposible  observar  al  mismo  tiempo  Yi(0)  e  Yi(1),  en  
teoría,  podemos  pensar  en  ambos.    
26  
EL PROBLEMA FUNDAMENTAL DE LA
INFERENCIA CAUSAL  
•  DeJinición  1:  Efecto  Causal  
 Para  cada  individuo  i,  el  efecto  causal  de  D=1  es:  
    Δ = Y (1) − Y (0)
  i i i
 

•  Proposición  1:  El  problema  fundamental  de  la  


inferencia  causal  (Holland  1986)  
 No  es  posible  observar  al  mismo  tiempo,  y  para  el  
mismo  individuo  los  valores  D=1  y  D=0,  así  como  los  
valores  Y(1)  e  Y(0).  Por  lo  tanto,  no  es  posible  estimar  el  
efecto  de  de  D  sobre  Y  para  cada  individuo  i  

27  
Necesitamos  pensar  en  términos  de    contrafactuales!  
 
  El  Problema  Fundamental  de  la  Inferencia  Causal  
 Grupo   Y(1)   Y(0)  
 Tratamiento  (D=1)   Observable  como  Y   Contrafactual  
 Control  (D=0)   Contrafactual   Observable  como  Y  
 
La  solución  estadística  al  problema  fundamental  de  la  
inferencia  causal  está  basada  en  la  estimación  del  efecto  
promedio  del  tratamiento,  en  lugar  de  hacerlo  a  nivel  
individual  
 
28  
Para  cada  individuo  i,  existen  las  variables  (Yi(0),  Yi  (1),  Di).  
Sin  embargo,  solo  observamos  (Yi  ,  Di),  donde:    
   
(1) Yi = DY
i i (1) + (1 − Di )Yi (0)

•  La  distinción  entre  lo  que  existe  conceptualmente  y  lo  


que  observamos  es  muy  sutil,  pero  es  clave  para  
entender  el  modelo  de  resultados  potenciales  y  sus  
extensiones  
•  Comprender  la  distinción  entre  el  Yi    observado  y  los  
valores  contrafactuales,  no  observadas  pero  existentes,  
(Yi(0)  o  Yi  (1))  es  la  base  para  entender  el  material  hacia  
delante  (o  sea,  si  no  entienden,  pregunten  ahora,  o  van  a  
estar  perdidos  en  los  próximos  días!)  
•  Por  deXinición:  
  E[Yi | Di = 1] = E[Yi (1) | Di = 1]
E[Yi | Di = 0] = E[Yi (0) | Di = 0]
29  
EFECTO PROMEDIO DEL TRATAMIENTO (ATE)

(2) τ ATE = E [Δi ] = E [Yi (1) − Yi (0)]


= E [Yi (1)] − E [Yi (0)]

•  Aún  no  lo  podemos  estimar!  (Por  qué?)  


•  Versión  condicional  del  ATE(X):  

(2') τ ATE(X) = E "#Δ i | X $% = E "#Yi (1) −Yi (0) | X $%


= E "#Yi (1) | X $% − E "#Yi (0) | X $%

30  
•  Notemos  que,  en  general:      
   E[Yi  (0)|Di  =  0]  ≠  E[Yi  (0)|Di  =  1],  y  
   E[Yi  (1)|Di  =  1]  ≠  E[Yi  (1)|Di  =  0]  

•  Esto  signiXica  que  los  individuos  que  reciben  el  estatus  de  
control,  generalmente  tiene  diferentes  resultados  que  
aquellos  en  el  estatus  de  tratamiento.  Por  ello,  el  
resultado  promedio  para  un  individuo  en  el  grupo  de  
control  E[Yi  (0)|Di  =  0]  no  es  necesariamente  igual  al  
resultado  promedio  del  estatus  de  control  para  todos  los  
individuos  E[Yi  (0)]  (una  combinación  entre  los  
individuos  en  el  estatus  de  control  y  el  grupo  de  
tratamiento).  
•  El  hecho  que  no  observemos  el  resultado  de  control  (Yi  
(0))  para  los  individuos  en  el  grupo  de  tratamiento  no  
previene  que  podamos  imaginarnos  la  existencia  de  estos  
resultados  contrafactuales  
–  Ej:  Medicina  para  el  colesterol   31  
•  Sin  embargo,  existe  un  caso  particular  en  el  que  se  
cumple:  

 E[Yi  (0)|Di  =  0]  =  E[Yi  (0)|Di  =  1]  =  E[Yi  (0)],  y                          


 E[Yi  (1)|Di  =  1]  =  E[Yi  (1)|Di  =  0]  =  E[Yi  (1)]    
 
•  Supongamos  que  la  asignación  a  la  condición  de  
tratamiento  D  se  asigna  aleatoriamente.  En  ese  caso,  
Y(0)  e  Y(1)  son  independientes  de  D.  Esto  implica  
que  la  distribución  condicional  de  Yi  (0)  (e  Yi  (1)),  
dado  Di  es  igual  a  la  distribución  incondicional,  es  
decir,  necesariamente  se  cumplen  las  igualdades  de  
las  ecuaciones  de  las  líneas  anteriores  

32  
2. EFECTO PROMEDIO DEL TRATAMIENTO SOBRE
LOS TRATADOS  (ATT)  

(3) τ ATT = E "#Δ i | Di = 1$% = E "#Yi (1) −Yi (0) | Di = 1$%


= E "#Yi (1) | Di = 1$% − E "#Yi (0) | Di = 1$%
•  Aún  no  lo  podemos  estimar!  
•  Versión  condicional  del  ATT(X):  

(3') τ ATT(X) = E "#Δ i X , Di = 1$% = E "#Yi (1) −Yi (0) | X , Di = 1$%


= E "#Yi (1) | X , Di = 1$% − E "#Yi (0) | X , Di = 1$%

33  
•  Supuesto  para  estimar  el  ATT:  
   
E[Yi  (0)|Di  =  0]  =  E[Yi  (0)|Di  =1]  =  E[Yi  (0)],    
pero  no  es  necesario  que  se  cumpla:  
E[Yi  (1)|Di  =  1]  =  E[Yi  (1)|Di  =  0]  =  E[Yi  (1)]  

•  En  otras  palabras,  estamos  dispuestos  a  asumir  que  el  resultado  


potencial  de  los  individuos  de  control  es  independiente  de  la  
condición  de  tratamiento,  pero  este  no  es  el  caso  para  los  
individuos  de  tratamiento  (i.e.  el  resultado  potencial  de  los  
individuos  de  tratamiento  esta  correlacionado  con  la  asignación  
a  la  condición  de  tratamiento)  
•  Dicho  de  otro  modo,  no  existe  selección  hacia  la  condición  de  
tratamiento  basado  en  el  valor  de  la  variable  de  resultado  para  
los  individuos  de  control,  pero  si  hay  selección  en  base  a  las  
ganancias  potenciales  de  estar  en  la  condición  de  tratamiento  

34  
EL PROBLEMA DE SELECCIÓN
•  Supongamos  que  estamos  interesados  en  estimar  el  
ATT  utilizando  datos  observacionales  
•  Calculemos  la  diferencia  de  medias  simple  (DdM),  o  
estimador  naïve:  

(5) DdM = E !"Yi | Di = 1#$ − E !"Yi | Di = 0#$


= E !"Yi (1) | Di = 1#$ − E !"Y (0) | Di = 0#$
= E !"Yi (1) | Di = 1#$ − E !"Yi (0) | Di = 1#$
+E !"Yi (0) | Di = 1#$ − E !"Y (0) | Di = 0#$

{
= τ ATT + E !"Yi (0) | Di = 1#$ − E !"Yi (0) | Di = 0#$

}
sesgo de seleccion 35  
{ }
DdM = τ ATT + E !"Yi (0) | Di = 1#$ − E !"Yi (0) | Di = 0#$

sesgo de seleccion

•  El  término  del  sesgo  de  selección  captura  la  


diferencia  en  los  resultados  potenciales  de  los  
tratados  y  no  tratados  
•  El  resultado  promedio  para  los  individuos  de  
control  E[Yi(0)|Di=0]  no  es  necesariamente  igual  al  
resultado  promedio  (incondicional)  para  todos  los  
individuos  en  la  condición  del  control  E[Yi  (0)],  
que  es  una  combinación  del  resultado  potencial  de  
los  individuos  tratados  y  no  tratados.    
–  Ej:  tratamiento  de  colesterol  
36  
EL ESTÁNDAR DE ORO: LOS EXPERIMENTOS

•  Idea  clave  de  esta  sección  del  curso:    


 Cómo  diseñar  una  estrategia  de  investigación  que  nos  
permita  aproximarnos  lo  mas  posible  a  una  situación  en  
la  cual  el  tratamiento  se  asigna  aleatoriamente  

•  Angrist  y  Pischke  (2009):  La  asignación  aleatoria  es  el  


diseño  de  investigación  mas  creíble  e  inXluyente,  pues  
puede  resolver  el  problema  de  selección  

37  
•  Recordemos:  

El  Problema  Fundamental  de  la  Inferencia  Causal  


Grupo   Y(1)   Y(0)  
Tratamiento  (D=1)   Observable  como  Y   Contrafactual  
Control  (D=0)   Contrafactual   Observable  como  Y  

•  Donde  se  cumple  lo  siguiente:  


E !"Yi | Di = 1#$ = E !"Y (1) | Di = 1#$ = E !"Y (1) | Di = 0#$
E !"Yi | Di = 0#$ = E !"Yi (0) | Di = 0#$ = E !"Yi (0) | Di = 1#$

38  
•  Para  calcular  el  ATT  necesitamos  saber:  E[Yi  (0)|Di=1]  

•  Para  calcular  el  ATE,  necesitamos  saber  ambos  


contrafactuales  (E[Yi  (0)|Di=1]  y  E[Yi  (1)|Di=0])  

Pregunta  Clave:  
 

•  En  que  casos  son  ciertas  las  siguientes  expresiones?  

(6) E !"Yi (0) | Di = 1#$ = E !"Yi (0) | Di = 0#$

(7) E !"Yi (1) | Di = 0#$ = E !"Yi (1) | Di = 1#$

39  
•  En  general,  ninguna  de  estas  condiciones  se  cumplen  
cuando  utilizamos  datos  observacionales  (no  
experimentales)  debido  a  los  problemas  de  selección  
•  Sin  embargo,  existe  un  caso  importante  en  el  que  estas  
condiciones  se  cumplen:  En  los  experimentos  
aleatorizados  
 

 En  este  caso,  el  tratamiento  D  es  independiente  de  los  


resultados  potenciales  Y(1)  e  Y(0)  

40  
•  Por  lo  tanto,  
(8) E !"Yi (0) | Di = 0#$ = E !"Yi (0) | Di = 1#$ = E !"Yi (0)#$

(9) E !"Yi (1) | Di = 1#$ = E !"Yi (1) | Di = 0#$ = E !"Yi (1)#$


 

•  Con  estas  condiciones,  podemos  estimar  el  ATE:  


(10) τ ATE = E "#Δ i $% = E "#Yi (1) −Yi (0)$% = E "#Yi (1)$% − E "#Yi (0)$%
= E "#Yi (1) | Di = 1$% − E "#Yi (0) | Di = 0$%
= E "#Yi | Di = 1$% − E "#Yi | Di = 0$%

41  
•  Cuando  tenemos  asignación  aleatoria  del  tratamiento:    
ATE = ATT
•  En  los  casos  en  los  que  la  asignación  no  es  aleatoria,  
debemos  asumir  que  el  tratamiento  es  “tan  bueno  
como  asignado  aleatoriamente”.  Este  supuesto  
puede  ser  escrito  de  la  siguiente  manera:  
(11) {Yi (1), Yi (0)} ⊥ Di

•  Es  importante  notar  que  para  estimar  el  ATT  se  


requiere  un  supuesto  menos  fuerte  que  (11)    

42  
•  Con  datos  no  experimentales,  debemos  asumir  alguna  
forma  de  (11)  
o  Una  manera:  Argumentar  que  la  asignación  del  tratamiento  
es  casi  tan  buena  como  aleatoria,  una  vez  que  controlamos  
por  una  serie  de  variables.  A  esto  se  le  llama  selección  sobre  
observables  
 
(12) Yi (1),Yi (0) ⊥ Di | X
{ }
 
o  Otra  forma:  Explotar  alguna  fuente  va  variación  exógena  en  
los  datos  para  poder  argumentar  que  los  resultados  
potenciales  son  independientes  de  asignación  a  la  condición  
de  tratamiento.  A  esto  se  le  conoce  como  selección  sobre  no  
observables  
(13) {Yi (1),Yi (0)} ⊥ Di | X ,εi
43  
RESULTADOS POTENCIALES EN MODELOS DE
REGRESIÓN
•  Volvamos  a  escribir  los  resultados  observados  de  la  
siguiente  manera:  
(1') Yi = DY i i (1) + (1 − Di )Yi (0)

= Yi (0) + {Yi (1) − Yi (0)} Di


 

•  Lo  cual  es  análogo  a:  


(14) Yi = α + β Di + ε i

•  Re  escribamos  (1’)  de  la  siguiente  manera:  


(1'') Yi = Yi (0) + {Yi (1) −Yi (0)} Di
= E{Yi (0)} + {Yi (1) −Yi (0)} Di +Yi (0) − E{Yi (0)}
     
44  
α β εi
•  Tomando  expectativas  de  (14),  condicionando  sobre  
D:  
(15) E(Yi | Di = 1) = α + β + E(εi | Di = 1)
E(Yi | Di = 0) = α + E(εi | Di = 0)

•  Estimando  β  usando  MCO,  tenemos:  


(16) E(Yi | Di = 1) − E(Yi | Di = 0) = β

Efecto del tratamiento

+ E(εi | Di = 1) − E(εi | Di = 0)

Sesgo de seleccion

45  
•  Cuando  el  tratamiento  es  asignado  aleatoriamente,  el  
sesgo  de  selección  es  cero:  
E(εi | Di = 1) − E(εi | Di = 0) = 0

Sesgo de seleccion

•  Con  lo  cual:  

(17) E(Yi | Di = 1) − E(Yi | Di = 0) = β



Efecto del tratamiento

46  
EL SUPUESTO DE LA UNIDAD DE TRATAMIENTO
ESTABLE (SUTVA)
•  Implica  que:    
 los  resultaos  potenciales  para  un  individuo  no  son  
afectados  por  cambios  potenciales  en  la  exposición  al  
tratamiento  de  otros  individuos  (Morgan  y  Winship  
2007,  sección  2.4)  
 

•  Una  manera  de  entender  SUTVA:  no  hay  efectos  de  


equilibrio  general  debido  al  tratamiento  
•  Ejemplo:  Miguel  y  Kremer  (Econometrica,  2004)  

47  
“NO HAY CAUSALIDAD SIN
MANIPULACIÓN” (HOLLAND 1986)
•  Tratamientos  mal  deXinidos  son  aquellos  que  no  
pueden  ser  potencialmente  manipulados.    
•  Por  ejemplo:  
o  Ella  sacó  una  buena  nota  en  el  examen  porque  es  mujer  
o  Ella  sacó  una  buena  nota  en  el  examen  porque  estudió  
o  Ella  sacó  una  buena  nota  en  el  examen  porque  su  tutor  
trabajo  mucho  con  ella  

•  En  que  caso  los  resultados  potenciales  están  


correctamente  deXinidos?  

48  
VENTAJAS DEL MARCO DE ANÁLISIS DE LOS
RESULTADOS POTENCIALES (IMBENS ET AL 2008)
•  Nos  permite  deXinir  el  efecto  causal  antes  de  especiXicar  el  
mecanismo  de  asignación,  sin  necesidad  de  hacer  
supuestos  sobre  la  forma  funcional  o  las  distribuciones  

•  Conecta  el  análisis  de  efectos  causales  a  manipulaciones  


especíXicas  
•  Separa  el  modelo  de  los  resultados  potenciales  de  el  
mecanismo  de  asignación  al  tratamiento  
•  Permite  formular  los  supuestos  probabilísticos  en  
términos  de  variables  potencialmente  observables,  en  
lugar  de  hacerlo  en  términos  de  variables  no  observables  
•  Es  claro  cuál  es  la  fuente  de  incertidumbre  en  los  
estimadores  

49  
5. DISEÑOS DE INVESTIGACIÓN Y CAUSALIDAD

Experimental  
Regresión  
Diseño  de   Selección  sobre  
Investigación   Observables   Matching  
No  Experimental  
IV  
Selección  sobre  
No  Observables   Efectos  Fijos/DiD  
Regresión    
Discontinua  

50  
6. VALIDEZ EN ECONOMETRÍA

•  “Validez”  se  reXiere  a  aproximarse  a  la  verdad  a  partir  


de  inferencia  (Shadish,  Cook  y  Campbell  2002).    
•  Tipos  de  validez:  
–  Validez  interna  
–  Validez  Externa  
–  Conclusión  estadística  de  validez  
–  Validez  construida  

•  Nos  enfocaremos  en  las  dos  primeras  

51  
VALIDEZ INTERNA VS. VALIDEZ EXTERNA

•  DeJinición  2:  Validez  interna  


 Se  reWiere  a  la  validez  acerca  de  inferencias  sobre  si  es  
que  la  covarianza  observada  entre  X  e  Y  reWleja  una  
relación  causal  de  X  a  Y  en  la  forma  en  la  que  las  
variables  fueron  manipuladas  o  medidas  
 

•  DeJinición  3:  Validez  Externa  


 Se  reWiere  a  la  validez  de  inferencias  acerca  de  si  una  
relación  causal  se  mantiene  sobre  variaciones  en  
personas,  contextos,  tratamientos  y  resultados  

52  
AMENAZAS A LA VALIDEZ INTERNA
•  Precedencia  Temporal  Ambigua:  falta  de  claridad  sobre  que  
variable  ocurre  primero  
•  Selección:  Diferencias  sistemáticas  en  las  características  de  
los  individuos  
•  Historia:  Eventos  que  ocurren  al  mismo  tiempo  que  el  
tratamiento  
•  Maduración:  Cambios  que  ocurren  naturalmente  en  el  
tiempo  que  pueden  ser  atribuidos  incorrectamente  al  
tratamiento  
•  Atrición:  Perdida  de  tamaño  de  muestra  que  produce  
sesgos  en  los  efectos  medidos  del  tratamiento  

53  
•  Testing:  Exposición  al  test  puede  afectar  los  resultados  
subsecuentes  del  test  mismo,  lo  cual  puede  estar  
correlacionado  con  el  tratamiento  
•  Instrumentación:  La  naturaleza  de  la  medición  puede  
cambiar  en  el  tiempo  o  condición,  de  forma  que  
podemos  confundirla  con  el  tratamiento  

54  
AMENAZAS A LA VALIDEZ EXTERNA

•  Interacción  de  la  relación  causal  con  las  unidades  de  


observación:  Un  efecto  encontrado  en  un  tipo  de  unidades  
puede  no  mantenerse  si  es  que  otras  fueran  las  unidades  a  
ser  estudiadas  
•  Interacción  entre  la  relación  causal  sobre  variaciones  del  
tratamiento:  Un  efecto  encontrado  con  un  tipo  de  
tratamiento  puede  no  mantenerse  cuando  aplicamos  otro  
tipo  de  tratamiento  
•  Interacción  de  la  relación  causal  con  el  resultado:  Un  efecto  
encontrado  con  un  tipo  de  resultado  puede  no  mantenerse  
si  es  que  medimos  otro  resultado  

55  
•  Interacción  del  efecto  causal  con  el  contexto:  Un  efecto  
encontrado  en  un  contexto  especiXico  puede  no  
mantenerse  si  es  que  estamos  en  un  contexto  
diferente  

•  Mediación  dependiente  del  contexto:  Un  mediador  de  la  


relación  causal  en  un  contexto  puede  no  ser  el  mismo  
en  otro  contexto  

56  
Source:  Roe  and  Just  (2009)   57  

También podría gustarte