Distributionally Robust Counterfactual Risk Minimization

Faury, Louis; Tanielian, Ugo; Vasile, Flavian; Smirnova, Elena; Dohmatob, Elvis

Statistics > Machine Learning

arXiv:1906.06211 (stat)

[Submitted on 14 Jun 2019 (v1), last revised 14 Dec 2019 (this version, v2)]

Title:Distributionally Robust Counterfactual Risk Minimization

Authors:Louis Faury, Ugo Tanielian, Flavian Vasile, Elena Smirnova, Elvis Dohmatob

View PDF

Abstract:This manuscript introduces the idea of using Distributionally Robust Optimization (DRO) for the Counterfactual Risk Minimization (CRM) problem. Tapping into a rich existing literature, we show that DRO is a principled tool for counterfactual decision making. We also show that well-established solutions to the CRM problem like sample variance penalization schemes are special instances of a more general DRO problem. In this unifying framework, a variety of distributionally robust counterfactual risk estimators can be constructed using various probability distances and divergences as uncertainty measures. We propose the use of Kullback-Leibler divergence as an alternative way to model uncertainty in CRM and derive a new robust counterfactual objective. In our experiments, we show that this approach outperforms the state-of-the-art on four benchmark datasets, validating the relevance of using other uncertainty measures in practical applications.

Comments:	Accepted at AAAI20
Subjects:	Machine Learning (stat.ML); Machine Learning (cs.LG)
Cite as:	arXiv:1906.06211 [stat.ML]
	(or arXiv:1906.06211v2 [stat.ML] for this version)
	https://doi.org/10.48550/arXiv.1906.06211

Submission history

From: Louis Faury [view email]
[v1] Fri, 14 Jun 2019 14:04:09 UTC (173 KB)
[v2] Sat, 14 Dec 2019 22:47:06 UTC (125 KB)

Statistics > Machine Learning

Title:Distributionally Robust Counterfactual Risk Minimization

Submission history

Access Paper:

References & Citations

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators

Statistics > Machine Learning

Title:Distributionally Robust Counterfactual Risk Minimization

Submission history

Access Paper:

References & Citations

BibTeX formatted citation

Bookmark

Bibliographic and Citation Tools

Code, Data and Media Associated with this Article

Demos

Recommenders and Search Tools

arXivLabs: experimental projects with community collaborators