Distributionally robust counterfactual risk minimization

Louis Faury; Ugo Tanielian; Elvis Dohmatob; Elena Smirnova; Flavian Vasile

Conference ProceedingsOPEN ACCESS

Distributionally robust counterfactual risk minimization

AAAI 2020 - 34th AAAI Conference on Artificial Intelligence (2020) 3850-3857

DOI: 10.1609/aaai.v34i04.5797

34Citations

32Readers

Abstract

This manuscript introduces the idea of using Distributionally Robust Optimization (DRO) for the Counterfactual Risk Minimization (CRM) problem. Tapping into a rich existing literature, we show that DRO is a principled tool for counterfactual decision making. We also show that well-established solutions to the CRM problem like sample variance penalization schemes are special instances of a more general DRO problem. In this unifying framework, a variety of distributionally robust counterfactual risk estimators can be constructed using various probability distances and divergences as uncertainty measures. We propose the use of Kullback-Leibler divergence as an alternative way to model uncertainty in CRM and derive a new robust counterfactual objective. In our experiments, we show that this approach outperforms the state-of-the-art on four benchmark datasets, validating the relevance of using other uncertainty measures in practical applications.

Cite

CITATION STYLE

APA

Faury, L., Tanielian, U., Dohmatob, E., Smirnova, E., & Vasile, F. (2020). Distributionally robust counterfactual risk minimization. In AAAI 2020 - 34th AAAI Conference on Artificial Intelligence (pp. 3850–3857). AAAI press. https://doi.org/10.1609/aaai.v34i04.5797

Distributionally robust counterfactual risk minimization

Abstract

Cite

Register to see more suggestions