On Instrumental Variable Regression for Deep Offline Policy Evaluation

被引：0

作者：

Chen, Yutian ^{[1
]}

Xu, Liyuan ^{[2
]}

Gulcehre, Caglar ^{[1
]}

Le Paine, Tom ^{[1
]}

Gretton, Arthur ^{[2
]}

de Freitas, Nando ^{[1
]}

Doucet, Arnaud ^{[1
]}

机构：

[1] DeepMind, R7, 14-18 Handyside Street King’s Cross, London,N1C 4DN, United Kingdom

[2] Gatsby Unit

来源：

Journal of Machine Learning Research | 2022年 / 23卷

关键词：

Compendex;

D O I：

暂无

中图分类号：

学科分类号：

摘要：

Reinforcement learning

引用