On Instrumental Variable Regression for Deep Offline Policy Evaluation

被引:0
作者
Chen, Yutian [1 ]
Xu, Liyuan [2 ]
Gulcehre, Caglar [1 ]
Le Paine, Tom [1 ]
Gretton, Arthur [2 ]
de Freitas, Nando [1 ]
Doucet, Arnaud [1 ]
机构
[1] DeepMind, R7, 14-18 Handyside Street King’s Cross, London,N1C 4DN, United Kingdom
[2] Gatsby Unit
来源
Journal of Machine Learning Research | 2022年 / 23卷
关键词
Compendex;
D O I
暂无
中图分类号
学科分类号
摘要
Reinforcement learning
引用
收藏
相关论文
empty
未找到相关数据