Partial policy iteration for L1-Robust Markov decision processes

被引:0
作者
Ho, Chin Pang [1 ]
Petrik, Marek [2 ]
Wiesemann, Wolfram [3 ]
机构
[1] School of Data Science, City University of Hong Kong, 83 Tat Chee Avenue, Kowloon Tong, Hong Kong
[2] Department of Computer Science, University of New Hampshire, Durham,NH,03861, United States
[3] Imperial College Business School, Imperial College London, London,SW7 2AZ, United Kingdom
基金
美国国家科学基金会; 中国国家自然科学基金; 英国工程与自然科学研究理事会;
关键词
Markov processes - Iterative methods - Linear programming;
D O I
暂无
中图分类号
学科分类号
摘要
引用
收藏
相关论文
empty
未找到相关数据