Partial policy iteration for L1-Robust Markov decision processes

被引：0

作者：

Ho, Chin Pang ^{[1
]}

Petrik, Marek ^{[2
]}

Wiesemann, Wolfram ^{[3
]}

机构：

[1] School of Data Science, City University of Hong Kong, 83 Tat Chee Avenue, Kowloon Tong, Hong Kong

[2] Department of Computer Science, University of New Hampshire, Durham,NH,03861, United States

[3] Imperial College Business School, Imperial College London, London,SW7 2AZ, United Kingdom

来源：

基金：

美国国家科学基金会; 中国国家自然科学基金; 英国工程与自然科学研究理事会;

关键词：

Markov processes - Iterative methods - Linear programming;

D O I：

暂无

中图分类号：

学科分类号：

摘要：

引用