SEPARABLE VALUE-FUNCTIONS FOR INFINITE HORIZON AVERAGE REWARD MARKOV DECISION-PROCESSES

被引：1

|

作者：

WHITE, DJ

机构：

来源：

JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS | 1989年 / 144卷 / 02期

关键词：

D O I：

10.1016/0022-247X(89)90345-4

中图分类号：

O29 [应用数学];

学科分类号：

070104 ;

摘要：

引用

收藏

页码：450 / 465

页数：16

相关论文

共 50 条

[1] MARKOV DECISION-PROCESSES - DISCOUNTED EXPECTED REWARD OR AVERAGE EXPECTED REWARD
WHITE, DJ
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1993, 172 (02) : 375 - 384
[2] Learning Infinite-Horizon Average-Reward Markov Decision Processes with Constraints
Chen, Liyu
Jain, Rahul
Luo, Haipeng
INTERNATIONAL CONFERENCE ON MACHINE LEARNING, VOL 162, 2022,
[3] Regret Analysis of Policy Gradient Algorithm for Infinite Horizon Average Reward Markov Decision Processes
Bai, Qinbo
Mondal, Washim Uddin
Aggarwal, Vaneet
THIRTY-EIGHTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, VOL 38 NO 10, 2024, : 10980 - 10988
[4] INFINITE HORIZON MARKOV DECISION-PROCESSES WITH UNKNOWN OR VARIABLE DISCOUNT FACTORS
WHITE, DJ
EUROPEAN JOURNAL OF OPERATIONAL RESEARCH, 1987, 28 (01) : 96 - 100
[5] Average Optimality in Nonhomogeneous Infinite Horizon Markov Decision Processes
Wachs, Allise O.
Schochetman, Irwin E.
Smith, Robert L.
MATHEMATICS OF OPERATIONS RESEARCH, 2011, 36 (01) : 147 - 164
[6] OPTIMAL AVERAGE VALUE CONVERGENCE IN NONHOMOGENEOUS MARKOV DECISION-PROCESSES
PARK, YS
BEAN, JC
SMITH, RL
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1993, 179 (02) : 525 - 536
[7] NECESSARY CONDITIONS FOR THE OPTIMALITY EQUATION IN AVERAGE-REWARD MARKOV DECISION-PROCESSES
CAVAZOSCADENA, R
APPLIED MATHEMATICS AND OPTIMIZATION, 1989, 19 (01): : 97 - 112
[8] MULTI-OBJECTIVE INFINITE-HORIZON DISCOUNTED MARKOV DECISION-PROCESSES
WHITE, DJ
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1982, 89 (02) : 639 - 647
[9] A UNIFIED APPROACH TO ADAPTIVE-CONTROL OF AVERAGE REWARD MARKOV DECISION-PROCESSES
HUBNER, G
OR SPEKTRUM, 1988, 10 (03) : 161 - 166
[10] RECURSIVE ADAPTIVE-CONTROL OF MARKOV DECISION-PROCESSES WITH THE AVERAGE REWARD CRITERION
CAVAZOSCADENA, R
HERNANDEZLERMA, O
APPLIED MATHEMATICS AND OPTIMIZATION, 1991, 23 (02): : 193 - 207

← 1 2 3 4 5 →