DETECTING OPTIMAL AND NONOPTIMAL ACTIONS IN AVERAGE-COST MARKOV DECISION-PROCESSES

被引：2

作者：

LASSERRE, JB

机构：

来源：

JOURNAL OF APPLIED PROBABILITY | 1994年 / 31卷 / 04期

关键词：

POLICY ITERATION; LINEAR PROGRAMMING; ELIMINATION OF NONOPTIMAL ACTIONS;

D O I：

10.2307/3215322

中图分类号：

O21 [概率论与数理统计]; C8 [统计学];

学科分类号：

020208 ; 070103 ; 0714 ;

摘要：

We present two sufficient conditions for detection of optimal and non-optimal actions in (ergodic) average-cost MDPs. They are easily interpreted and can be implemented as detection tests in both policy iteration and linear programming methods. An efficient implementation of a recent new policy iteration scheme is discussed.

引用

页码：979 / 990

页数：12

共 50 条

[31] MARKOV DECISION-PROCESSES - DISCOUNTED EXPECTED REWARD OR AVERAGE EXPECTED REWARD
WHITE, DJ
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1993, 172 (02) : 375 - 384
[32] MARKOV DECISION-PROCESSES IN ECONOMY
NOVAK, J
EKONOMICKY CASOPIS, 1987, 35 (02): : 134 - 140
[33] POLICY ITERATION AND NEWTON-RAPHSON METHODS FOR MARKOV DECISION-PROCESSES UNDER AVERAGE COST CRITERION
OHNISHI, M
COMPUTERS & MATHEMATICS WITH APPLICATIONS, 1992, 24 (1-2) : 147 - 155
[34] MARKOV RATIO DECISION-PROCESSES
AGGARWAL, V
CHANDRASEKARAN, R
NAIR, KPK
JOURNAL OF OPTIMIZATION THEORY AND APPLICATIONS, 1977, 21 (01) : 27 - 37
[35] THE COMPLEXITY OF MARKOV DECISION-PROCESSES
PAPADIMITRIOU, CH
TSITSIKLIS, JN
MATHEMATICS OF OPERATIONS RESEARCH, 1987, 12 (03) : 441 - 450
[36] AVERAGE-OPTIMAL ADAPTIVE POLICIES IN SEMI-MARKOV DECISION-PROCESSES INCLUDING AN UNKNOWN PARAMETER
KURANO, M
JOURNAL OF THE OPERATIONS RESEARCH SOCIETY OF JAPAN, 1985, 28 (03) : 252 - 267
[37] APPLICATIONS OF MARKOV DECISION-PROCESSES
WIJNMALEN, DJD
JOURNAL OF THE OPERATIONAL RESEARCH SOCIETY, 1994, 45 (05) : 607 - 608
[38] On Linear Programming for Constrained and Unconstrained Average-Cost Markov Decision Processes with Countable Action Spaces and Strictly Unbounded Costs
Yu, Huizhen
MATHEMATICS OF OPERATIONS RESEARCH, 2022, 47 (02) : 1474 - 1499
[39] COST RATE HEURISTICS FOR SEMI-MARKOV DECISION-PROCESSES
GLAZEBROOK, KD
BAILEY, MP
WHITAKER, LR
JOURNAL OF APPLIED PROBABILITY, 1992, 29 (03) : 633 - 644
[40] APPROXIMATING THE MARKOV PROPERTY IN MARKOV DECISION-PROCESSES
WHITE, DJ
INFORMATION AND DECISION TECHNOLOGIES, 1989, 15 (03): : 147 - 162

← 1 2 3 4 5 →