THE CONVERGENCE OF VALUE-ITERATION IN DISCOUNTED MARKOV DECISION-PROCESSES

被引：3

作者：

WHITE, DJ ^{[1
]}

SCHERER, WT ^{[1
]}

机构：

[1] UNIV VIRGINIA,CHARLOTTESVILLE,VA 22903

来源：

JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS | 1994年 / 182卷 / 02期

关键词：

D O I：

10.1006/jmaa.1994.1090

中图分类号：

O29 [应用数学];

学科分类号：

070104 ;

摘要：

Considerable numerical experience indicates that the standard value iteration procedure for infinite horizon discounted Markov decision processes performs much better than the usual error bound analysis suggests. This paper attempts to examine why this happens and introduces an additional pointwise convergence concept to that of the usual maximum norm concept, in order to examine why some states exhibit better convergence behaviour than others. We also present some numerical results. (C) 1994 Academic Press, Inc.

引用

页码：348 / 360

页数：13

共 50 条

[1] MONOTONE VALUE-ITERATION FOR DISCOUNTED FINITE MARKOV DECISION-PROCESSES
WHITE, DJ
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1985, 109 (02) : 311 - 324
[2] COMPUTATIONAL COMPARISON OF VALUE-ITERATION ALGORITHMS FOR DISCOUNTED MARKOV DECISION-PROCESSES
THOMAS, LC
HARLEY, R
LAVERCOMBE, AC
OPERATIONS RESEARCH LETTERS, 1983, 2 (02) : 72 - 76
[3] SERIAL AND PARALLEL VALUE-ITERATION ALGORITHMS FOR DISCOUNTED MARKOV DECISION-PROCESSES
ARCHIBALD, TW
MCKINNON, KIM
THOMAS, LC
EUROPEAN JOURNAL OF OPERATIONAL RESEARCH, 1993, 67 (02) : 188 - 203
[4] ISOTONE POLICIES FOR THE VALUE-ITERATION METHOD FOR MARKOV DECISION-PROCESSES
WHITE, DJ
OR SPEKTRUM, 1984, 6 (04) : 223 - 227
[5] ACCELERATING PROCEDURES OF THE VALUE-ITERATION ALGORITHM FOR DISCOUNTED MARKOV DECISION-PROCESSES, BASED ON A ONE-STEP LOOKAHEAD ANALYSIS
HERZBERG, M
YECHIALI, U
OPERATIONS RESEARCH, 1994, 42 (05) : 940 - 946
[6] Uniform convergence of value iteration policies for discounted Markov decision processes
Cruz-Suarez, Daniel
Montes-De-Oca, Raul
BOLETIN DE LA SOCIEDAD MATEMATICA MEXICANA, 2006, 12 (01): : 133 - 148
[7] CRITERIA FOR SELECTING THE RELAXATION FACTOR OF THE VALUE-ITERATION ALGORITHM FOR UNDISCOUNTED MARKOV AND SEMI-MARKOV DECISION-PROCESSES
HERZBERG, M
YECHIALI, U
OPERATIONS RESEARCH LETTERS, 1991, 10 (04) : 193 - 202
[8] GEOMETRIC CONVERGENCE OF VALUE-ITERATION IN MULTICHAIN MARKOV DECISION PROBLEMS
SCHWEITZER, PJ
FEDERGRUEN, A
ADVANCES IN APPLIED PROBABILITY, 1979, 11 (01) : 188 - 217
[9] COMPUTATIONAL COMPARISON OF POLICY ITERATION ALGORITHMS FOR DISCOUNTED MARKOV DECISION-PROCESSES
HARTLEY, R
LAVERCOMBE, AC
THOMAS, LC
COMPUTERS & OPERATIONS RESEARCH, 1986, 13 (04) : 411 - 420
[10] THE VARIANCE OF DISCOUNTED MARKOV DECISION-PROCESSES
SOBEL, MJ
JOURNAL OF APPLIED PROBABILITY, 1982, 19 (04) : 794 - 802

← 1 2 3 4 5 →