TURNPIKES IN FINITE MARKOV DECISION PROCESSES AND RANDOM WALK*

被引：0

作者：

Piunovskiy, A. B. ^{[1
]}

机构：

[1] Univ Liverpool, Dept Math Sci, Liverpool, England

来源：

THEORY OF PROBABILITY AND ITS APPLICATIONS | 2023年 / 68卷 / 01期

关键词：

Markov decision process; discounted reward; average reward; random walk; stochastic knapsack problem; turnpike;

D O I：

10.1137/S0040585X97T991325

中图分类号：

O21 [概率论与数理统计]; C8 [统计学];

学科分类号：

020208 ; 070103 ; 0714 ;

摘要：

In this paper we revise the theory of turnpikes in discounted Markov decision pro-cesses, prove the turnpike theorem for the undiscounted model, and apply the results to the specific random walk.

引用

页码：123 / 149

页数：27

共 50 条

[21] Random walk on finite extensions of lattices
Oussa, Vignon
ADVANCES IN PURE AND APPLIED MATHEMATICS, 2021, 12 (01) : 63 - 78
[22] Online Markov Decision Processes
Even-Dar, Eyal
Kakade, Sham M.
Mansour, Yishay
MATHEMATICS OF OPERATIONS RESEARCH, 2009, 34 (03) : 726 - 736
[23] Quantile Markov Decision Processes
Li, Xiaocheng
Zhong, Huaiyang
Brandeau, Margaret L.
OPERATIONS RESEARCH, 2021, 70 (03) : 1428 - 1447
[24] Sub-Markov Random Walk for Image Segmentation
Dong, Xingping
Shen, Jianbing
Shao, Ling
Van Gool, Luc
IEEE TRANSACTIONS ON IMAGE PROCESSING, 2016, 25 (02) : 516 - 527
[25] A MYOPIC RANDOM-WALK ON A FINITE CHAIN
REVATHI, S
BALAKRISHNAN, V
VALSAKUMAR, MC
PRAMANA-JOURNAL OF PHYSICS, 1992, 38 (05): : 491 - 503
[26] Threshold probability of non-terminal type in finite horizon Markov decision processes
Kira, Akifumi
Ueno, Takayuki
Fujita, Toshiharu
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 2012, 386 (01) : 461 - 472
[27] VACANT SET OF RANDOM WALK ON FINITE GRAPHS
Cerny, J.
XVIITH INTERNATIONAL CONGRESS ON MATHEMATICAL PHYSICS, 2014, : 417 - 417
[28] Random Walk Approximation for Stochastic Processes on Graphs
Polizzi, Stefano
Marzi, Tommaso
Matteuzzi, Tommaso
Castellani, Gastone
Bazzani, Armando
ENTROPY, 2023, 25 (03)
[29] Mutually Dependent Markov Decision Processes
Fujita, Toshiharu
Kira, Akifumi
JOURNAL OF ADVANCED COMPUTATIONAL INTELLIGENCE AND INTELLIGENT INFORMATICS, 2014, 18 (06) : 992 - 998
[30] Temporal concatenation for Markov decision processes
Song, Ruiyang
Xu, Kuang
PROBABILITY IN THE ENGINEERING AND INFORMATIONAL SCIENCES, 2022, 36 (04) : 999 - 1026

← 1 2 3 4 5 →