STRUCTURE OF OPTIMAL POLICIES FOR DISCOUNTED SEMI-MARKOV DECISION PROGRAMMING WITH UNBOUNDED REWARDS

被引：0

作者：

DONG, ZQ

LIU, K

机构：

来源：

SCIENTIA SINICA SERIES A-MATHEMATICAL PHYSICAL ASTRONOMICAL & TECHNICAL SCIENCES | 1986年 / 29卷 / 04期

关键词：

D O I：

暂无

中图分类号：

O [数理科学和化学]; P [天文学、地球科学]; Q [生物科学]; N [自然科学总论];

学科分类号：

07 ; 0710 ; 09 ;

摘要：

引用

页码：337 / 349

页数：13

共 4 条

[1]

Blackwell D., 1965, ANN MATH STAT, V36, P226

CHITGOPEKAR, SS .

[3] SEMI-MARKOV DECISION PROCESSES WITH UNBOUNDED REWARDS [J].

LIPPMAN, SA .

MANAGEMENT SCIENCE SERIES A-THEORY, 1973, 19 (07) :717-731

[4] DYNAMIC-PROGRAMMING WITH UNBOUNDED REWARDS [J].

LIPPMAN, SA .

MANAGEMENT SCIENCE SERIES A-THEORY, 1975, 21 (11) :1225-1233