Mixed Markov Decision Processes in a Semi-Markov Environment with Discounted Criterion

Qiying Hu; Jinling Wang

Journal ArticleOPEN ACCESS

Mixed Markov Decision Processes in a Semi-Markov Environment with Discounted Criterion

Journal of Mathematical Analysis and Applications (1998) 219(1) 1-20

DOI: 10.1006/jmaa.1997.5792

0Citations

5Readers

Abstract

This paper presents a new model: the mixed Markov decision process (MDP) in a semi-Markov environment with discounted criterion. It describes a system which behaves like a MDP except that the system is influenced by its semi-Markov process environment. Following each state transition of the environment, the MDP model changes among discrete time MDP, continuous time MDP, and semi-MDP. After presenting the model, we show the validity of the optimality equation and the existence of ε-optimal policies. Finally, the mixed MDP in a Markov environment is transformed into a discrete time MDP. © 1998 Academic Press.

Cite

CITATION STYLE

APA

Hu, Q., & Wang, J. (1998). Mixed Markov Decision Processes in a Semi-Markov Environment with Discounted Criterion. Journal of Mathematical Analysis and Applications, 219(1), 1–20. https://doi.org/10.1006/jmaa.1997.5792

Mixed Markov Decision Processes in a Semi-Markov Environment with Discounted Criterion

Abstract

Cite

Register to see more suggestions