一种基于部分可观察马尔可夫决策过程的股票交易策略 |
| |
引用本文: | 黄福威,张宁.一种基于部分可观察马尔可夫决策过程的股票交易策略[J].东莞理工学院学报,2023(1):43-50. |
| |
作者姓名: | 黄福威 张宁 |
| |
作者单位: | 东莞理工学院计算机科学与技术学院 |
| |
基金项目: | 广东省基础与应用基础研究基金(2022A1515010088); |
| |
摘 要: | 近年来涌现了许多把深度强化学习应用到股票交易策略的研究。深度强化学习通常依赖于马尔可夫决策过程建模,但是股票市场中交易策略的制定需要考虑历史交易数据中包含的信息。因此,本文通过部分可观察马尔可夫决策过程对股票市场建模,并采用长短期记忆网络和优势演员评论家算法来构建股票交易策略。通过在道琼斯工业平均指数成份股数据集上进行实验,实验结果表明本文所设计的股票交易策略构建方法可以挖掘隐藏在历史数据中的有效信息,获得稳定且有效的交易策略。
|
关 键 词: | 股票交易 部分可观察马尔可夫决策过程 优势演员评论家算法 |
|
|