基于强化学习算法的期指间长期均衡策略研究-《企业改革与管理》杂志社官网

导航列表

收录文章

往期杂志

资讯信息

基于强化学习算法的期指间长期均衡策略研究

2025.07.15点击：

摘要：本文基于沪深300、上证50和中证500指数对应的股指期货5分钟高频数据，研究其长期均衡策略。在部分可观测马尔可夫决策过程框架下，改进近端策略优化（PPO）算法。通过构建包含价格、波动率与流动性因子的24维状态空间，建立市场微观结构与强化学习决策的映射关系。引入波动率自适应的动态裁剪机制，以提升策略的稳定性，并构建融合条件风险价值约束的混合奖励函数，从而为金融交易中的强化学习应用提供新的算法框架。

关键词：强化学习;动态风险控制;跨品种套利;状态空间;动作空间;

DOI： 10.13768/j.cnki.cn11-3793/f.2025.0596

专辑：经济与管理科学;信息科技

专题：自动化技术;金融;证券;投资

分类号： TP181;F832.5

上一篇：基于卓越绩效理念的项目风险管理研究——以Z研究院为例 2025/7/15
下一篇：提升内审员在质量管理体系中作用的策略探讨 2025/7/14