收录文章
- 基于厂龄调节的研发投入与企业成长关系实证研究2025-9-26
- 数据资产价值评估模型构建研究2025-9-26
- 科技企业在IPO过程中的合规风险与中介机构的合作策略研究2025-9-16
- 档案工业年鉴编制中的跨学科整合研究——以北京市工业年鉴为2025-9-16
- 国有企业风险管理现状及其未来发展方向——以万马股份为例2025-9-15
- 行业领域知识图谱在行政管理中的应用场景研究——以省级交通2025-9-15
- 基于平衡计分卡的企业全面预算管理体系构建策略研究——以燃2025-9-15
- 全球供应链视角下跨境电商供应与物流策略研究——以Temu2025-9-15
资讯信息
基于强化学习算法的期指间长期均衡策略研究
2025.07.15点击:
摘要:本文基于沪深300、上证50和中证500指数对应的股指期货5分钟高频数据,研究其长期均衡策略。在部分可观测马尔可夫决策过程框架下,改进近端策略优化(PPO)算法。通过构建包含价格、波动率与流动性因子的24维状态空间,建立市场微观结构与强化学习决策的映射关系。引入波动率自适应的动态裁剪机制,以提升策略的稳定性,并构建融合条件风险价值约束的混合奖励函数,从而为金融交易中的强化学习应用提供新的算法框架。
关键词: 强化学习;动态风险控制;跨品种套利;状态空间;动作空间;
DOI: 10.13768/j.cnki.cn11-3793/f.2025.0596
专辑: 经济与管理科学;信息科技
专题: 自动化技术;金融;证券;投资
分类号: TP181;F832.5
- 上一篇:基于卓越绩效理念的项目风险管理研究——以Z研究院为例 2025/7/15
- 下一篇:提升内审员在质量管理体系中作用的策略探讨 2025/7/14