基于深度強化學習的股票量化交易算法研究與實現(xiàn)
發(fā)布時間:2023-05-09 22:36
自21世紀以來,與計算機領域相關的軟硬件技術蓬勃發(fā)展,為人工智能技術的興起打下了良好的基礎,而量化交易由于其高效和穩(wěn)定的性能吸引了更多的投資者。在本文中,我們探索了深度強化學習以及元學習方法在量化交易中的潛力,提出了一種基于LSTM深度神經(jīng)網(wǎng)絡的智能體,以學習股票數(shù)據(jù)中的時間關系;并且使用策略梯度訓練方法,依據(jù)當前的市場狀況和歷史數(shù)據(jù)進行自動化交易。本文主要完成以下工作:1.針對傳統(tǒng)量化交易方法其表征金融信號時的缺陷,提出了格拉布斯去噪聲的優(yōu)化方法對金融數(shù)據(jù)進行處理,將其與量化交易系統(tǒng)結合,更為準確地捕捉到金融市場的特性。實驗結果顯示,格拉布斯去噪的優(yōu)化過程可以大幅度提高智能體對股票數(shù)據(jù)的表征能力,從而超越傳統(tǒng)方法的盈利性能。2.由于傳統(tǒng)的量化交易方法在處理高維數(shù)據(jù)時存在難度,難以挖掘股票數(shù)據(jù)的歷史意義,本文提出了基于深度強化學習的量化交易方法,智能體采用LSTM深度神經(jīng)網(wǎng)絡構造,在學習和記憶股票數(shù)據(jù)中的時序關系的同時探索最優(yōu)的交易策略。實驗證明,基于LSTM網(wǎng)絡的交易智能體訓練的性能優(yōu)于基于全連接神經(jīng)網(wǎng)絡的智能體,前者最高收益率達到280%。3.由于金融數(shù)據(jù)存在大量噪聲和冗余數(shù)據(jù),金...
【文章頁數(shù)】:90 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 選題背景及研究意義
1.2 研究現(xiàn)狀與發(fā)展趨勢
1.2.1 量化交易
1.2.2 深度強化學習
1.3 論文研究內容
1.4 論文組織結構
第二章 深度強化學習和量化交易理論
2.1 深度學習
2.2 強化學習
2.3 深度強化學習
2.4 量化交易
2.5 量化投資環(huán)境構成
第三章 直接強化學習交易算法
3.1 直接強化學習
3.1.1 夏普率
3.1.2 交易函數(shù)
3.1.3 梯度上升及策略訓練
3.2 基于格拉布斯改進算法
3.2.1 直接強化學習算法缺陷
3.2.2 格拉布斯去噪優(yōu)化
3.3 基于格拉布斯改進算法實驗
3.3.1 數(shù)據(jù)選取
3.3.2 格拉布斯優(yōu)化設置
3.3.3 實驗結果
第四章 基于深度強化學習的股票交易算法改進
4.1 基于深度強化學習的量化交易算法
4.1.1 智能體網(wǎng)絡結構
4.1.2 狀態(tài)、動作及獎勵值設計
4.1.3 牛市、熊市判別
4.1.4 動作篩選
4.1.5 智能體訓練算法
4.2 優(yōu)勢指標篩選組合
4.3 實驗設置
4.3.1 訓練方法
4.3.2 智能體網(wǎng)絡構造
4.3.3 優(yōu)勢指標篩選組合
4.4 實驗結果
4.4.1 不同網(wǎng)絡智能體性能對比
4.4.2 優(yōu)勢指標篩選組合
4.4.3 回溯測驗:與直接強化學習算法對比
第五章 基于元強化學習方法的股票交易算法
5.1 元學習理論
5.1.1 監(jiān)督學習中的元學習
5.1.2 強化學習中的元學習
5.2 基于元強化學習算法的量化交易算法
5.2.1 智能體構建
5.2.2 多任務學習梯度
5.2.3 二階微分與一階近似
5.3 回測設計
5.4 回測結果
第六章 總結與展望
6.1 工作總結
6.2 未來展望
致謝
參考文獻
攻讀碩士期間發(fā)表的學術論文與取得的其他研究成果
本文編號:3812510
【文章頁數(shù)】:90 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 選題背景及研究意義
1.2 研究現(xiàn)狀與發(fā)展趨勢
1.2.1 量化交易
1.2.2 深度強化學習
1.3 論文研究內容
1.4 論文組織結構
第二章 深度強化學習和量化交易理論
2.1 深度學習
2.2 強化學習
2.3 深度強化學習
2.4 量化交易
2.5 量化投資環(huán)境構成
第三章 直接強化學習交易算法
3.1 直接強化學習
3.1.1 夏普率
3.1.2 交易函數(shù)
3.1.3 梯度上升及策略訓練
3.2 基于格拉布斯改進算法
3.2.1 直接強化學習算法缺陷
3.2.2 格拉布斯去噪優(yōu)化
3.3 基于格拉布斯改進算法實驗
3.3.1 數(shù)據(jù)選取
3.3.2 格拉布斯優(yōu)化設置
3.3.3 實驗結果
第四章 基于深度強化學習的股票交易算法改進
4.1 基于深度強化學習的量化交易算法
4.1.1 智能體網(wǎng)絡結構
4.1.2 狀態(tài)、動作及獎勵值設計
4.1.3 牛市、熊市判別
4.1.4 動作篩選
4.1.5 智能體訓練算法
4.2 優(yōu)勢指標篩選組合
4.3 實驗設置
4.3.1 訓練方法
4.3.2 智能體網(wǎng)絡構造
4.3.3 優(yōu)勢指標篩選組合
4.4 實驗結果
4.4.1 不同網(wǎng)絡智能體性能對比
4.4.2 優(yōu)勢指標篩選組合
4.4.3 回溯測驗:與直接強化學習算法對比
第五章 基于元強化學習方法的股票交易算法
5.1 元學習理論
5.1.1 監(jiān)督學習中的元學習
5.1.2 強化學習中的元學習
5.2 基于元強化學習算法的量化交易算法
5.2.1 智能體構建
5.2.2 多任務學習梯度
5.2.3 二階微分與一階近似
5.3 回測設計
5.4 回測結果
第六章 總結與展望
6.1 工作總結
6.2 未來展望
致謝
參考文獻
攻讀碩士期間發(fā)表的學術論文與取得的其他研究成果
本文編號:3812510
本文鏈接:http://sikaile.net/guanlilunwen/huobilw/3812510.html
最近更新
教材專著