基于深度強(qiáng)化學(xué)習(xí)的股票投資組合管理及實(shí)證研究
發(fā)布時(shí)間:2023-11-14 19:54
近年來,隨著Google DeepMind等人工智能研發(fā)團(tuán)隊(duì)的不斷出現(xiàn),深度強(qiáng)化學(xué)習(xí)逐漸為人們所熟知。與此同時(shí),我國(guó)股票交易市場(chǎng)逐漸向多樣化、便捷化與信息化方向迅速發(fā)展,這使得股票交易市場(chǎng)每天都在產(chǎn)生大量數(shù)據(jù)。為了解決傳統(tǒng)交易分析方法難以處理大量數(shù)據(jù)的缺陷,且避免人類投資者匱乏紀(jì)律性的非理性操作,具備科學(xué)性、系統(tǒng)性和準(zhǔn)確性的量化投資逐漸成為機(jī)構(gòu)投資研究者重點(diǎn)關(guān)注和發(fā)展的投資方式。量化投資是利用計(jì)算機(jī)對(duì)金融數(shù)據(jù)進(jìn)行建模,挖掘數(shù)據(jù)中所蘊(yùn)含的投資機(jī)會(huì)和交易信號(hào),進(jìn)而構(gòu)建動(dòng)態(tài)、自適應(yīng)的投資策略,這與深度強(qiáng)化學(xué)習(xí)有異曲同工之妙,因此將二者結(jié)合起來用以解決現(xiàn)實(shí)金融問題是可行的。將深度強(qiáng)化學(xué)習(xí)應(yīng)用于量化投資領(lǐng)域,一方面拓寬了量化投資的研究思路與建模方法,另一方面促進(jìn)了金融交易向智能化與自動(dòng)化方向發(fā)展。為獲取最優(yōu)投資機(jī)會(huì)與交易信號(hào),本文嘗試將深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning,DRL)方法應(yīng)用于量化投資領(lǐng)域,以解決股票市場(chǎng)投資組合的管理問題。本文以A2C、PPO與SAC三種基于執(zhí)行者/評(píng)論者的深度強(qiáng)化學(xué)習(xí)算法原理和框架為基礎(chǔ)搭建模型智能體,結(jié)合股票市場(chǎng)歷史真實(shí)價(jià)格、成...
【文章頁數(shù)】:87 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究?jī)?nèi)容與論文框架
1.2.1 研究?jī)?nèi)容
1.2.2 論文框架
1.3 研究思路與研究方法
1.3.1 研究思路
1.3.2 研究方法
1.4 本文創(chuàng)新之處
第二章 文獻(xiàn)綜述
2.1 基于經(jīng)典機(jī)器學(xué)習(xí)算法的量化投資
2.2 深度學(xué)習(xí)
2.2.1 深度學(xué)習(xí)在非金融領(lǐng)域的研究
2.2.2 深度學(xué)習(xí)在金融投資領(lǐng)域的研究
2.3 強(qiáng)化學(xué)習(xí)
2.3.1 基于價(jià)值的強(qiáng)化學(xué)習(xí)算法
2.3.2 基于策略的強(qiáng)化學(xué)習(xí)算法
2.4 深度強(qiáng)化學(xué)習(xí)
2.4.1 基于評(píng)論者的深度強(qiáng)化學(xué)習(xí)算法
2.4.2 基于執(zhí)行者的深度強(qiáng)化學(xué)習(xí)算法
2.4.3 執(zhí)行者/評(píng)論者算法
第三章 深度強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
3.1 深度學(xué)習(xí)理論基礎(chǔ)
3.1.1 深度學(xué)習(xí)
3.1.2 深度神經(jīng)網(wǎng)絡(luò)
3.2 強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
3.2.1 馬爾科夫決策過程
3.2.2 動(dòng)態(tài)規(guī)劃
3.2.3 蒙特卡羅強(qiáng)化學(xué)習(xí)方法
3.2.4 時(shí)序差分價(jià)值迭代
3.3 深度強(qiáng)化學(xué)習(xí)方法理論基礎(chǔ)
3.3.1 值函數(shù)非線性近似方法
3.3.2 策略梯度方法
3.3.3 執(zhí)行者/評(píng)論者方法
3.4 本章小結(jié)
第四章 構(gòu)建深度強(qiáng)化學(xué)習(xí)投資組合管理模型
4.1 交易過程深度強(qiáng)化學(xué)習(xí)建模的可行性分析
4.1.1 交互過程
4.1.2 幕數(shù)與日內(nèi)資產(chǎn)權(quán)重變化
4.1.3 模擬交易具體事項(xiàng)
4.2 狀態(tài)、動(dòng)作與獎(jiǎng)勵(lì)
4.2.1 狀態(tài)
4.2.2 動(dòng)作
4.2.3 獎(jiǎng)勵(lì)
4.3 智能體的構(gòu)建
4.3.1 A2C
4.3.2 PPO
4.3.3 SAC
第五章 深度強(qiáng)化學(xué)習(xí)投資組合管理模型實(shí)證分析
5.1 實(shí)驗(yàn)設(shè)計(jì)
5.1.1 訓(xùn)練與測(cè)試的區(qū)間劃分
5.1.2 交易資產(chǎn)組合的選擇
5.1.3 數(shù)據(jù)的獲取與預(yù)處理
5.1.4 基準(zhǔn)與對(duì)照模型的設(shè)定
5.2 實(shí)驗(yàn)結(jié)果分析
5.2.1 累計(jì)收益率曲線
5.2.2 年化收益率
5.2.3 年化波動(dòng)率
5.2.4 夏普比率
5.2.5 最大回撤率
5.2.6 Alpha值
5.2.7 Beta值
5.2.8 索提諾比率
5.3 本章小結(jié)
總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間取得的科研成果
本文編號(hào):3864102
【文章頁數(shù)】:87 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究?jī)?nèi)容與論文框架
1.2.1 研究?jī)?nèi)容
1.2.2 論文框架
1.3 研究思路與研究方法
1.3.1 研究思路
1.3.2 研究方法
1.4 本文創(chuàng)新之處
第二章 文獻(xiàn)綜述
2.1 基于經(jīng)典機(jī)器學(xué)習(xí)算法的量化投資
2.2 深度學(xué)習(xí)
2.2.1 深度學(xué)習(xí)在非金融領(lǐng)域的研究
2.2.2 深度學(xué)習(xí)在金融投資領(lǐng)域的研究
2.3 強(qiáng)化學(xué)習(xí)
2.3.1 基于價(jià)值的強(qiáng)化學(xué)習(xí)算法
2.3.2 基于策略的強(qiáng)化學(xué)習(xí)算法
2.4 深度強(qiáng)化學(xué)習(xí)
2.4.1 基于評(píng)論者的深度強(qiáng)化學(xué)習(xí)算法
2.4.2 基于執(zhí)行者的深度強(qiáng)化學(xué)習(xí)算法
2.4.3 執(zhí)行者/評(píng)論者算法
第三章 深度強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
3.1 深度學(xué)習(xí)理論基礎(chǔ)
3.1.1 深度學(xué)習(xí)
3.1.2 深度神經(jīng)網(wǎng)絡(luò)
3.2 強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
3.2.1 馬爾科夫決策過程
3.2.2 動(dòng)態(tài)規(guī)劃
3.2.3 蒙特卡羅強(qiáng)化學(xué)習(xí)方法
3.2.4 時(shí)序差分價(jià)值迭代
3.3 深度強(qiáng)化學(xué)習(xí)方法理論基礎(chǔ)
3.3.1 值函數(shù)非線性近似方法
3.3.2 策略梯度方法
3.3.3 執(zhí)行者/評(píng)論者方法
3.4 本章小結(jié)
第四章 構(gòu)建深度強(qiáng)化學(xué)習(xí)投資組合管理模型
4.1 交易過程深度強(qiáng)化學(xué)習(xí)建模的可行性分析
4.1.1 交互過程
4.1.2 幕數(shù)與日內(nèi)資產(chǎn)權(quán)重變化
4.1.3 模擬交易具體事項(xiàng)
4.2 狀態(tài)、動(dòng)作與獎(jiǎng)勵(lì)
4.2.1 狀態(tài)
4.2.2 動(dòng)作
4.2.3 獎(jiǎng)勵(lì)
4.3 智能體的構(gòu)建
4.3.1 A2C
4.3.2 PPO
4.3.3 SAC
第五章 深度強(qiáng)化學(xué)習(xí)投資組合管理模型實(shí)證分析
5.1 實(shí)驗(yàn)設(shè)計(jì)
5.1.1 訓(xùn)練與測(cè)試的區(qū)間劃分
5.1.2 交易資產(chǎn)組合的選擇
5.1.3 數(shù)據(jù)的獲取與預(yù)處理
5.1.4 基準(zhǔn)與對(duì)照模型的設(shè)定
5.2 實(shí)驗(yàn)結(jié)果分析
5.2.1 累計(jì)收益率曲線
5.2.2 年化收益率
5.2.3 年化波動(dòng)率
5.2.4 夏普比率
5.2.5 最大回撤率
5.2.6 Alpha值
5.2.7 Beta值
5.2.8 索提諾比率
5.3 本章小結(jié)
總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間取得的科研成果
本文編號(hào):3864102
本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/3864102.html
最近更新
教材專著