基于強(qiáng)化學(xué)習(xí)的股票趨勢(shì)跟蹤策略研究
發(fā)布時(shí)間:2022-10-21 18:25
趨勢(shì)跟蹤策略已經(jīng)在金融市場(chǎng)中實(shí)際應(yīng)用很長(zhǎng)時(shí)間,但仍存在著勝率低回撤大的缺點(diǎn),許多研究者也從不同的方向改進(jìn)這一策略,但采用智能算法對(duì)其改進(jìn)的研究較少。因此本文引入近幾年較為成功的強(qiáng)化學(xué)習(xí)算法來(lái)提高趨勢(shì)跟蹤策略的勝率,降低策略的回撤,進(jìn)而提高策略的整體表現(xiàn)。本文以雙均線策略作為輸入樣本,以凈值為目標(biāo)訓(xùn)練強(qiáng)化學(xué)習(xí)算法,同時(shí)以期望收益為指標(biāo)評(píng)價(jià)普通趨勢(shì)跟蹤策略與本文所提出的基于強(qiáng)化學(xué)習(xí)的策略。針對(duì)算法在投資策略領(lǐng)域應(yīng)用所存在的一些實(shí)際問(wèn)題,本文采取了折扣獎(jiǎng)勵(lì)歸一化、折扣獎(jiǎng)勵(lì)重置和引入懲罰項(xiàng)等方法,改善了訓(xùn)練過(guò)程與訓(xùn)練結(jié)果。最后,本文以限定持倉(cāng)量的方式,在110只市值、行業(yè)加權(quán)抽樣樣本中對(duì)普通趨勢(shì)跟蹤策略和基于強(qiáng)化學(xué)習(xí)的趨勢(shì)跟蹤策略進(jìn)行了回測(cè)。結(jié)果表明,本文所提出的策略凈值、期望收益均優(yōu)于普通趨勢(shì)跟蹤策略,這體現(xiàn)了本策略存在一定的實(shí)際應(yīng)用價(jià)值。
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景及意義
1.2 研究?jī)?nèi)容及框架
1.3 創(chuàng)新點(diǎn)
2 文獻(xiàn)綜述
2.1 趨勢(shì)跟蹤策略文獻(xiàn)綜述
2.1.1 趨勢(shì)跟蹤策略原理
2.1.2 趨勢(shì)跟蹤策略改進(jìn)
2.2 強(qiáng)化學(xué)習(xí)應(yīng)用于投資領(lǐng)域的文獻(xiàn)綜述
3 趨勢(shì)跟蹤策略
3.1 趨勢(shì)跟蹤策略的理論基礎(chǔ)
3.1.1 認(rèn)知偏差
3.1.2 處置效應(yīng)
3.1.3 噪音交易風(fēng)險(xiǎn)
3.1.4 羊群效應(yīng)
3.1.5 保守性偏誤
3.1.6 過(guò)度自信與自我歸因偏差
3.1.7 信息傳遞時(shí)滯
3.1.8 情緒蹺蹺板
3.2 趨勢(shì)跟蹤策略指標(biāo)的種類(lèi)
3.2.1 雙均線
3.2.2 二階低通濾波均線
3.2.3 高低點(diǎn)
3.2.4 布林帶
3.3 股指與個(gè)股的趨勢(shì)性檢驗(yàn)
3.3.1 研究樣本
3.3.2 股指趨勢(shì)性檢驗(yàn)
3.3.3 個(gè)股趨勢(shì)性檢驗(yàn)
3.4 趨勢(shì)跟蹤策略設(shè)計(jì)與實(shí)證
3.4.1 交易相關(guān)設(shè)定
3.4.2 評(píng)價(jià)指標(biāo)與結(jié)果匯總
3.4.3 結(jié)果分析
3.5 趨勢(shì)跟蹤策略應(yīng)用現(xiàn)狀及展望
4 強(qiáng)化學(xué)習(xí)策略
4.1 強(qiáng)化學(xué)習(xí)的理論基礎(chǔ)
4.1.1 馬爾可夫決策過(guò)程
4.1.2 Q-learning與 DQN
4.1.3 Policy Gradient
4.1.4 LSTM
4.2 強(qiáng)化學(xué)習(xí)策略的設(shè)計(jì)與實(shí)證
4.2.1 強(qiáng)化學(xué)習(xí)算法的構(gòu)建
4.2.2 樣本數(shù)據(jù)選取與構(gòu)建
4.2.3 獎(jiǎng)勵(lì)函數(shù)的設(shè)置
4.2.4 算法訓(xùn)練結(jié)果與分析
4.2.5 各趨勢(shì)跟蹤策略結(jié)果對(duì)比分析
5 結(jié)論及建議
5.1 結(jié)論
5.2 研究局限與建議
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于深度強(qiáng)化學(xué)習(xí)DDPG算法的投資組合管理[J]. 齊岳,黃碩華. 計(jì)算機(jī)與現(xiàn)代化. 2018(05)
[2]趨勢(shì)跟蹤類(lèi)策略的內(nèi)在邏輯[J]. 譚磊. 當(dāng)代經(jīng)濟(jì). 2017(06)
碩士論文
[1]基于深度強(qiáng)化學(xué)習(xí)的股市投資模型構(gòu)建及實(shí)證研究[D]. 滿奇.廣東財(cái)經(jīng)大學(xué) 2017
[2]強(qiáng)化學(xué)習(xí)在風(fēng)險(xiǎn)規(guī)避型數(shù)字化資產(chǎn)配置中的應(yīng)用[D]. 曹晶.山東大學(xué) 2017
本文編號(hào):3696154
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景及意義
1.2 研究?jī)?nèi)容及框架
1.3 創(chuàng)新點(diǎn)
2 文獻(xiàn)綜述
2.1 趨勢(shì)跟蹤策略文獻(xiàn)綜述
2.1.1 趨勢(shì)跟蹤策略原理
2.1.2 趨勢(shì)跟蹤策略改進(jìn)
2.2 強(qiáng)化學(xué)習(xí)應(yīng)用于投資領(lǐng)域的文獻(xiàn)綜述
3 趨勢(shì)跟蹤策略
3.1 趨勢(shì)跟蹤策略的理論基礎(chǔ)
3.1.1 認(rèn)知偏差
3.1.2 處置效應(yīng)
3.1.3 噪音交易風(fēng)險(xiǎn)
3.1.4 羊群效應(yīng)
3.1.5 保守性偏誤
3.1.6 過(guò)度自信與自我歸因偏差
3.1.7 信息傳遞時(shí)滯
3.1.8 情緒蹺蹺板
3.2 趨勢(shì)跟蹤策略指標(biāo)的種類(lèi)
3.2.1 雙均線
3.2.2 二階低通濾波均線
3.2.3 高低點(diǎn)
3.2.4 布林帶
3.3 股指與個(gè)股的趨勢(shì)性檢驗(yàn)
3.3.1 研究樣本
3.3.2 股指趨勢(shì)性檢驗(yàn)
3.3.3 個(gè)股趨勢(shì)性檢驗(yàn)
3.4 趨勢(shì)跟蹤策略設(shè)計(jì)與實(shí)證
3.4.1 交易相關(guān)設(shè)定
3.4.2 評(píng)價(jià)指標(biāo)與結(jié)果匯總
3.4.3 結(jié)果分析
3.5 趨勢(shì)跟蹤策略應(yīng)用現(xiàn)狀及展望
4 強(qiáng)化學(xué)習(xí)策略
4.1 強(qiáng)化學(xué)習(xí)的理論基礎(chǔ)
4.1.1 馬爾可夫決策過(guò)程
4.1.2 Q-learning與 DQN
4.1.3 Policy Gradient
4.1.4 LSTM
4.2 強(qiáng)化學(xué)習(xí)策略的設(shè)計(jì)與實(shí)證
4.2.1 強(qiáng)化學(xué)習(xí)算法的構(gòu)建
4.2.2 樣本數(shù)據(jù)選取與構(gòu)建
4.2.3 獎(jiǎng)勵(lì)函數(shù)的設(shè)置
4.2.4 算法訓(xùn)練結(jié)果與分析
4.2.5 各趨勢(shì)跟蹤策略結(jié)果對(duì)比分析
5 結(jié)論及建議
5.1 結(jié)論
5.2 研究局限與建議
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于深度強(qiáng)化學(xué)習(xí)DDPG算法的投資組合管理[J]. 齊岳,黃碩華. 計(jì)算機(jī)與現(xiàn)代化. 2018(05)
[2]趨勢(shì)跟蹤類(lèi)策略的內(nèi)在邏輯[J]. 譚磊. 當(dāng)代經(jīng)濟(jì). 2017(06)
碩士論文
[1]基于深度強(qiáng)化學(xué)習(xí)的股市投資模型構(gòu)建及實(shí)證研究[D]. 滿奇.廣東財(cái)經(jīng)大學(xué) 2017
[2]強(qiáng)化學(xué)習(xí)在風(fēng)險(xiǎn)規(guī)避型數(shù)字化資產(chǎn)配置中的應(yīng)用[D]. 曹晶.山東大學(xué) 2017
本文編號(hào):3696154
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3696154.html
最近更新
教材專(zhuān)著