基于隨機(jī)森林優(yōu)化的滬深300指數(shù)走勢(shì)預(yù)測(cè)研究
發(fā)布時(shí)間:2021-02-13 05:19
隨著人工智能出現(xiàn)及發(fā)展,“AI革命”也進(jìn)入到了金融領(lǐng)域,金融領(lǐng)域進(jìn)入到了大數(shù)據(jù)時(shí)代。以金融大數(shù)據(jù)為基礎(chǔ),對(duì)金融數(shù)據(jù)進(jìn)行充分的數(shù)據(jù)挖掘,利用機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)去構(gòu)建過去歷史金融數(shù)據(jù)間的聯(lián)系,再通過最新的金融數(shù)據(jù),做出相應(yīng)的結(jié)果。投資者們就可以通過這些結(jié)果,對(duì)金融市場(chǎng)進(jìn)行有效的分析和研究,減少自己的投資風(fēng)險(xiǎn)。量化投資是指通過使用金融大數(shù)據(jù),對(duì)金融數(shù)據(jù)進(jìn)行充分的數(shù)據(jù)挖掘,構(gòu)建過去歷史金融數(shù)據(jù)間的聯(lián)系,利用各種金融衍生產(chǎn)品,調(diào)整投資策略,減少投資者的投資風(fēng)險(xiǎn),提供良好收益。幾十年來,對(duì)股市的預(yù)測(cè)一直是人們研究的對(duì)象,但鑒于其固有的復(fù)雜性、動(dòng)態(tài)性和混亂性,它已被證明是一項(xiàng)非常艱巨的任務(wù)。要考慮的變量和信息來源的數(shù)量是巨大的,這使得預(yù)測(cè)未來股市價(jià)格走勢(shì)的任務(wù)變得非常困難。幾十年來,科學(xué)界一直在討論這一壯舉的可能性。本文在使用滬深300指數(shù)的交易數(shù)據(jù)中,挖掘并篩選出影響指數(shù)價(jià)格走勢(shì)的特征,針對(duì)金融數(shù)據(jù)的特點(diǎn),以隨機(jī)森林模型(Random Forest,RF)為基礎(chǔ),結(jié)合遺傳算法(Genetic Algorithm,GA),建立GA—B—RF模型,構(gòu)建出它們的內(nèi)在聯(lián)系預(yù)測(cè)滬深300指數(shù)未來單日的走勢(shì)...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:61 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖5.4:決策樹數(shù)目和OOB?scores關(guān)系??
?山東大學(xué)碩士學(xué)位論文???最后,模型中子決策樹的數(shù)目參數(shù)設(shè)定為最優(yōu)值190,子決策樹的最大深度??參數(shù)設(shè)定為最優(yōu)值3,將其他參數(shù)設(shè)為默認(rèn)值,使用網(wǎng)格搜索,對(duì)隨機(jī)森林允許??在單個(gè)樹中嘗試的最大特征數(shù)進(jìn)行尋找,取遍給定區(qū)間的所有值,使用相應(yīng)的??值在隨機(jī)森林中訓(xùn)練,獲取對(duì)應(yīng)的OOB?score。本文從丨1,17]尋找樹的最大深??度,并計(jì)算出相對(duì)應(yīng)OOB?score,經(jīng)過排序比較,找到最優(yōu)值。結(jié)果如圖5.6。根??據(jù)子決策樹使用的最多特征和00B?score的關(guān)系,子決策樹使用的最多特征的??最優(yōu)值設(shè)定為4。??OOB?scores?change?with?max?features??0.560?-?|??0.555?-?||?Z??i=:?K??I議-?/??aszs-?/\|?V??a52G?J——r—^?,?,?,?,?f——??2?4?6?8?10?12?14??max?featyres??圖5.6:子決策樹使用的最多特征和OOB?scores關(guān)系??將利用網(wǎng)格搜索優(yōu)化后的的參數(shù)帶入模型中,進(jìn)行訓(xùn)練,對(duì)樣本外測(cè)試數(shù)據(jù)??集進(jìn)行預(yù)測(cè)分類,Accuracy達(dá)到55.41%,ROC曲線如圖5.7。??(二)遺傳算法優(yōu)化的RF預(yù)測(cè)??使用遺傳算法對(duì)樹的個(gè)數(shù),決策樹的最大深度和隨機(jī)森林允許在單個(gè)樹中嘗??試的最大特征數(shù)進(jìn)行優(yōu)化;以三個(gè)參數(shù)一組構(gòu)成一個(gè)個(gè)體。??優(yōu)化過程:先做初始化,生成若干個(gè)個(gè)體。對(duì)于每個(gè)個(gè)體隨機(jī)生成一組二進(jìn)??制數(shù),進(jìn)行模擬,計(jì)算出適應(yīng)度。對(duì)個(gè)體進(jìn)行遺傳選擇、交叉和變異操作,經(jīng)過??若干代(可以最大遺傳代數(shù)或誤差作為結(jié)束條件)遺傳后,得到的就是經(jīng)過優(yōu)?
?山東大學(xué)碩士學(xué)位論文???:r^i??\??y??/?———,??〇〇?^?1?1?1?.???00?(L2?04?06?08?10??False?Positive?Rate??圖5.7:網(wǎng)格搜索優(yōu)化的隨機(jī)森林ROC曲線??:r^??L?Z??£*??—?ROC?curve?(area???0?5728)??0.0??i?????'???00?0.2?04?06?08?10??Fdls??P〇s?iv??Rflte??圖5.8:遺傳算法優(yōu)化的隨機(jī)森林ROC曲線??-31?-??
【參考文獻(xiàn)】:
期刊論文
[1]參數(shù)優(yōu)化隨機(jī)森林在股票預(yù)測(cè)中的應(yīng)用[J]. 鄧晶,李路. 軟件. 2020(01)
[2]GBDT組合模型在股票預(yù)測(cè)中的應(yīng)用[J]. 張瀟,韋增欣,楊天山. 海南師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[3]基于改進(jìn)的支持向量機(jī)的股票預(yù)測(cè)方法[J]. 郝知遠(yuǎn). 江蘇科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(03)
[4]隨機(jī)森林在量化選股中的應(yīng)用研究[J]. 王淑燕,曹正鳳,陳銘芷. 運(yùn)籌與管理. 2016(03)
[5]隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J]. 李欣海. 應(yīng)用昆蟲學(xué)報(bào). 2013(04)
[6]基于隨機(jī)森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟. 吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2014(01)
[7]隨機(jī)森林方法研究綜述[J]. 方匡南,吳見彬,朱建平,謝邦昌. 統(tǒng)計(jì)與信息論壇. 2011(03)
[8]基于隨機(jī)森林方法的基金收益率方向預(yù)測(cè)與交易策略研究[J]. 方匡南,朱建平,謝邦昌. 經(jīng)濟(jì)經(jīng)緯. 2010(02)
[9]支持向量機(jī)在股票價(jià)格預(yù)測(cè)中的應(yīng)用[J]. 張玉川,張作泉. 北京交通大學(xué)學(xué)報(bào). 2007(06)
[10]基于支持向量機(jī)的股票預(yù)測(cè)[J]. 張晨希,張燕平,張迎春,陳潔,萬忠. 計(jì)算機(jī)技術(shù)與發(fā)展. 2006(06)
本文編號(hào):3032031
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:61 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖5.4:決策樹數(shù)目和OOB?scores關(guān)系??
?山東大學(xué)碩士學(xué)位論文???最后,模型中子決策樹的數(shù)目參數(shù)設(shè)定為最優(yōu)值190,子決策樹的最大深度??參數(shù)設(shè)定為最優(yōu)值3,將其他參數(shù)設(shè)為默認(rèn)值,使用網(wǎng)格搜索,對(duì)隨機(jī)森林允許??在單個(gè)樹中嘗試的最大特征數(shù)進(jìn)行尋找,取遍給定區(qū)間的所有值,使用相應(yīng)的??值在隨機(jī)森林中訓(xùn)練,獲取對(duì)應(yīng)的OOB?score。本文從丨1,17]尋找樹的最大深??度,并計(jì)算出相對(duì)應(yīng)OOB?score,經(jīng)過排序比較,找到最優(yōu)值。結(jié)果如圖5.6。根??據(jù)子決策樹使用的最多特征和00B?score的關(guān)系,子決策樹使用的最多特征的??最優(yōu)值設(shè)定為4。??OOB?scores?change?with?max?features??0.560?-?|??0.555?-?||?Z??i=:?K??I議-?/??aszs-?/\|?V??a52G?J——r—^?,?,?,?,?f——??2?4?6?8?10?12?14??max?featyres??圖5.6:子決策樹使用的最多特征和OOB?scores關(guān)系??將利用網(wǎng)格搜索優(yōu)化后的的參數(shù)帶入模型中,進(jìn)行訓(xùn)練,對(duì)樣本外測(cè)試數(shù)據(jù)??集進(jìn)行預(yù)測(cè)分類,Accuracy達(dá)到55.41%,ROC曲線如圖5.7。??(二)遺傳算法優(yōu)化的RF預(yù)測(cè)??使用遺傳算法對(duì)樹的個(gè)數(shù),決策樹的最大深度和隨機(jī)森林允許在單個(gè)樹中嘗??試的最大特征數(shù)進(jìn)行優(yōu)化;以三個(gè)參數(shù)一組構(gòu)成一個(gè)個(gè)體。??優(yōu)化過程:先做初始化,生成若干個(gè)個(gè)體。對(duì)于每個(gè)個(gè)體隨機(jī)生成一組二進(jìn)??制數(shù),進(jìn)行模擬,計(jì)算出適應(yīng)度。對(duì)個(gè)體進(jìn)行遺傳選擇、交叉和變異操作,經(jīng)過??若干代(可以最大遺傳代數(shù)或誤差作為結(jié)束條件)遺傳后,得到的就是經(jīng)過優(yōu)?
?山東大學(xué)碩士學(xué)位論文???:r^i??\??y??/?———,??〇〇?^?1?1?1?.???00?(L2?04?06?08?10??False?Positive?Rate??圖5.7:網(wǎng)格搜索優(yōu)化的隨機(jī)森林ROC曲線??:r^??L?Z??£*??—?ROC?curve?(area???0?5728)??0.0??i?????'???00?0.2?04?06?08?10??Fdls??P〇s?iv??Rflte??圖5.8:遺傳算法優(yōu)化的隨機(jī)森林ROC曲線??-31?-??
【參考文獻(xiàn)】:
期刊論文
[1]參數(shù)優(yōu)化隨機(jī)森林在股票預(yù)測(cè)中的應(yīng)用[J]. 鄧晶,李路. 軟件. 2020(01)
[2]GBDT組合模型在股票預(yù)測(cè)中的應(yīng)用[J]. 張瀟,韋增欣,楊天山. 海南師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[3]基于改進(jìn)的支持向量機(jī)的股票預(yù)測(cè)方法[J]. 郝知遠(yuǎn). 江蘇科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(03)
[4]隨機(jī)森林在量化選股中的應(yīng)用研究[J]. 王淑燕,曹正鳳,陳銘芷. 運(yùn)籌與管理. 2016(03)
[5]隨機(jī)森林模型在分類與回歸分析中的應(yīng)用[J]. 李欣海. 應(yīng)用昆蟲學(xué)報(bào). 2013(04)
[6]基于隨機(jī)森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟. 吉林大學(xué)學(xué)報(bào)(工學(xué)版). 2014(01)
[7]隨機(jī)森林方法研究綜述[J]. 方匡南,吳見彬,朱建平,謝邦昌. 統(tǒng)計(jì)與信息論壇. 2011(03)
[8]基于隨機(jī)森林方法的基金收益率方向預(yù)測(cè)與交易策略研究[J]. 方匡南,朱建平,謝邦昌. 經(jīng)濟(jì)經(jīng)緯. 2010(02)
[9]支持向量機(jī)在股票價(jià)格預(yù)測(cè)中的應(yīng)用[J]. 張玉川,張作泉. 北京交通大學(xué)學(xué)報(bào). 2007(06)
[10]基于支持向量機(jī)的股票預(yù)測(cè)[J]. 張晨希,張燕平,張迎春,陳潔,萬忠. 計(jì)算機(jī)技術(shù)與發(fā)展. 2006(06)
本文編號(hào):3032031
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3032031.html
最近更新
教材專著