天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 貨幣論文 >

基于GBDT、RAF及混合模型策略在滬深300中的應(yīng)用

發(fā)布時間:2021-11-27 03:22
  隨著機(jī)器學(xué)習(xí)技術(shù)應(yīng)用的不斷深入,量化投資呈現(xiàn)一些新的發(fā)展趨勢,投資者能夠利用機(jī)器學(xué)習(xí)算法來處理更大量的數(shù)據(jù),挖掘市場的內(nèi)在規(guī)律。量化選股策略作為一類重要的量化投資策略,具有重要的地位,其借助機(jī)器學(xué)習(xí)的力量也有了進(jìn)一步的發(fā)展。本文采用國內(nèi)最具代表性的滬深300指數(shù)成分股作為實(shí)證研究對象,以04年初至19年底作為研究區(qū)間,研究了基于隨機(jī)森林模型、梯度提升樹模型及混合模型的量化選股策略。本文首先介紹了所使用的機(jī)器學(xué)習(xí)相關(guān)模型的理論知識,之后進(jìn)行基礎(chǔ)模型的搭建工作,基于收益率特征構(gòu)造了訓(xùn)練集和交易集,并對模型進(jìn)行訓(xùn)練,根據(jù)預(yù)測概率選出頭部做多的k只股票和尾部做空的k只股票,舍棄掉中間方向較為不確定的股票,構(gòu)造投資組合。在k=10、扣除交易費(fèi)用前的情況下,基于GBDT模型的策略日均收益率達(dá)到了 0.37%,遠(yuǎn)高于按照相同方式持有并交易滬深300指數(shù)所獲得的日均收益率0.04%;基于混合模型的策略每日收益大于0的概率達(dá)到了 69.62%,扣除交易費(fèi)用后依然可以達(dá)到58.59%,高于持有市場指數(shù)策略的52.78%,策略表現(xiàn)較為良好。本文對基礎(chǔ)模型進(jìn)行了一定的改進(jìn),形成了兩個策略,一個是賦權(quán)策略,一個... 

【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:60 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于GBDT、RAF及混合模型策略在滬深300中的應(yīng)用


圖3-1隨機(jī)森林流程圖??隨機(jī)森林的錯誤率即分類效果主要與兩個因素有關(guān):??(1)森林當(dāng)中任意兩棵樹的相關(guān)性

指數(shù),收盤價,成分,數(shù)據(jù)


山東大學(xué)碩士學(xué)位論文??4.1數(shù)據(jù)及軟件??4.1.1?數(shù)據(jù)??本文選取從Wind金融終端獲取的滬深300指數(shù)的成分股的相關(guān)數(shù)據(jù)進(jìn)行建??模的預(yù)測分析。滬深300指數(shù)反映了滬深兩地市場的整體走勢,被投資者廣泛接??受。滬深300指數(shù)的成分股選自滬深兩個證券市場,能夠覆蓋大部分流通市值。??它們在市場中代表性強(qiáng),是市場上基本面較好、市值大、流通性強(qiáng)的300只主流??投資股票。在滬深300指數(shù)成分股中進(jìn)行建模也增強(qiáng)了模型的說服力和策略的實(shí)??用性。本文選取的數(shù)據(jù)集為2004年1月1日至2019年12月31日所有交易日中??滬深300指數(shù)成分股的收盤價數(shù)據(jù),具體的訓(xùn)練集及測試集構(gòu)造方式將在下文中??進(jìn)行詳細(xì)說明。作為我們策略的一個參考標(biāo)準(zhǔn),在此期間,滬深300指數(shù)走勢情??況如下圖:??6000?-j?"??5000?-?I?j??::??1000?-??till?I?I?I?I??,??^?^?^?^?^?^?^??圖4-2滬深300指數(shù)圖??我們所選取的滬深300指數(shù)成分股收盤價具體數(shù)據(jù)如下圖:??20??

滑動窗口,股票,時段


山東大學(xué)碩士學(xué)位論文??學(xué)習(xí)時段?1?—s——??①訓(xùn)練集?②交易勢:??a?習(xí)時段?2?^3j||||EBSBlBiE^y??^?①訓(xùn)練集?②交易集??學(xué)習(xí)時段i3?ii_i_iimiiwiM丨》丨丨丨丨咖丨_w"丨丨丨*)'?丨||丨』??(D訓(xùn)練集?(fr>c易集??①訓(xùn)練集?②交易集??圖4-3滑動窗口法示意??在每個“學(xué)習(xí)時段”中,將該時段最后一天滬深300指數(shù)所包含的所有成分??股納入考量,如果該股票在該時段中,擁有所有的收盤價信息,則留在集合中;??若其收盤價信息并不完整,由于種種原因存在缺失,則從集合中刪除;以&代表??集合中的股票數(shù)量(ie{l,?2,……,13}),則叫幺300。??4.3特征輸入及變量輸出??在每個“學(xué)習(xí)時段”中,我們按照以下方式構(gòu)造輸入的特征空間:??以Pts代表股票s在t時刻的價格,定義咚m為股票s在t時刻過去m天的收??益率:??<,吾一1?(4-1)??rt-m??對于滬深300成分股中的任意一支股票s,按照Takeuchi和Lee的做法[4],??以及Krauss,Do和Huck的做法[8],我們選。恚牛,2,……,20}?U?{40,?60,??80,……,240},即首先選取過去1天至過去20天(約為過去一個月的交易時??間)該股票的收益率,之后降低頻次,選取過去20天、40天直到過去240天(可??大致將其看作為過去1個月、2個月直到過去一年的交易時間)該股票的收益率。??這樣,總共選取了?31個收益率的特征作為模型輸入的特征空間。??以當(dāng)前時刻為t,股票為Si為例,輸入的特征變量為:??22??


本文編號:3521468

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/huobilw/3521468.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c1efb***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com