基于EEMD和XGBoost算法的股票市場(chǎng)分析預(yù)測(cè)研究
發(fā)布時(shí)間:2020-12-10 19:08
我國(guó)股票市場(chǎng)作為實(shí)體企業(yè)籌集資金和各種類型的投資者配置自身資產(chǎn)的重要渠道,是我國(guó)金融市場(chǎng)不可缺少的重要組成部分。股票作為兼具高收益性和高風(fēng)險(xiǎn)性的金融資產(chǎn),在金融市場(chǎng)的發(fā)展中有著舉足輕重的地位,一直以來也受到金融市場(chǎng)各界人士的重視。然而股票數(shù)據(jù)是具有高復(fù)雜性,高數(shù)據(jù)量,高變化頻率的金融時(shí)間序列,同時(shí)它具有高噪聲、非線性、非平穩(wěn)的特點(diǎn),有悖于一些經(jīng)典理論的基本假設(shè),制約了經(jīng)典理論的適用范圍。因此,找到合理的股票市場(chǎng)數(shù)據(jù)的提取方法,構(gòu)建一個(gè)能夠描述股票市場(chǎng)復(fù)雜度非線性特點(diǎn)的模型,對(duì)于進(jìn)一步揭示股票市場(chǎng)的內(nèi)在運(yùn)行規(guī)律,更好的發(fā)揮股票市場(chǎng)應(yīng)有的功能,更加及時(shí)揭露金融風(fēng)險(xiǎn)等方面,都具有現(xiàn)實(shí)以及理論價(jià)值。時(shí)至今日,模型分析的方法已被廣泛應(yīng)用到金融行業(yè)的分析領(lǐng)域,其中比較經(jīng)典的是ARMA、ARCH、GARCH等模型。這些方法都是以統(tǒng)計(jì)學(xué)基本原理為基礎(chǔ)與依據(jù),在時(shí)間序列滿足平穩(wěn)性假設(shè)或正態(tài)分布假設(shè)的前提下進(jìn)行建模分析。這些分析方法僅從時(shí)間域這一方面做研究,其計(jì)算效率低,預(yù)測(cè)精度不足且研究層面單一。因此,經(jīng)典預(yù)測(cè)模型已經(jīng)很難適應(yīng)現(xiàn)下對(duì)金融時(shí)間序列研究的需求。隨著機(jī)器學(xué)習(xí)體系的建立以及其在實(shí)證分析研究中廣泛...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1:模態(tài)混疊效果圖??
?山東大學(xué)碩士學(xué)位論文???原始數(shù)據(jù)集X??訓(xùn)練一?弱學(xué)習(xí)器F1?.??\?an.e??殘差El??訓(xùn)練一?弱學(xué)習(xí)器F2?.?\??圖2.2:?Boosting算法原理示意圖??接下來,我們從數(shù)學(xué)形式的層面進(jìn)行說明Boosting算法原理。機(jī)器學(xué)習(xí)的??主要組成部分是模型、參數(shù)和目標(biāo)函數(shù)。應(yīng)用于Boosting算法中,我們可以把??模型理解為多個(gè)弱學(xué)習(xí)器按照一定權(quán)重的組合;參數(shù)則反映模型的具體表現(xiàn)形??式,它是在算法學(xué)習(xí)的過程中確定的,變更參數(shù)等同于變更模型;而目標(biāo)函數(shù)??是用于控制模型預(yù)測(cè)誤差與模型復(fù)雜程度的,降低目標(biāo)函數(shù)的大小是模型優(yōu)化??的作用目標(biāo)。??Boosting算法的模型可以表示成如下形式:??K??Vi?=?^2fk(xi),fk?e?F.??k=l??其中,F?==?{/(;r)?=?0^(2;)}表不弱學(xué)習(xí)器的集合。??目標(biāo)函數(shù)由誤差函數(shù)和復(fù)雜度函數(shù)兩部分相加構(gòu)成,我們可以表示成以下??形式:??Obj(y)?=?L(y)?+?n(y).??其中,⑷、L⑷和叫y)分別表示目標(biāo)函數(shù),誤差函數(shù)和復(fù)雜度函數(shù)。??我們當(dāng)然希望模型的能使預(yù)測(cè)值與真實(shí)值的損失項(xiàng)盡可能小,同時(shí)保證模??型的泛化能力。減小損失項(xiàng)可以通過最小化損失函數(shù)來實(shí)現(xiàn),而泛化能力的保??—16?—??
?山東大學(xué)碩士學(xué)位論文???第三章深證綜合指數(shù)EEMD分解??針對(duì)股票價(jià)格序列所表現(xiàn)的非線性、不平穩(wěn)性、高噪聲性特點(diǎn),本章將選??擇EEMD分解方法對(duì)深證綜合指數(shù)日收盤價(jià)序列進(jìn)行分解,重構(gòu),實(shí)現(xiàn)深證綜??合指數(shù)的特征提取工作。經(jīng)過EEMD分解重構(gòu),能夠改善股票價(jià)格序列的非平??穩(wěn)等復(fù)雜特征,同時(shí)提純不同頻率的具有現(xiàn)實(shí)經(jīng)濟(jì)意義的特征序列。??3.1數(shù)據(jù)來源與統(tǒng)計(jì)特征描述??股票指數(shù)作為描述股票市場(chǎng)總體價(jià)格水平波動(dòng)的指標(biāo),其涵蓋的股票市場(chǎng)??價(jià)格信息比單一股票更具有代表性,更能體現(xiàn)股票市場(chǎng)的宏觀發(fā)展?fàn)顩r,對(duì)各??類投資者和研究人員都更具有借鑒價(jià)值。因此本文選擇股票指數(shù)進(jìn)行研宄。??本文的研究對(duì)象是深證綜合指數(shù),數(shù)據(jù)來源于大智慧360智能股票軟件。??數(shù)據(jù)分析平臺(tái)選擇使用基于Python3.7的Jupyter?Notebook軟件。研究數(shù)據(jù)選??擇截。玻埃保改辏痹拢等罩粒玻埃保鼓辏保苍拢玻谷丈钭C綜合指數(shù)的日收盤價(jià)以及開盤??價(jià),最高價(jià)等基礎(chǔ)數(shù)據(jù)作為實(shí)驗(yàn)研宄樣本,共計(jì)487條數(shù)據(jù)。2018年1月5日??至2019年12月29日深證綜合指數(shù)的日收盤價(jià)如圖3.1所示。??:A??i:?V??i:?Vv??1200??.?,?,?.???.???圖3.1:?2018-2019年深證綜合指數(shù)日收盤價(jià)走勢(shì)圖??-21-??
【參考文獻(xiàn)】:
期刊論文
[1]Forecasting Method of Stock Market Volatility in Time Series Data Based on Mixed Model of ARIMA and XGBoost[J]. Yan Wang,Yuankai Guo. 中國(guó)通信. 2020(03)
[2]改進(jìn)的XGBoost模型在股票預(yù)測(cè)中的應(yīng)用[J]. 王燕,郭元?jiǎng)P. 計(jì)算機(jī)工程與應(yīng)用. 2019(20)
[3]皮爾森優(yōu)化結(jié)合Xgboost算法的股價(jià)預(yù)測(cè)研究[J]. 陳宇韶,唐振軍,羅揚(yáng),楊潔. 信息技術(shù). 2018(09)
[4]基于EEMD-LSTM-Adaboost的商品價(jià)格預(yù)測(cè)[J]. 邸浩,趙學(xué)軍,張自力. 統(tǒng)計(jì)與決策. 2018(13)
[5]機(jī)器學(xué)習(xí)方法在股指期貨預(yù)測(cè)中的應(yīng)用研究——基于BP神經(jīng)網(wǎng)絡(luò)、SVM和XGBoost的比較分析[J]. 黃卿,謝合亮. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2018(08)
[6]GBDT組合模型在股票預(yù)測(cè)中的應(yīng)用[J]. 張瀟,韋增欣,楊天山. 海南師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[7]股指期貨是股災(zāi)的“幕后推手”嗎——基于2015年股災(zāi)期間滬深300股指期貨高頻數(shù)據(jù)實(shí)證分析[J]. 楊林,楊雅如. 財(cái)經(jīng)理論與實(shí)踐. 2017(03)
[8]XGBoost算法在電子商務(wù)商品推薦中的應(yīng)用[J]. 張昊,紀(jì)宏超,張紅宇. 物聯(lián)網(wǎng)技術(shù). 2017(02)
[9]基于經(jīng)驗(yàn)?zāi)B(tài)分解的上證綜合指數(shù)時(shí)間序列分析[J]. 蔡赟姝,盧志明. 上海大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(04)
[10]基于EMD的時(shí)間序列不同頻率波動(dòng)及趨勢(shì)研究[J]. 史美景,曹星婉. 統(tǒng)計(jì)與決策. 2012(16)
博士論文
[1]基于EMD分解技術(shù)的不同市場(chǎng)原油價(jià)格相關(guān)性分析及預(yù)測(cè)研究[D]. 楊云飛.華中科技大學(xué) 2011
本文編號(hào):2909225
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:58 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1:模態(tài)混疊效果圖??
?山東大學(xué)碩士學(xué)位論文???原始數(shù)據(jù)集X??訓(xùn)練一?弱學(xué)習(xí)器F1?.??\?an.e??殘差El??訓(xùn)練一?弱學(xué)習(xí)器F2?.?\??圖2.2:?Boosting算法原理示意圖??接下來,我們從數(shù)學(xué)形式的層面進(jìn)行說明Boosting算法原理。機(jī)器學(xué)習(xí)的??主要組成部分是模型、參數(shù)和目標(biāo)函數(shù)。應(yīng)用于Boosting算法中,我們可以把??模型理解為多個(gè)弱學(xué)習(xí)器按照一定權(quán)重的組合;參數(shù)則反映模型的具體表現(xiàn)形??式,它是在算法學(xué)習(xí)的過程中確定的,變更參數(shù)等同于變更模型;而目標(biāo)函數(shù)??是用于控制模型預(yù)測(cè)誤差與模型復(fù)雜程度的,降低目標(biāo)函數(shù)的大小是模型優(yōu)化??的作用目標(biāo)。??Boosting算法的模型可以表示成如下形式:??K??Vi?=?^2fk(xi),fk?e?F.??k=l??其中,F?==?{/(;r)?=?0^(2;)}表不弱學(xué)習(xí)器的集合。??目標(biāo)函數(shù)由誤差函數(shù)和復(fù)雜度函數(shù)兩部分相加構(gòu)成,我們可以表示成以下??形式:??Obj(y)?=?L(y)?+?n(y).??其中,⑷、L⑷和叫y)分別表示目標(biāo)函數(shù),誤差函數(shù)和復(fù)雜度函數(shù)。??我們當(dāng)然希望模型的能使預(yù)測(cè)值與真實(shí)值的損失項(xiàng)盡可能小,同時(shí)保證模??型的泛化能力。減小損失項(xiàng)可以通過最小化損失函數(shù)來實(shí)現(xiàn),而泛化能力的保??—16?—??
?山東大學(xué)碩士學(xué)位論文???第三章深證綜合指數(shù)EEMD分解??針對(duì)股票價(jià)格序列所表現(xiàn)的非線性、不平穩(wěn)性、高噪聲性特點(diǎn),本章將選??擇EEMD分解方法對(duì)深證綜合指數(shù)日收盤價(jià)序列進(jìn)行分解,重構(gòu),實(shí)現(xiàn)深證綜??合指數(shù)的特征提取工作。經(jīng)過EEMD分解重構(gòu),能夠改善股票價(jià)格序列的非平??穩(wěn)等復(fù)雜特征,同時(shí)提純不同頻率的具有現(xiàn)實(shí)經(jīng)濟(jì)意義的特征序列。??3.1數(shù)據(jù)來源與統(tǒng)計(jì)特征描述??股票指數(shù)作為描述股票市場(chǎng)總體價(jià)格水平波動(dòng)的指標(biāo),其涵蓋的股票市場(chǎng)??價(jià)格信息比單一股票更具有代表性,更能體現(xiàn)股票市場(chǎng)的宏觀發(fā)展?fàn)顩r,對(duì)各??類投資者和研究人員都更具有借鑒價(jià)值。因此本文選擇股票指數(shù)進(jìn)行研宄。??本文的研究對(duì)象是深證綜合指數(shù),數(shù)據(jù)來源于大智慧360智能股票軟件。??數(shù)據(jù)分析平臺(tái)選擇使用基于Python3.7的Jupyter?Notebook軟件。研究數(shù)據(jù)選??擇截。玻埃保改辏痹拢等罩粒玻埃保鼓辏保苍拢玻谷丈钭C綜合指數(shù)的日收盤價(jià)以及開盤??價(jià),最高價(jià)等基礎(chǔ)數(shù)據(jù)作為實(shí)驗(yàn)研宄樣本,共計(jì)487條數(shù)據(jù)。2018年1月5日??至2019年12月29日深證綜合指數(shù)的日收盤價(jià)如圖3.1所示。??:A??i:?V??i:?Vv??1200??.?,?,?.???.???圖3.1:?2018-2019年深證綜合指數(shù)日收盤價(jià)走勢(shì)圖??-21-??
【參考文獻(xiàn)】:
期刊論文
[1]Forecasting Method of Stock Market Volatility in Time Series Data Based on Mixed Model of ARIMA and XGBoost[J]. Yan Wang,Yuankai Guo. 中國(guó)通信. 2020(03)
[2]改進(jìn)的XGBoost模型在股票預(yù)測(cè)中的應(yīng)用[J]. 王燕,郭元?jiǎng)P. 計(jì)算機(jī)工程與應(yīng)用. 2019(20)
[3]皮爾森優(yōu)化結(jié)合Xgboost算法的股價(jià)預(yù)測(cè)研究[J]. 陳宇韶,唐振軍,羅揚(yáng),楊潔. 信息技術(shù). 2018(09)
[4]基于EEMD-LSTM-Adaboost的商品價(jià)格預(yù)測(cè)[J]. 邸浩,趙學(xué)軍,張自力. 統(tǒng)計(jì)與決策. 2018(13)
[5]機(jī)器學(xué)習(xí)方法在股指期貨預(yù)測(cè)中的應(yīng)用研究——基于BP神經(jīng)網(wǎng)絡(luò)、SVM和XGBoost的比較分析[J]. 黃卿,謝合亮. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2018(08)
[6]GBDT組合模型在股票預(yù)測(cè)中的應(yīng)用[J]. 張瀟,韋增欣,楊天山. 海南師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(01)
[7]股指期貨是股災(zāi)的“幕后推手”嗎——基于2015年股災(zāi)期間滬深300股指期貨高頻數(shù)據(jù)實(shí)證分析[J]. 楊林,楊雅如. 財(cái)經(jīng)理論與實(shí)踐. 2017(03)
[8]XGBoost算法在電子商務(wù)商品推薦中的應(yīng)用[J]. 張昊,紀(jì)宏超,張紅宇. 物聯(lián)網(wǎng)技術(shù). 2017(02)
[9]基于經(jīng)驗(yàn)?zāi)B(tài)分解的上證綜合指數(shù)時(shí)間序列分析[J]. 蔡赟姝,盧志明. 上海大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(04)
[10]基于EMD的時(shí)間序列不同頻率波動(dòng)及趨勢(shì)研究[J]. 史美景,曹星婉. 統(tǒng)計(jì)與決策. 2012(16)
博士論文
[1]基于EMD分解技術(shù)的不同市場(chǎng)原油價(jià)格相關(guān)性分析及預(yù)測(cè)研究[D]. 楊云飛.華中科技大學(xué) 2011
本文編號(hào):2909225
本文鏈接:http://sikaile.net/guanlilunwen/huobilw/2909225.html
最近更新
教材專著