基于核主成分分析和支持向量回歸對(duì)每日和每分鐘股票價(jià)格的預(yù)測(cè)
發(fā)布時(shí)間:2022-01-09 18:17
隨著改革開(kāi)放的發(fā)展,中國(guó)的股票市場(chǎng)逐漸被世界主要經(jīng)濟(jì)體認(rèn)可,國(guó)內(nèi)股市吸引了越來(lái)越多的境外投資者。股票價(jià)格預(yù)測(cè)系統(tǒng)的目的是為金融市場(chǎng)的經(jīng)營(yíng)者提供異常收益,并成為風(fēng)險(xiǎn)管理工具的基礎(chǔ)。大數(shù)據(jù)時(shí)代的來(lái)臨,計(jì)算機(jī)信息技術(shù)和金融工程聯(lián)系日益密切,在股票交易機(jī)制的發(fā)展中,使用機(jī)器學(xué)習(xí)算法的計(jì)算密集型系統(tǒng)越來(lái)越普遍。國(guó)內(nèi)外許多學(xué)者運(yùn)用統(tǒng)計(jì)學(xué)習(xí)方法,在科學(xué)理論的支撐下建立股票價(jià)格預(yù)測(cè)模型,并且已經(jīng)應(yīng)用于股市的價(jià)格和漲跌趨勢(shì)預(yù)測(cè)。本文在支持向量回歸(SVR)的基礎(chǔ)上,引入非線性技術(shù)的降維方法組合成集成學(xué)習(xí)模型,對(duì)中國(guó)股市指數(shù)進(jìn)行預(yù)測(cè),該課題具有一定的研究意義和應(yīng)用前景。本文以上海證券交易所的股指數(shù)作為課題研究對(duì)象,把SVR模型理論應(yīng)用在股票市場(chǎng)不同頻率價(jià)格的預(yù)測(cè)。首先,基于股票價(jià)格預(yù)測(cè)問(wèn)題選取每日數(shù)據(jù)和每分鐘數(shù)據(jù)進(jìn)行模型參數(shù)選擇,構(gòu)建了非線性的支持向量回歸預(yù)測(cè)模型,并對(duì)轉(zhuǎn)換后的收盤(pán)價(jià)格進(jìn)行預(yù)測(cè)。在訓(xùn)練模型之前,根據(jù)國(guó)內(nèi)外研究文獻(xiàn),選取合適的TA技術(shù)指標(biāo)作為模型輸入變量。考慮到不同的數(shù)據(jù)特征變量組合在模型預(yù)測(cè)時(shí)會(huì)表現(xiàn)出不同的預(yù)測(cè)結(jié)果,為了進(jìn)一步防止特征變量陷入“高維詛咒”的陷阱,引入非線性技術(shù)的核主成分分析...
【文章來(lái)源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
線性數(shù)據(jù)和非線性數(shù)據(jù)的區(qū)別
蘭州大學(xué)碩士學(xué)術(shù)論文基于核主成分分析和支持向量回歸對(duì)每日和每分鐘股票價(jià)格的預(yù)測(cè)23指數(shù)移動(dòng)平均線通過(guò)對(duì)近期價(jià)格添加更大的權(quán)重來(lái)減少滯后,這個(gè)權(quán)重取決于移動(dòng)平均線的周期數(shù)(N)。通過(guò)以上特征指標(biāo)的討論,我們給出確定的數(shù)據(jù)集S,包括輸入變量和輸出變量?jī)蓚(gè)部分。=111111,11,21,3…1,222222,12,22,32,3,1,2,3…,12其中在上述矩陣S中,N代表樣本容量,M代表指標(biāo)個(gè)數(shù),數(shù)據(jù)集S的部分具體值如圖3.1所示。圖3.1每日股票數(shù)據(jù)部分樣本展示3.4股票數(shù)據(jù)集的標(biāo)準(zhǔn)化股票數(shù)據(jù)的時(shí)序性和復(fù)雜性讓它的真實(shí)數(shù)據(jù)集出現(xiàn)很多離群值,對(duì)于一個(gè)m維的樣本來(lái)說(shuō),取值范圍不同產(chǎn)生了不同的分量,大數(shù)量個(gè)數(shù)的樣本分量對(duì)模型產(chǎn)生相對(duì)較大的影響,而小分量對(duì)模型的影響因素普遍較小,小數(shù)就會(huì)被大數(shù)所“淹沒(méi)”,進(jìn)而失去了存在意義,嚴(yán)重時(shí)會(huì)導(dǎo)致信息丟失;另一方面在模型輸入過(guò)程中,個(gè)別數(shù)據(jù)值因?yàn)檫^(guò)大或過(guò)小,會(huì)導(dǎo)致計(jì)算后的數(shù)據(jù)因?yàn)樵浇鐝亩バ畔。通常我們(cè)诮鉀Q大小值問(wèn)題會(huì)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,常用的有“歸一化”、“統(tǒng)計(jì)標(biāo)準(zhǔn)化”、“對(duì)數(shù)標(biāo)準(zhǔn)化”等。經(jīng)過(guò)標(biāo)準(zhǔn)化處理后可以將原數(shù)據(jù)集轉(zhuǎn)換到統(tǒng)一區(qū)間,讓各個(gè)指標(biāo)值處以同一量級(jí)別上。在本研究中選取歸一化標(biāo)準(zhǔn)化處理[52],就是最大最小標(biāo)準(zhǔn)化方法,它是通過(guò)把搜集的數(shù)據(jù)進(jìn)行最大最小值線性變化,將數(shù)據(jù)映射到區(qū)間[1,1]中,有公式(49)給出具體表達(dá)式:′=2()1,(49)其中x表示原數(shù)據(jù)值,′表示標(biāo)準(zhǔn)化后的值。
蘭州大學(xué)碩士學(xué)術(shù)論文基于核主成分分析和支持向量回歸對(duì)每日和每分鐘股票價(jià)格的預(yù)測(cè)26優(yōu)參數(shù)組合(,′,,,),共有6144種組合需要測(cè)試。表4.1的內(nèi)容是KPCA-SVR模型參數(shù)優(yōu)化的算法過(guò)程,圖4.2表示的是參數(shù)組合優(yōu)化的具體過(guò)程,其中=1,2,,。表4.1KPCA-SVR模型優(yōu)化參數(shù)算法輸入:股票數(shù)據(jù)集輸出:最優(yōu)參數(shù)組(,′,,,)執(zhí)行:⒈股票數(shù)據(jù)集預(yù)處理:篩癬歸一化、劃分訓(xùn)練集和測(cè)試集,生成新的數(shù)據(jù)集和;⒉定義參數(shù)組:引入核主成分KPCA參數(shù)(,′),非線性支持向量回歸SVR參數(shù)(,,),其中n的個(gè)數(shù)為K,其余參數(shù)取值個(gè)數(shù)是T;⒊生成=××××種參數(shù)組組合;⒋在訓(xùn)練集上把M組參數(shù)組帶入KPCA-SVR模型在網(wǎng)格搜索的基礎(chǔ)上進(jìn)行10折交叉驗(yàn)證訓(xùn)練;⒌生成(1,2,3,,);⒍輸出最小N對(duì)應(yīng)參數(shù)組(,′,,,)。圖4.2參數(shù)優(yōu)化過(guò)程4.3模型的評(píng)價(jià)指標(biāo)不管何種模型對(duì)股票的預(yù)測(cè)總會(huì)出現(xiàn)誤差,預(yù)測(cè)值并不是實(shí)際值,預(yù)測(cè)值與真實(shí)值之間的誤差大小就是評(píng)價(jià)預(yù)測(cè)方法有效與否的決定性指標(biāo),預(yù)測(cè)值越接近真實(shí)值,預(yù)測(cè)方法效果越好。為了評(píng)估模型預(yù)測(cè)的優(yōu)劣性,提出以均方誤差(MSE)、均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)用于評(píng)估模型方法的性能,其中采用十折交叉驗(yàn)證的均方誤差(MSE)值來(lái)評(píng)估模型的參數(shù)誤差,而均方根誤差
【參考文獻(xiàn)】:
期刊論文
[1]金融發(fā)展、政府作用與經(jīng)濟(jì)增長(zhǎng)——基于經(jīng)濟(jì)水平的視角[J]. 潘林偉,吳婭玲. 金融與經(jīng)濟(jì). 2017(08)
[2]多重馬氏鏈模型在股市預(yù)測(cè)中的應(yīng)用[J]. 費(fèi)時(shí)龍,任洪光. 德州學(xué)院學(xué)報(bào). 2016(04)
[3]論我國(guó)證券市場(chǎng)發(fā)展的現(xiàn)狀、問(wèn)題及對(duì)策[J]. 楊榮蕾. 環(huán)球市場(chǎng)信息導(dǎo)報(bào). 2016(26)
[4]基于SVR的股市預(yù)測(cè)與擇時(shí)研究[J]. 張鵬. 重慶文理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版). 2016(02)
[5]基于C4.5決策樹(shù)的股票數(shù)據(jù)挖掘[J]. 王領(lǐng),胡揚(yáng). 計(jì)算機(jī)與現(xiàn)代化. 2015(10)
[6]引入趨勢(shì)因子的BP模型在股市預(yù)測(cè)中應(yīng)用[J]. 孫海波,王麗敏,韓旭明. 統(tǒng)計(jì)與決策. 2015(19)
[7]基于誤差校正的GARCH股票價(jià)格預(yù)測(cè)模型[J]. 于志軍,楊善林. 中國(guó)管理科學(xué). 2013(S1)
[8]時(shí)間序列模型和神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測(cè)中的分析[J]. 劉海玥,白艷萍. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2011(04)
[9]ARMA模型參數(shù)估計(jì)算法改進(jìn)及在股票預(yù)測(cè)中的應(yīng)用[J]. 何永沛. 重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版). 2009(02)
[10]社會(huì)主義市場(chǎng)經(jīng)濟(jì)與股票市場(chǎng)[J]. 溫桂芳. 財(cái)經(jīng)問(wèn)題研究. 1993(04)
博士論文
[1]基于支持向量機(jī)的金融時(shí)間序列分析預(yù)測(cè)算法研究[D]. 鮑漪瀾.大連海事大學(xué) 2013
碩士論文
[1]基于支持向量回歸機(jī)模型的價(jià)格預(yù)測(cè)[D]. 馬雪姣.鄭州大學(xué) 2018
[2]基于BP神經(jīng)網(wǎng)絡(luò)和GARCH模型的中國(guó)銀行股票價(jià)格預(yù)測(cè)實(shí)證分析[D]. 林楠.蘭州大學(xué) 2014
[3]基于支持向量機(jī)的股市預(yù)測(cè)研究[D]. 金得寶.浙江大學(xué) 2010
本文編號(hào):3579210
【文章來(lái)源】:蘭州大學(xué)甘肅省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
線性數(shù)據(jù)和非線性數(shù)據(jù)的區(qū)別
蘭州大學(xué)碩士學(xué)術(shù)論文基于核主成分分析和支持向量回歸對(duì)每日和每分鐘股票價(jià)格的預(yù)測(cè)23指數(shù)移動(dòng)平均線通過(guò)對(duì)近期價(jià)格添加更大的權(quán)重來(lái)減少滯后,這個(gè)權(quán)重取決于移動(dòng)平均線的周期數(shù)(N)。通過(guò)以上特征指標(biāo)的討論,我們給出確定的數(shù)據(jù)集S,包括輸入變量和輸出變量?jī)蓚(gè)部分。=111111,11,21,3…1,222222,12,22,32,3,1,2,3…,12其中在上述矩陣S中,N代表樣本容量,M代表指標(biāo)個(gè)數(shù),數(shù)據(jù)集S的部分具體值如圖3.1所示。圖3.1每日股票數(shù)據(jù)部分樣本展示3.4股票數(shù)據(jù)集的標(biāo)準(zhǔn)化股票數(shù)據(jù)的時(shí)序性和復(fù)雜性讓它的真實(shí)數(shù)據(jù)集出現(xiàn)很多離群值,對(duì)于一個(gè)m維的樣本來(lái)說(shuō),取值范圍不同產(chǎn)生了不同的分量,大數(shù)量個(gè)數(shù)的樣本分量對(duì)模型產(chǎn)生相對(duì)較大的影響,而小分量對(duì)模型的影響因素普遍較小,小數(shù)就會(huì)被大數(shù)所“淹沒(méi)”,進(jìn)而失去了存在意義,嚴(yán)重時(shí)會(huì)導(dǎo)致信息丟失;另一方面在模型輸入過(guò)程中,個(gè)別數(shù)據(jù)值因?yàn)檫^(guò)大或過(guò)小,會(huì)導(dǎo)致計(jì)算后的數(shù)據(jù)因?yàn)樵浇鐝亩バ畔。通常我們(cè)诮鉀Q大小值問(wèn)題會(huì)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,常用的有“歸一化”、“統(tǒng)計(jì)標(biāo)準(zhǔn)化”、“對(duì)數(shù)標(biāo)準(zhǔn)化”等。經(jīng)過(guò)標(biāo)準(zhǔn)化處理后可以將原數(shù)據(jù)集轉(zhuǎn)換到統(tǒng)一區(qū)間,讓各個(gè)指標(biāo)值處以同一量級(jí)別上。在本研究中選取歸一化標(biāo)準(zhǔn)化處理[52],就是最大最小標(biāo)準(zhǔn)化方法,它是通過(guò)把搜集的數(shù)據(jù)進(jìn)行最大最小值線性變化,將數(shù)據(jù)映射到區(qū)間[1,1]中,有公式(49)給出具體表達(dá)式:′=2()1,(49)其中x表示原數(shù)據(jù)值,′表示標(biāo)準(zhǔn)化后的值。
蘭州大學(xué)碩士學(xué)術(shù)論文基于核主成分分析和支持向量回歸對(duì)每日和每分鐘股票價(jià)格的預(yù)測(cè)26優(yōu)參數(shù)組合(,′,,,),共有6144種組合需要測(cè)試。表4.1的內(nèi)容是KPCA-SVR模型參數(shù)優(yōu)化的算法過(guò)程,圖4.2表示的是參數(shù)組合優(yōu)化的具體過(guò)程,其中=1,2,,。表4.1KPCA-SVR模型優(yōu)化參數(shù)算法輸入:股票數(shù)據(jù)集輸出:最優(yōu)參數(shù)組(,′,,,)執(zhí)行:⒈股票數(shù)據(jù)集預(yù)處理:篩癬歸一化、劃分訓(xùn)練集和測(cè)試集,生成新的數(shù)據(jù)集和;⒉定義參數(shù)組:引入核主成分KPCA參數(shù)(,′),非線性支持向量回歸SVR參數(shù)(,,),其中n的個(gè)數(shù)為K,其余參數(shù)取值個(gè)數(shù)是T;⒊生成=××××種參數(shù)組組合;⒋在訓(xùn)練集上把M組參數(shù)組帶入KPCA-SVR模型在網(wǎng)格搜索的基礎(chǔ)上進(jìn)行10折交叉驗(yàn)證訓(xùn)練;⒌生成(1,2,3,,);⒍輸出最小N對(duì)應(yīng)參數(shù)組(,′,,,)。圖4.2參數(shù)優(yōu)化過(guò)程4.3模型的評(píng)價(jià)指標(biāo)不管何種模型對(duì)股票的預(yù)測(cè)總會(huì)出現(xiàn)誤差,預(yù)測(cè)值并不是實(shí)際值,預(yù)測(cè)值與真實(shí)值之間的誤差大小就是評(píng)價(jià)預(yù)測(cè)方法有效與否的決定性指標(biāo),預(yù)測(cè)值越接近真實(shí)值,預(yù)測(cè)方法效果越好。為了評(píng)估模型預(yù)測(cè)的優(yōu)劣性,提出以均方誤差(MSE)、均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)用于評(píng)估模型方法的性能,其中采用十折交叉驗(yàn)證的均方誤差(MSE)值來(lái)評(píng)估模型的參數(shù)誤差,而均方根誤差
【參考文獻(xiàn)】:
期刊論文
[1]金融發(fā)展、政府作用與經(jīng)濟(jì)增長(zhǎng)——基于經(jīng)濟(jì)水平的視角[J]. 潘林偉,吳婭玲. 金融與經(jīng)濟(jì). 2017(08)
[2]多重馬氏鏈模型在股市預(yù)測(cè)中的應(yīng)用[J]. 費(fèi)時(shí)龍,任洪光. 德州學(xué)院學(xué)報(bào). 2016(04)
[3]論我國(guó)證券市場(chǎng)發(fā)展的現(xiàn)狀、問(wèn)題及對(duì)策[J]. 楊榮蕾. 環(huán)球市場(chǎng)信息導(dǎo)報(bào). 2016(26)
[4]基于SVR的股市預(yù)測(cè)與擇時(shí)研究[J]. 張鵬. 重慶文理學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版). 2016(02)
[5]基于C4.5決策樹(shù)的股票數(shù)據(jù)挖掘[J]. 王領(lǐng),胡揚(yáng). 計(jì)算機(jī)與現(xiàn)代化. 2015(10)
[6]引入趨勢(shì)因子的BP模型在股市預(yù)測(cè)中應(yīng)用[J]. 孫海波,王麗敏,韓旭明. 統(tǒng)計(jì)與決策. 2015(19)
[7]基于誤差校正的GARCH股票價(jià)格預(yù)測(cè)模型[J]. 于志軍,楊善林. 中國(guó)管理科學(xué). 2013(S1)
[8]時(shí)間序列模型和神經(jīng)網(wǎng)絡(luò)模型在股票預(yù)測(cè)中的分析[J]. 劉海玥,白艷萍. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2011(04)
[9]ARMA模型參數(shù)估計(jì)算法改進(jìn)及在股票預(yù)測(cè)中的應(yīng)用[J]. 何永沛. 重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版). 2009(02)
[10]社會(huì)主義市場(chǎng)經(jīng)濟(jì)與股票市場(chǎng)[J]. 溫桂芳. 財(cái)經(jīng)問(wèn)題研究. 1993(04)
博士論文
[1]基于支持向量機(jī)的金融時(shí)間序列分析預(yù)測(cè)算法研究[D]. 鮑漪瀾.大連海事大學(xué) 2013
碩士論文
[1]基于支持向量回歸機(jī)模型的價(jià)格預(yù)測(cè)[D]. 馬雪姣.鄭州大學(xué) 2018
[2]基于BP神經(jīng)網(wǎng)絡(luò)和GARCH模型的中國(guó)銀行股票價(jià)格預(yù)測(cè)實(shí)證分析[D]. 林楠.蘭州大學(xué) 2014
[3]基于支持向量機(jī)的股市預(yù)測(cè)研究[D]. 金得寶.浙江大學(xué) 2010
本文編號(hào):3579210
本文鏈接:http://sikaile.net/guanlilunwen/bankxd/3579210.html
最近更新
教材專著