基于支持向量機(jī)和K近鄰算法的股票價(jià)格預(yù)測(cè)
發(fā)布時(shí)間:2022-01-22 04:18
本文利用支持向量機(jī)(support vector machine,SVM)和K近鄰(K-nearest neighbor,KNN)相結(jié)合的算法研究證券價(jià)格的預(yù)測(cè)問(wèn)題。這里選取兩種途徑研究,首先基于技術(shù)分析建立預(yù)測(cè)模型,選取證券的交易數(shù)據(jù)和技術(shù)指標(biāo),包括收盤(pán)價(jià)、成交量、最高價(jià)、移動(dòng)平均(MA)等,利用支持向量機(jī)對(duì)其進(jìn)行漲跌趨勢(shì)預(yù)測(cè),根據(jù)漲跌趨勢(shì)結(jié)合K近鄰算法對(duì)股票1天,7天和30天的收盤(pán)價(jià)、開(kāi)盤(pán)價(jià)、最高價(jià)和最低價(jià)進(jìn)行預(yù)測(cè)并構(gòu)造價(jià)格預(yù)測(cè)區(qū)間,得出技術(shù)分析預(yù)測(cè)模型的平均絕對(duì)誤差(MAE)為0.043,均方根誤差(RMSE)為0.05。特別的是,建立技術(shù)分析模型后,選取20家股票公司根據(jù)價(jià)格區(qū)間和收盤(pán)價(jià)設(shè)定兩種不同的投資策略,進(jìn)行為期一個(gè)月的模擬投資得到收益0.06和0.09;其次基于財(cái)務(wù)數(shù)據(jù)建立綜合預(yù)測(cè)模型,選取十家公司的交易數(shù)據(jù)和財(cái)務(wù)指標(biāo),包括收盤(pán)價(jià)、成交量、凈資產(chǎn)收益、利潤(rùn)和每股收益率等,利用支持向量機(jī)對(duì)其進(jìn)行漲跌趨勢(shì)進(jìn)行預(yù)測(cè),根據(jù)漲跌趨勢(shì)結(jié)合K近鄰算法預(yù)測(cè)收盤(pán)價(jià),得出綜合分析預(yù)測(cè)模型的平均絕對(duì)誤差的平均值為0.16,均方根誤差為0.21。同樣,綜合分析中選取10家股票公司根據(jù)預(yù)測(cè)的漲跌...
【文章來(lái)源】:鄭州大學(xué)河南省 211工程院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
推導(dǎo)流程
第一章預(yù)備知識(shí)圖1推導(dǎo)流程定義1.3.1(線性可分)一般情況下的分類學(xué)習(xí)是可以根據(jù)訓(xùn)練樣本D從而在樣本空間計(jì)算得出一個(gè)相對(duì)合適的劃分超平面,這樣做可以將不同類別的樣本集分開(kāi)。如圖二所示圖2線性可分直觀看上去,能將訓(xùn)練樣本分開(kāi)的劃分超平面有很多,但我們所要尋找的最優(yōu)的超平面是與兩類不同類別的訓(xùn)練樣本距離相等的分類超平面,即圖三中黑色的線條,最優(yōu)的劃分超平面對(duì)局部擾動(dòng)的“容忍”性最好,因此其分類的準(zhǔn)確率最高。其他的超平面在對(duì)距離離得比較近的樣本點(diǎn)分類時(shí)易出現(xiàn)錯(cuò)誤。而紅色超平面的影響最小,也就是11
第一章預(yù)備知識(shí)圖3支持向量和間隔關(guān)于間隔的計(jì)算:由:1(WTX+b=1)yi=+11(WTX+b=1)yi=1(1.7)推出:WTX+=1bWTX=1b(1.8)故有:γ=(x+x)WT||W||=1b+1+b||W||=2||W||(1.9)這里,正負(fù)樣本之間的間隔已經(jīng)計(jì)算出來(lái),通過(guò)計(jì)算最大的間隔,便可以找到最優(yōu)超平面:maxw,b2||W||s.t.yi(WTxi+b)≥+1(1.10)為了使得2||W||最大化,我們選擇將||W||最小化,并且為了減少計(jì)算量,可以根據(jù)(1.11)進(jìn)行轉(zhuǎn)化:minw,b12||W||2s.t.yi(WTxi+b)≥+1(1.11)由公式表達(dá)可知我們將其變?yōu)榱送苟我?guī)劃的問(wèn)題,選擇拉格朗日乘子法對(duì)凸二次規(guī)劃的對(duì)偶問(wèn)題求解。L(w,b,α)=12||W||2+m∑i=1αi(1yi(WTxi+b))(1.12)13
【參考文獻(xiàn)】:
期刊論文
[1]中國(guó)上市公司股票價(jià)格與財(cái)務(wù)指標(biāo)相關(guān)性實(shí)證分析[J]. 梅世強(qiáng),王天陽(yáng). 大連海事大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2014(06)
[2]基于支持向量機(jī)的股票投資價(jià)值分類模型研究[J]. 李云飛,惠曉峰. 中國(guó)軟科學(xué). 2008(01)
[3]基于人工神經(jīng)網(wǎng)絡(luò)方法的上市公司股價(jià)預(yù)測(cè)[J]. 楊成,程曉玲,殷旅江. 統(tǒng)計(jì)與決策. 2005(24)
[4]利用財(cái)務(wù)指標(biāo)預(yù)測(cè)股票價(jià)格及財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警[J]. 國(guó)琳,楊寶臣. 科學(xué)技術(shù)與工程. 2005(23)
[5]財(cái)務(wù)分析師盈利預(yù)測(cè)的投資價(jià)值:來(lái)自深滬A股市場(chǎng)的證據(jù)[J]. 吳東輝,薛祖云. 會(huì)計(jì)研究. 2005(08)
[6]SVM-KNN分類器——一種提高SVM分類精度的新方法[J]. 李蓉,葉世偉,史忠植. 電子學(xué)報(bào). 2002(05)
[7]凈資產(chǎn)倍率、市盈率與公司的成長(zhǎng)性——來(lái)自中國(guó)股市的經(jīng)驗(yàn)證據(jù)[J]. 宋劍峰. 經(jīng)濟(jì)研究. 2000(08)
碩士論文
[1]基于Piotroski方法和ARIMA-SVR模型的股票投資策略研究[D]. 余天倫.華南理工大學(xué) 2016
本文編號(hào):3601536
【文章來(lái)源】:鄭州大學(xué)河南省 211工程院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
推導(dǎo)流程
第一章預(yù)備知識(shí)圖1推導(dǎo)流程定義1.3.1(線性可分)一般情況下的分類學(xué)習(xí)是可以根據(jù)訓(xùn)練樣本D從而在樣本空間計(jì)算得出一個(gè)相對(duì)合適的劃分超平面,這樣做可以將不同類別的樣本集分開(kāi)。如圖二所示圖2線性可分直觀看上去,能將訓(xùn)練樣本分開(kāi)的劃分超平面有很多,但我們所要尋找的最優(yōu)的超平面是與兩類不同類別的訓(xùn)練樣本距離相等的分類超平面,即圖三中黑色的線條,最優(yōu)的劃分超平面對(duì)局部擾動(dòng)的“容忍”性最好,因此其分類的準(zhǔn)確率最高。其他的超平面在對(duì)距離離得比較近的樣本點(diǎn)分類時(shí)易出現(xiàn)錯(cuò)誤。而紅色超平面的影響最小,也就是11
第一章預(yù)備知識(shí)圖3支持向量和間隔關(guān)于間隔的計(jì)算:由:1(WTX+b=1)yi=+11(WTX+b=1)yi=1(1.7)推出:WTX+=1bWTX=1b(1.8)故有:γ=(x+x)WT||W||=1b+1+b||W||=2||W||(1.9)這里,正負(fù)樣本之間的間隔已經(jīng)計(jì)算出來(lái),通過(guò)計(jì)算最大的間隔,便可以找到最優(yōu)超平面:maxw,b2||W||s.t.yi(WTxi+b)≥+1(1.10)為了使得2||W||最大化,我們選擇將||W||最小化,并且為了減少計(jì)算量,可以根據(jù)(1.11)進(jìn)行轉(zhuǎn)化:minw,b12||W||2s.t.yi(WTxi+b)≥+1(1.11)由公式表達(dá)可知我們將其變?yōu)榱送苟我?guī)劃的問(wèn)題,選擇拉格朗日乘子法對(duì)凸二次規(guī)劃的對(duì)偶問(wèn)題求解。L(w,b,α)=12||W||2+m∑i=1αi(1yi(WTxi+b))(1.12)13
【參考文獻(xiàn)】:
期刊論文
[1]中國(guó)上市公司股票價(jià)格與財(cái)務(wù)指標(biāo)相關(guān)性實(shí)證分析[J]. 梅世強(qiáng),王天陽(yáng). 大連海事大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2014(06)
[2]基于支持向量機(jī)的股票投資價(jià)值分類模型研究[J]. 李云飛,惠曉峰. 中國(guó)軟科學(xué). 2008(01)
[3]基于人工神經(jīng)網(wǎng)絡(luò)方法的上市公司股價(jià)預(yù)測(cè)[J]. 楊成,程曉玲,殷旅江. 統(tǒng)計(jì)與決策. 2005(24)
[4]利用財(cái)務(wù)指標(biāo)預(yù)測(cè)股票價(jià)格及財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警[J]. 國(guó)琳,楊寶臣. 科學(xué)技術(shù)與工程. 2005(23)
[5]財(cái)務(wù)分析師盈利預(yù)測(cè)的投資價(jià)值:來(lái)自深滬A股市場(chǎng)的證據(jù)[J]. 吳東輝,薛祖云. 會(huì)計(jì)研究. 2005(08)
[6]SVM-KNN分類器——一種提高SVM分類精度的新方法[J]. 李蓉,葉世偉,史忠植. 電子學(xué)報(bào). 2002(05)
[7]凈資產(chǎn)倍率、市盈率與公司的成長(zhǎng)性——來(lái)自中國(guó)股市的經(jīng)驗(yàn)證據(jù)[J]. 宋劍峰. 經(jīng)濟(jì)研究. 2000(08)
碩士論文
[1]基于Piotroski方法和ARIMA-SVR模型的股票投資策略研究[D]. 余天倫.華南理工大學(xué) 2016
本文編號(hào):3601536
本文鏈接:http://sikaile.net/kejilunwen/yysx/3601536.html
最近更新
教材專著