基于金融文本情感的股票波動(dòng)預(yù)測(cè)
發(fā)布時(shí)間:2020-12-06 10:16
股票市場(chǎng)的情緒可以在一定程度上反映投資者的行為并影響其投資決策。市場(chǎng)新聞作為一種非結(jié)構(gòu)性數(shù)據(jù),能夠體現(xiàn)并引導(dǎo)市場(chǎng)的大環(huán)境情緒,與股票價(jià)格一同成為至關(guān)重要的市場(chǎng)參考數(shù)據(jù),能夠?yàn)橥顿Y者的投資決策提供有效幫助。文中提出了一種可以準(zhǔn)確、快速地建立針對(duì)海量新聞數(shù)據(jù)的多維情緒特征向量化方法,利用支持向量機(jī)(Support Victor Machine,SVM)模型來(lái)預(yù)測(cè)金融新聞對(duì)股票市場(chǎng)的影響,并通過(guò)bootstrap來(lái)減輕過(guò)擬合問(wèn)題。在滬深股指上進(jìn)行實(shí)驗(yàn)的結(jié)果表明,相比于傳統(tǒng)模型,所提方法能夠?qū)㈩A(yù)測(cè)準(zhǔn)確度提高約8%,并在3個(gè)月的回測(cè)實(shí)驗(yàn)中獲得了6.52%的超額收益,證明了其有效性。
【文章來(lái)源】:計(jì)算機(jī)科學(xué). 2020年05期 第79-83頁(yè) 北大核心
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
不同懲罰因子C對(duì)預(yù)測(cè)準(zhǔn)確率的影響(消極預(yù)測(cè))
同樣地,特征詞數(shù)量會(huì)影響預(yù)測(cè)的準(zhǔn)確率以及模型訓(xùn)練速度,過(guò)多的特征詞會(huì)影響模型訓(xùn)練以及分類(lèi)的速度,并增加數(shù)據(jù)的噪聲;過(guò)少的特征詞會(huì)降低分類(lèi)準(zhǔn)確度。圖4、圖5顯示了不同數(shù)量的特征詞對(duì)預(yù)測(cè)結(jié)果的影響。圖5 不同特征詞數(shù)量下預(yù)測(cè)精度的比較(消極)
圖4 不同特征詞數(shù)量下預(yù)測(cè)精度的比較(積極)可以看到,特征詞數(shù)量在100~400時(shí)預(yù)測(cè)精度不斷增加,在400~800時(shí)預(yù)測(cè)精度并沒(méi)有顯著增長(zhǎng),并且隨著特征詞數(shù)量的增加,模型的訓(xùn)練時(shí)間以及對(duì)驗(yàn)證文本的處理時(shí)間顯著增加。因此,結(jié)合訓(xùn)練結(jié)果的準(zhǔn)確率和模型訓(xùn)練速度,本文將特征詞數(shù)量定為600,超參C的值為10。
【參考文獻(xiàn)】:
期刊論文
[1]基于詞頻統(tǒng)計(jì)規(guī)律的文本數(shù)據(jù)預(yù)處理方法[J]. 池云仙,趙書(shū)良,羅燕,高琳,趙駿鵬,李超. 計(jì)算機(jī)科學(xué). 2017(10)
[2]基于SVM的主題爬蟲(chóng)技術(shù)研究[J]. 李璐,張國(guó)印,李正文. 計(jì)算機(jī)科學(xué). 2015(02)
本文編號(hào):2901209
【文章來(lái)源】:計(jì)算機(jī)科學(xué). 2020年05期 第79-83頁(yè) 北大核心
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
不同懲罰因子C對(duì)預(yù)測(cè)準(zhǔn)確率的影響(消極預(yù)測(cè))
同樣地,特征詞數(shù)量會(huì)影響預(yù)測(cè)的準(zhǔn)確率以及模型訓(xùn)練速度,過(guò)多的特征詞會(huì)影響模型訓(xùn)練以及分類(lèi)的速度,并增加數(shù)據(jù)的噪聲;過(guò)少的特征詞會(huì)降低分類(lèi)準(zhǔn)確度。圖4、圖5顯示了不同數(shù)量的特征詞對(duì)預(yù)測(cè)結(jié)果的影響。圖5 不同特征詞數(shù)量下預(yù)測(cè)精度的比較(消極)
圖4 不同特征詞數(shù)量下預(yù)測(cè)精度的比較(積極)可以看到,特征詞數(shù)量在100~400時(shí)預(yù)測(cè)精度不斷增加,在400~800時(shí)預(yù)測(cè)精度并沒(méi)有顯著增長(zhǎng),并且隨著特征詞數(shù)量的增加,模型的訓(xùn)練時(shí)間以及對(duì)驗(yàn)證文本的處理時(shí)間顯著增加。因此,結(jié)合訓(xùn)練結(jié)果的準(zhǔn)確率和模型訓(xùn)練速度,本文將特征詞數(shù)量定為600,超參C的值為10。
【參考文獻(xiàn)】:
期刊論文
[1]基于詞頻統(tǒng)計(jì)規(guī)律的文本數(shù)據(jù)預(yù)處理方法[J]. 池云仙,趙書(shū)良,羅燕,高琳,趙駿鵬,李超. 計(jì)算機(jī)科學(xué). 2017(10)
[2]基于SVM的主題爬蟲(chóng)技術(shù)研究[J]. 李璐,張國(guó)印,李正文. 計(jì)算機(jī)科學(xué). 2015(02)
本文編號(hào):2901209
本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/2901209.html
最近更新
教材專(zhuān)著