天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

中概股的新聞極性市場(chǎng)預(yù)測(cè)研究

發(fā)布時(shí)間:2021-09-04 14:56
  股票市場(chǎng)的預(yù)測(cè)一直是數(shù)據(jù)研究熱點(diǎn),但是受到很多因素的影響,其預(yù)測(cè)難度較高.新聞是影響股價(jià)的重要因素,投資者也經(jīng)常依賴(lài)新聞進(jìn)行股票交易與決策,因此對(duì)新聞的剖析可以為投資者提供有效信息.新聞作為非結(jié)構(gòu)性數(shù)據(jù)運(yùn)用到股票預(yù)測(cè)中困難重重,而隨著機(jī)器學(xué)習(xí)技術(shù)和自然語(yǔ)言分析技術(shù)的發(fā)展,使得該問(wèn)題的解決成為了可能.目前國(guó)內(nèi)外資本市場(chǎng)政策上的顯著差異性導(dǎo)致越來(lái)越多的國(guó)內(nèi)企業(yè)在國(guó)外上市,而關(guān)于中文新聞對(duì)中概股預(yù)測(cè)影響的研究卻很少.本文提出了一種新的循環(huán)評(píng)估支持向量機(jī)(Cyclic Evaluation Support Vector Machine,CE-SVM)模型,并將其應(yīng)用于新聞極性對(duì)中概股預(yù)測(cè)的研究中.實(shí)驗(yàn)證明,CE-SVM相比起樸素貝葉斯模型提高了4%的準(zhǔn)確率,證明了方法的有效性. 

【文章來(lái)源】:小型微型計(jì)算機(jī)系統(tǒng). 2020,41(03)北大核心CSCD

【文章頁(yè)數(shù)】:6 頁(yè)

【部分圖文】:

中概股的新聞極性市場(chǎng)預(yù)測(cè)研究


方案整體流程圖

流程圖,標(biāo)簽,流程圖,新聞


考慮到股票市場(chǎng)大環(huán)境以及不同中概股之間的相互影響,本文自定義了中概股指數(shù)使標(biāo)簽標(biāo)準(zhǔn)化,并設(shè)計(jì)了全自動(dòng)機(jī)器打標(biāo)簽?zāi)P,將金融新聞和股票波?dòng)相結(jié)合.中概股指數(shù)指的是中概股股票平均股價(jià)變動(dòng)率(上漲為正,下降為負(fù)),具體計(jì)算詳見(jiàn)公式(1),模型如圖2所示.通過(guò)公示(2)的邏輯關(guān)系,根據(jù)文章對(duì)股市的影響來(lái)自動(dòng)標(biāo)注可以實(shí)現(xiàn)基本的標(biāo)記功能,且節(jié)省了人力與時(shí)間.默認(rèn)交易日當(dāng)天報(bào)道的新聞會(huì)即時(shí)影響到當(dāng)天股價(jià)的變動(dòng),同時(shí)考慮到非交易日?qǐng)?bào)道新聞的影響力,將非交易日的新聞合并至下一交易周期的第一個(gè)交易日的新聞數(shù)據(jù)集中.結(jié)合交易日當(dāng)天金融股票交易數(shù)據(jù)中的開(kāi)盤(pán)與收盤(pán)價(jià)格的變化進(jìn)行打標(biāo)簽操作.將股票交易數(shù)據(jù)與金融新聞數(shù)據(jù)同時(shí)輸入全自動(dòng)機(jī)器打標(biāo)簽?zāi)P椭校?jīng)過(guò)模型處理后輸出完成打標(biāo)簽操作后的語(yǔ)料,其結(jié)構(gòu)組成為“極性標(biāo)簽+新聞標(biāo)題+新聞內(nèi)容”.式中:β為中概股指數(shù),αi為第i只中概股的股價(jià)變動(dòng)率,n為中概股股票總數(shù),li為與第i只中概股相關(guān)新聞的極性標(biāo)簽.

模型圖,模型,語(yǔ)料,訓(xùn)練集


將SVM模型訓(xùn)練與評(píng)估操作嵌入模型預(yù)期預(yù)測(cè)準(zhǔn)確率已設(shè)定的循環(huán)中,使用交叉驗(yàn)證思想,重復(fù)地使用數(shù)據(jù),把得到的樣本內(nèi)數(shù)據(jù)進(jìn)行切分,在此基礎(chǔ)上可以得到多組不同的訓(xùn)練集和驗(yàn)證集.通過(guò)引入隨機(jī)數(shù)種子作為參數(shù),將語(yǔ)料向量集合隨機(jī)劃分為訓(xùn)練集和驗(yàn)證集,其中,訓(xùn)練集占語(yǔ)料向量集合總數(shù)的80%,驗(yàn)證集占語(yǔ)料向量集合總數(shù)的20%.重復(fù)實(shí)驗(yàn)時(shí),在其他參數(shù)不變的情況下,設(shè)置不同的隨機(jī)數(shù)種子以確保得到不一樣的隨機(jī)序列,避免偽隨機(jī)數(shù)序列的產(chǎn)生,增加實(shí)驗(yàn)訓(xùn)練與驗(yàn)證集組合的多樣性.在不斷訓(xùn)練與評(píng)估的過(guò)程中尋找預(yù)測(cè)準(zhǔn)確率達(dá)到設(shè)定要求的模型.經(jīng)過(guò)實(shí)踐可得,預(yù)期預(yù)測(cè)準(zhǔn)確率設(shè)定為0.65時(shí)得到的結(jié)果較為合理.通過(guò)調(diào)用SVM模型評(píng)估函數(shù),獲取當(dāng)前模型的精確率(precision)、召回率(recall)、f1值(f1-score)等信息,并計(jì)算準(zhǔn)確度(accuracy).

【參考文獻(xiàn)】:
期刊論文
[1]信息熵特征加權(quán)核函數(shù)的SVM數(shù)據(jù)分類(lèi)方法[J]. 李長(zhǎng)生,吳辰文,梁靖涵,王偉.  小型微型計(jì)算機(jī)系統(tǒng). 2017(07)
[2]社會(huì)互動(dòng)對(duì)股票市場(chǎng)的影響——基于新浪財(cái)經(jīng)博客的實(shí)證分析[J]. 楊曉蘭,高媚,朱淋.  證券市場(chǎng)導(dǎo)報(bào). 2016(07)
[3]論重大資產(chǎn)重組信息披露制度的完善[J]. 李有星,馮澤良.  浙江大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2015(03)
[4]基于微博情緒信息的股票市場(chǎng)預(yù)測(cè)[J]. 黃潤(rùn)鵬,左文明,畢凌燕.  管理工程學(xué)報(bào). 2015(01)
[5]大數(shù)據(jù)技術(shù)研究綜述[J]. 劉智慧,張泉靈.  浙江大學(xué)學(xué)報(bào)(工學(xué)版). 2014(06)
[6]SVM分類(lèi)核函數(shù)及參數(shù)選擇比較[J]. 奉國(guó)和.  計(jì)算機(jī)工程與應(yīng)用. 2011(03)



本文編號(hào):3383478

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/3383478.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)f92e7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com