天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟(jì)論文 > 股票論文 >

基于深層融合的股票文本主題識(shí)別

發(fā)布時(shí)間:2022-01-07 14:16
  股票市場在資本市場中占據(jù)著重要地位,是經(jīng)濟(jì)的晴雨表。專家對股票的評論是投資者進(jìn)行投資決策的重要依據(jù)。因此,如何快速有效地捕獲眾多專家股評的主題信息,成為股票研究領(lǐng)域的熱點(diǎn)。然而目前大多數(shù)股票文本主題識(shí)別算法,其特征選擇方法及分類模式多采用單一的標(biāo)準(zhǔn)。一般而言,單一的標(biāo)準(zhǔn)只能從某個(gè)側(cè)面反映文本主題的識(shí)別效果,無法全面捕獲目標(biāo)的主體特征。事實(shí)上,不同的特征選擇標(biāo)準(zhǔn)及分類器模型從不同側(cè)面去理解文本,捕獲的特征信息具有較強(qiáng)的互補(bǔ)性。為了提高股票文本主題識(shí)別的準(zhǔn)確性,文章從信息融合的角度對股票文本進(jìn)行了多層面融合:1)特征選擇層,對多種特征選擇方法進(jìn)行加權(quán)融合,使其能夠全面表征股票文本的特點(diǎn);2)決策層,基于SVM-score,對多個(gè)分類器進(jìn)行決策層融合,使其能夠提高文本識(shí)別的準(zhǔn)確性;趯(shí)測數(shù)據(jù)的實(shí)驗(yàn)表明:相比單一模式的文本主題識(shí)別方法,文章提出的多層融合算法的識(shí)別精度明顯更高。 

【文章來源】:計(jì)算機(jī)科學(xué). 2019,46(S2)北大核心CSCD

【文章頁數(shù)】:5 頁

【部分圖文】:

基于深層融合的股票文本主題識(shí)別


圖1層次融合流程圖本文第2節(jié)介紹文本預(yù)處理的基本流程和方法;第3節(jié)

示意圖,特征選擇,示意圖,加權(quán)因子


β1+β2+…+βp=1。不同加權(quán)因子的選擇,對文本分類的識(shí)別效果不同,選擇合適的加權(quán)因子能夠?qū)ξ谋局黝}識(shí)別達(dá)到極佳的效果。這里,一定的原則是指在[0,1]的范圍內(nèi)以0為開始,0.1為步長,1為結(jié)束,給特征選擇方法賦予加權(quán)因子值進(jìn)行特征融合。經(jīng)過加權(quán)融合后,將具有最佳分類效果的參數(shù)用于構(gòu)建最優(yōu)值和測試數(shù)據(jù)。1)http://quote.eastmoney.com/zs000001.html.特征選擇加權(quán)示意圖如圖3所示,設(shè)Fisherscore的加權(quán)因子為β1,卡方檢驗(yàn)的加權(quán)因子為β2,T檢驗(yàn)的加權(quán)因子為β3,加權(quán)融合后的第r個(gè)特征值為:R(r)=β1F(r)+β2χ2(r)+β3T(r)(11)其中,β1+β2+β3=1,F(r)為特征r的Fisher分值0,χ2(r)為特征r的卡方值,T(r)為特征r的T檢驗(yàn)值。為了獲得一組更有意義和有辨別力的特征,我們建議使用加權(quán)融合系數(shù)的修改版來量化每個(gè)文本特征的細(xì)微差別。圖3特征選擇加權(quán)示意圖4分類決策SVM尋求最大邊緣超平面來將一個(gè)類的樣本與另一個(gè)類分開。訓(xùn)練數(shù)據(jù)的經(jīng)驗(yàn)風(fēng)險(xiǎn)和模型的復(fù)雜性可以是超參數(shù),從而確保對看不見的數(shù)據(jù)具有良好的泛化能力。對特征選擇加權(quán)融合完后的特征,進(jìn)一步基于SVM的score得分進(jìn)行決策層融合,構(gòu)建一個(gè)增強(qiáng)分類器用于最終的文本主題判別。score得分反映了點(diǎn)到邊緣的距離,值越大,表示

特征數(shù)目,準(zhǔn)確率,特征選擇


可以看出單一的特征選擇標(biāo)準(zhǔn)的識(shí)別準(zhǔn)確度相近,但選取的特征數(shù)據(jù)存在較大的差異性,因此進(jìn)行特征選擇融合來減少數(shù)據(jù)差異性,提高股票文本主題的識(shí)別率,具有必要性。而進(jìn)行特征選擇融合后的文本主題識(shí)別,準(zhǔn)確率明顯提高,識(shí)別效果相對穩(wěn)定。單一特征選擇方法和特征選擇融合后的最優(yōu)結(jié)果對比表明:相比單一模式的特征選擇方法,本文提出的特征選擇融合算法的識(shí)別精度明顯提高,通過方差的大小可以看出融合后的特征的穩(wěn)定性明顯有了提高。5.3參數(shù)對識(shí)別結(jié)果的影響圖7所示的折線圖為特征數(shù)目對識(shí)別準(zhǔn)確率的影響。從圖中可以看出,選擇不同的特征數(shù)目對識(shí)別準(zhǔn)確率有不同的影響。選擇合適的特征數(shù)目是進(jìn)行文本主題識(shí)別、提高識(shí)別準(zhǔn)確率的關(guān)鍵。圖8所示的折線圖為特征選擇融合權(quán)重對識(shí)別準(zhǔn)確率的影響。從圖中可以看出,不同的權(quán)重對識(shí)別準(zhǔn)確率的影響不同,選擇合適的權(quán)重對文本主題識(shí)別有不同的分類準(zhǔn)確性。其中,Fisherscore和卡方檢驗(yàn)融合的最佳權(quán)重為(Fisherscore:0.2,卡方:0.8);Fisherscore和T檢驗(yàn)融合的最佳權(quán)重為(Fisherscore:0.1;T檢驗(yàn):0.9);卡方檢驗(yàn)和T檢驗(yàn)融合的最佳權(quán)重為(卡方檢驗(yàn):0.1,T檢驗(yàn):0.9)。圖7特征數(shù)目對識(shí)別準(zhǔn)確率的影響圖8權(quán)重對識(shí)別準(zhǔn)確率的影響第11A期張加惠,等:基于深層融合的股票文本主題識(shí)別521

【參考文獻(xiàn)】:
期刊論文
[1]基于MapReduce的多級特征選擇機(jī)制[J]. 宋哲理,王超,王振飛.  計(jì)算機(jī)科學(xué). 2018(S2)
[2]電信大數(shù)據(jù)文本挖掘算法及應(yīng)用[J]. 汪東升,黃傳河,黃曉鵬,倪秋芬.  計(jì)算機(jī)科學(xué). 2017(12)
[3]基于改進(jìn)貝葉斯概率模型的推薦算法[J]. 劉付勇,高賢強(qiáng),張著.  計(jì)算機(jī)科學(xué). 2017(05)
[4]一種成對約束限制的半監(jiān)督文本聚類算法[J]. 王縱虎,劉速.  計(jì)算機(jī)科學(xué). 2016(12)
[5]基于Fisher分和支持向量機(jī)的特征選擇算法[J]. 張潤蓮,張昭,彭小金,曾兵.  計(jì)算機(jī)工程與設(shè)計(jì). 2014(12)
[6]股票技術(shù)指標(biāo)相似性與有效性研究[J]. 方匡南,紀(jì)宏,路遜.  統(tǒng)計(jì)與信息論壇. 2009(09)

博士論文
[1]文本分類及其相關(guān)技術(shù)研究[D]. 李榮陸.復(fù)旦大學(xué) 2005

碩士論文
[1]基于集成學(xué)習(xí)的股票買賣點(diǎn)預(yù)測研究[D]. 李妍.西北大學(xué) 2018
[2]LG-trader:基于局部泛化誤差和特征選擇的股票交易決策支持[D]. 梁雪玲.華南理工大學(xué) 2014
[3]我國上市公司股票股利與長期股票價(jià)格相關(guān)性研究[D]. 卜樂.東華大學(xué) 2014
[4]數(shù)據(jù)挖掘技術(shù)在股票預(yù)測中的應(yīng)用[D]. 張晨希.安徽大學(xué) 2006
[5]股票收益分布函數(shù)分析及價(jià)格預(yù)測[D]. 湯浩.武漢科技大學(xué) 2004



本文編號(hào):3574697

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/3574697.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ecdd6***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com