天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟論文 > 股票論文 >

主題模型在財經(jīng)文本主題演化中的應(yīng)用

發(fā)布時間:2021-01-10 21:09
  經(jīng)濟領(lǐng)域問題的研究離不開數(shù)據(jù)的支持,與之相關(guān)的非結(jié)構(gòu)化數(shù)據(jù)的提取、分析和使用則是一個尚待深入挖掘的課題。將數(shù)據(jù)挖掘方法與經(jīng)濟領(lǐng)域非結(jié)構(gòu)化數(shù)據(jù)信息相結(jié)合,對數(shù)據(jù)挖掘方法的發(fā)展和經(jīng)濟領(lǐng)域的研究具有較大的意義。本文基于個股新聞,著眼于財經(jīng)文本中主題信息的提取問題,使用上證50指數(shù)成分股的17萬余則個股相關(guān)新聞作為語料庫,研究主題模型在財經(jīng)文本中應(yīng)用時存在的問題和改進辦法,并使用動態(tài)建模方法識別文本主題,分析個股新聞文本中主題的特點和演化規(guī)律。研究表明,主題模型應(yīng)用在財經(jīng)文本中,能有效地提取文本中的主題信息。本文的主要貢獻在于:(1)在相對較大規(guī)模的中文語料庫中進行統(tǒng)計分析和主題建模,并從中總結(jié)出中文財經(jīng)文本中存在的主題特點:個股財經(jīng)新聞文本的主題中存在核心主題和事件主題這兩類特殊主題。其中,核心主題貫穿始終,可以用于觀察對應(yīng)個股主要業(yè)務(wù)的變化;事件主題與事件相關(guān),有助于識別個股相關(guān)事件及其變化。(2)對主題模型在中文財經(jīng)文本應(yīng)用中存在的問題提出了一些改進方法。首先,針對主題數(shù)的設(shè)定問題,本文提出了基于最小化冗余主題數(shù)的主題數(shù)確定方法。冗余主題是無用的主題,該方法以最小化冗余主題數(shù),同時最大化... 

【文章來源】:廈門大學(xué)福建省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:87 頁

【學(xué)位級別】:碩士

【部分圖文】:

主題模型在財經(jīng)文本主題演化中的應(yīng)用


圖2.3?LDA圖模型表示??

模型圖,模型,骰子,主題


其中的陰影圓圈表示被觀測變量(observed?variable),非陰影圓圈則表示潛??在變量(latentvariable),箭頭表示兩個變量之間的條件依賴,方框表示重復(fù)進行??方框右下角次數(shù)的抽樣。用骰子模型表示則如圖2.4。??文章?_1111111睏圓)?主題?",|"?丨丨_■丨單詞??V?y?J?z、?Y?)??丫?.?4?^蠢?^?"??該i?)產(chǎn)中一個主??題編?4j-k=z?m,n??-?,?挑出笫k枚骰p,爲(wèi)上??Dir(/?)?;??,龜,??|投擲,產(chǎn)生一個申??2?3??J?^?_?k??^?kMUl??圖2.4?LDA模型示意圖1???艮[]:作者先從&?分布的箱子中。藗骰子,作為文檔集的主題-詞??分布的骰子

百度,指數(shù)對,財富


戶覆蓋率還是瀏覽深度,都遠遠高于其他同類專業(yè)網(wǎng)站。此外,在2014年11月??23日至2017年12月19日的百度指數(shù)中,東方財富網(wǎng)的熱度也大幅領(lǐng)先其他同??類知名網(wǎng)站,包括綜合性新聞門戶網(wǎng)站,如新浪財經(jīng)等(圖3.1)。??考慮到用戶覆蓋率、用戶瀏覽深度和專業(yè)性,本文選擇東方財富網(wǎng)中的文本??內(nèi)容作為文本信息源。??p?pc?勢□?押.a?対?w?申*?(J5??逛軹75財??兩*?斧:浪??537BK???防取+??,乂?廣’?^?\?廣*^.廣、^、八?—v??J?y?v;?v.?"V?v-v-v-v,—q一???fi?Mi**,!均?*|ij?j??>,。?.t.?."tfl?jmibj??擊?,??圖3.1部分知名財經(jīng)網(wǎng)站百度指數(shù)對比??1?資料來源:http://index.?iresearch.com.?cn/pc/detail?id=2692??23??

【參考文獻】:
期刊論文
[1]科技情報分析中LDA主題模型最優(yōu)主題數(shù)確定方法研究[J]. 關(guān)鵬,王曰芬.  現(xiàn)代圖書情報技術(shù). 2016(09)
[2]網(wǎng)絡(luò)輿情事件的話題演化分析——以成都女司機為例[J]. 陳福集,馬梅蘭.  情報雜志. 2016(05)
[3]財經(jīng)新聞與股市預(yù)測——基于數(shù)據(jù)挖掘技術(shù)的實證分析[J]. 孔翔宇,畢秀春,張曙光.  數(shù)理統(tǒng)計與管理. 2016(02)
[4]基于LDA主題關(guān)聯(lián)過濾的領(lǐng)域主題演化研究[J]. 秦曉慧,樂小虬.  現(xiàn)代圖書情報技術(shù). 2015(03)
[5]基于主題模型的BBS話題演化趨勢分析[J]. 曹麗娜,唐錫晉.  管理科學(xué)學(xué)報. 2014(11)
[6]基于LDA的雙通道在線主題演化模型[J]. 曹建平,王暉,夏友清,喬鳳才,張鑫.  自動化學(xué)報. 2014(12)
[7]BBS網(wǎng)絡(luò)輿情的在線自適應(yīng)話題演化模型[J]. 楊春明,張暉,石大文.  計算機工程. 2014(07)
[8]基于LDA模型的網(wǎng)絡(luò)輿情事件話題演化分析[J]. 林萍,黃衛(wèi)東.  情報雜志. 2013(12)
[9]基于局部和全局的LDA話題演化分析[J]. 章建,李芳.  上海交通大學(xué)學(xué)報. 2012(11)
[10]基于LDA話題關(guān)聯(lián)的話題演化[J]. 楚克明,李芳.  上海交通大學(xué)學(xué)報. 2010(11)

碩士論文
[1]基于微博文本挖掘的投資者情緒與股票市場表現(xiàn)研究[D]. 張偉.山東大學(xué) 2015
[2]文本挖掘選股與資產(chǎn)組合建模及其分散化研究[D]. 畢斌.南京大學(xué) 2015
[3]互聯(lián)網(wǎng)財經(jīng)新聞媒體對中國股市的影響力排名研究[D]. 劉欣.西南財經(jīng)大學(xué) 2014
[4]互聯(lián)網(wǎng)財經(jīng)新聞對中國股市的影響研究[D]. 趙茜倩.西南財經(jīng)大學(xué) 2012



本文編號:2969416

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/2969416.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶126ca***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com