天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于BTM的微博輿情熱點(diǎn)發(fā)現(xiàn)

發(fā)布時(shí)間:2018-03-11 20:23

  本文選題:詞對主題模型 切入點(diǎn):短文本 出處:《情報(bào)雜志》2016年11期  論文類型:期刊論文


【摘要】:[目的/意義]作為一種新興的社交新聞媒體,近年來,微博在許多熱點(diǎn)事件的發(fā)布和傳播中發(fā)揮了重要作用。但由于其文本的特殊性,傳統(tǒng)方法不能有效地對其進(jìn)行建模發(fā)現(xiàn)熱點(diǎn)話題。因此,如何高效、準(zhǔn)確地從微博數(shù)據(jù)中發(fā)現(xiàn)并提取有意義的熱點(diǎn)信息是一個(gè)很有價(jià)值的研究課題。[方法/過程]提出一種基于BTM模型的微博輿情熱點(diǎn)發(fā)現(xiàn)方法。首先,對微博文本采用BTM建模,改進(jìn)TF-IDF權(quán)重計(jì)算算法,以適應(yīng)微博短文本的特征。并將BTM建模結(jié)果與改進(jìn)的TF-IDF權(quán)重算法結(jié)合對微博文本進(jìn)行特征提取及相似性度量,然后采用K-means聚類方法發(fā)現(xiàn)熱點(diǎn)話題。[結(jié)果/結(jié)論]通過對新浪微博數(shù)據(jù)集的對比實(shí)驗(yàn)及結(jié)果分析驗(yàn)證了本方法的有效性。本方法能夠有效解決傳統(tǒng)模型在文本建模中所面臨的高維度和稀疏性問題,顯著改善熱點(diǎn)話題的發(fā)現(xiàn)質(zhì)量。
[Abstract]:[purpose / significance] as a new social news medium, Weibo has played an important role in the publication and dissemination of many hot events in recent years. Traditional methods can't effectively model it to find hot topics. Therefore, how to efficiently, It is a valuable research topic to accurately find and extract meaningful hot spot information from Weibo data. [method / process] this paper presents a method for discovering hot spots of public opinion in Weibo based on BTM model. Firstly, the paper uses BTM to model the text of Weibo. The algorithm of TF-IDF weight calculation is improved to adapt to the feature of Weibo short text, and then the feature extraction and similarity measurement are carried out by combining the result of BTM modeling with the improved TF-IDF weight algorithm. Then K-means clustering method is used to find hot topics. [results / conclusion] the validity of this method is verified by comparing the data sets of Weibo of Sina and analyzing the results. This method can effectively solve the problem of traditional model building in text. High dimensional and sparse problems in modules, Significantly improve the quality of hot topic discovery.
【作者單位】: 西安電子科技大學(xué)經(jīng)濟(jì)與管理學(xué)院;
【分類號】:TP391.1;G206

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王曉龍;袁艷;張?zhí)┥?;一種實(shí)體運(yùn)動(dòng)模式相似性度量方法的研究[J];計(jì)算機(jī)仿真;2009年11期

2 王黎;帥建梅;;圖像重排序中與查詢相關(guān)的圖像相似性度量[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2010年11期

3 文成林;周哲;徐曉濱;;一種新的廣義梯形模糊數(shù)相似性度量方法及在故障診斷中的應(yīng)用[J];電子學(xué)報(bào);2011年S1期

4 仝朝陽,石教英;一種關(guān)于布爾模式的相似性度量及其應(yīng)用[J];計(jì)算機(jī)研究與發(fā)展;1996年08期

5 杜培軍,方濤,唐宏;基于集合論的光譜相似性度量及在影像檢索中的應(yīng)用[J];上海交通大學(xué)學(xué)報(bào);2004年S1期

6 劉海濤;魏汝祥;蔣國萍;;軟件成本數(shù)據(jù)的相似性度量[J];上海交通大學(xué)學(xué)報(bào);2012年11期

7 鄭翠翠;李林;;協(xié)同過濾算法中的相似性度量方法研究[J];計(jì)算機(jī)工程與應(yīng)用;2014年08期

8 吳德;葉傳標(biāo);;時(shí)間序列相似性度量在水文數(shù)據(jù)挖掘中的應(yīng)用研究[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年11期

9 劉海桃;徐向~,

本文編號:1599749


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1599749.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a47dd***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com