基于有意義串聚類的微博熱點(diǎn)話題發(fā)現(xiàn)方法
本文關(guān)鍵詞: 熱點(diǎn)話題 微博 有意義串 特征聚類 出處:《通信學(xué)報(bào)》2013年S1期 論文類型:期刊論文
【摘要】:針對(duì)微博數(shù)據(jù)特征稀疏、內(nèi)容碎片化的特點(diǎn),提出一種基于有意義串聚類的熱點(diǎn)話題發(fā)現(xiàn)方法。結(jié)合重復(fù)串計(jì)算、上下文鄰接分析和語(yǔ)言規(guī)則過(guò)濾多種策略,提取能夠表達(dá)獨(dú)立完整語(yǔ)義的有意義串,并將微博數(shù)據(jù)建模在相對(duì)較小的有意義串空間,通過(guò)聚類產(chǎn)生候選話題,根據(jù)熱度排序發(fā)現(xiàn)熱點(diǎn)話題。微博數(shù)據(jù)實(shí)驗(yàn)結(jié)果表明,該方法在一定程度上實(shí)現(xiàn)對(duì)微博高維稀疏空間的降維,對(duì)于微博空間的熱點(diǎn)話題發(fā)現(xiàn)有效可行。
[Abstract]:In view of Weibo's sparse data features and fragmentation of content, a hot topic discovery method based on meaningful string clustering is proposed, which combines repeated string computing, context adjacency analysis and language rule filtering. Extracting meaningful strings that can express independent and complete semantics, and modeling Weibo data in a relatively small space of meaningful strings, generate candidate topics by clustering, and find hot topics according to heat ranking. The experimental results of Weibo data show that, To a certain extent, this method can reduce the dimension of Weibo's high-dimensional sparse space, and it is effective and feasible for the hot topic in Weibo space.
【作者單位】: 中國(guó)科學(xué)院計(jì)算技術(shù)研究所;國(guó)家計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心;
【基金】:國(guó)家科技支撐基金資助項(xiàng)目(2012BAH46B01) 國(guó)家自然科學(xué)基金資助項(xiàng)目(61170230)~~
【分類號(hào)】:TP393.092;TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 姜寧,宮秀軍,史忠植;高維特征空間中文本聚類研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年10期
2 李峰,彭嘉雄,桑紅石;基于廣義RoI的遙感圖像壓縮[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年04期
3 林榮,姜云飛;基于特征模糊相關(guān)的特征聚類算法[J];現(xiàn)代計(jì)算機(jī);2004年10期
4 緱水平;焦李成;;基于多尺度幾何分析與核匹配追蹤的圖像識(shí)別[J];模式識(shí)別與人工智能;2007年06期
5 劉海峰;劉守生;姚澤清;張學(xué)仁;;一種基于改進(jìn)K-means聚類的文本特征選擇模型[J];微電子學(xué)與計(jì)算機(jī);2009年06期
6 程洪;鄭南寧;劉鐵;高振海;;基于均值移動(dòng)和特征聚類的道路識(shí)別方法[J];模式識(shí)別與人工智能;2002年04期
7 李喬亮;汪國(guó)有;劉建國(guó);陳少波;;基于局部特征聚類匹配的多譜圖像配準(zhǔn)方法[J];計(jì)算機(jī)工程;2009年15期
8 張成彬;唐建;;基于互信息最大化和特征聚類的特征選擇[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2009年08期
9 羅毅輝;熊曙初;王四春;范強(qiáng);;無(wú)監(jiān)督環(huán)境下基于聚類集成的特征選擇[J];微計(jì)算機(jī)信息;2008年09期
10 劉海峰;王元元;姚澤清;王倩;;一種基于特征聚類的文本分類模型研究[J];情報(bào)學(xué)報(bào);2008年02期
相關(guān)會(huì)議論文 前8條
1 何新;趙亞琴;周獻(xiàn)中;;基于多層次支持向量機(jī)分類樹(shù)的音頻分類方法[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年
2 沈超慧;;基于多尺度特征聚類的三維模型局部形狀檢索方法[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2008年
3 王世星;曹輝蘭;靳文芳;蔡玉華;;利用地震不連續(xù)性及特征聚類劃分塔河油區(qū)巖溶儲(chǔ)集單元[A];中國(guó)地球物理第二十一屆年會(huì)論文集[C];2005年
4 王學(xué)敏;程君實(shí);;四足步行機(jī)器人特征辨識(shí)算法[A];1996年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];1996年
5 王明文;付劍波;羅遠(yuǎn)勝;陸旭;;基于協(xié)同聚類的兩階段文本聚類方法研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
6 劉翼光;熊志勇;沈理;;一種基于多層感知器的臉部識(shí)別算法[A];1998年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];1998年
7 王曉丹;趙榮椿;;一種基于視覺(jué)感知特性及改進(jìn)的模糊Kohonen聚類網(wǎng)絡(luò)的圖象紋理分割方法[A];中國(guó)體視學(xué)學(xué)會(huì)圖像分析專業(yè)、中國(guó)體視學(xué)學(xué)會(huì)仿真與虛擬現(xiàn)實(shí)專業(yè)、中國(guó)航空學(xué)會(huì)信號(hào)與信息處理專業(yè)第一屆聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2000年
8 郭焱;孟瑋;劉建;張人銘;;新疆不同河流斑重唇魚(yú)(Diptychus maculates)形態(tài)特征比較研究[A];中國(guó)魚(yú)類學(xué)會(huì)2008學(xué)術(shù)研討會(huì)論文摘要匯編[C];2008年
相關(guān)博士學(xué)位論文 前4條
1 梁鵬;基于內(nèi)容的目標(biāo)分類識(shí)別關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2011年
2 黃穎;基于圖理論的圖像處理與物體識(shí)別算法的研究[D];電子科技大學(xué);2012年
3 趙娜樂(lè);基于物理屬性的城市快速路交通流特征參數(shù)模型[D];北京交通大學(xué);2010年
4 李國(guó)波;認(rèn)證與恢復(fù)統(tǒng)一的自嵌入水印算法及其拓展應(yīng)用研究[D];復(fù)旦大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 李丹;一種新的基于特征聚類的網(wǎng)絡(luò)motif識(shí)別算法[D];西安電子科技大學(xué);2009年
2 趙娟娟;基于特征聚類的文本分類算法研究[D];華南理工大學(xué);2011年
3 張志良;面向服務(wù)聚類的無(wú)監(jiān)督異常檢測(cè)技術(shù)研究[D];中南大學(xué);2009年
4 王志波;基于數(shù)據(jù)挖掘的垃圾郵件過(guò)濾技術(shù)研究[D];陜西師范大學(xué);2009年
5 崔春燕;組特征選擇算法及其應(yīng)用研究[D];南京師范大學(xué);2013年
6 陳洪;基于云計(jì)算的大規(guī)模圖像檢索后臺(tái)處理系統(tǒng)實(shí)現(xiàn)[D];西南交通大學(xué);2013年
7 胡俊;基于SIFT的車(chē)載導(dǎo)航圖像匹配方法[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年
8 韓雪婷;基于評(píng)論挖掘的產(chǎn)品分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年
9 向建波;大型場(chǎng)景三維重建加速技術(shù)研究[D];浙江大學(xué);2013年
10 冀單單;基于互聯(lián)網(wǎng)的數(shù)字音樂(lè)盜版檢測(cè)技術(shù)應(yīng)用研究[D];北方工業(yè)大學(xué);2013年
,本文編號(hào):1522137
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1522137.html