面向微博熱點話題發(fā)現(xiàn)的多標簽傳播聚類方法研究
本文關(guān)鍵詞:面向微博熱點話題發(fā)現(xiàn)的多標簽傳播聚類方法研究
更多相關(guān)文章: 微博 熱點話題發(fā)現(xiàn) 老化理論 熱詞抽取 多標簽傳播
【摘要】:微博熱點話題發(fā)現(xiàn)是目前的研究熱點.針對傳統(tǒng)熱詞抽取方法難以適用于微博數(shù)據(jù)的問題,提出一種基于老化理論的詞生命值計算模型用于熱詞抽取,并基于熱詞間的相關(guān)性構(gòu)建詞共現(xiàn)網(wǎng)絡(luò);針對傳統(tǒng)的詞聚類算法不能較好地解決話題間存在重疊熱詞以及時間效率不佳的問題,引入多標簽傳播思想,設(shè)計一種接近線性時間復(fù)雜度的多標簽傳播聚類算法(TCMLPA)用于詞共現(xiàn)網(wǎng)絡(luò)的熱詞聚類,獲得熱點話題集.實驗結(jié)果表明,詞生命值計算模型能夠有效過濾噪聲并提取熱詞,TCMLPA算法則能夠在保證聚類結(jié)果穩(wěn)定性的情況下,有效提高熱點話題發(fā)現(xiàn)的精度和效率.
【作者單位】: 福州大學
【關(guān)鍵詞】: 微博 熱點話題發(fā)現(xiàn) 老化理論 熱詞抽取 多標簽傳播
【基金】:國家自然科學基金項目(No.61103175) 福建省教育廳重點項目(No.JK2012003) 福建省科技創(chuàng)新平臺項目(No.2009J1007) 福建省自然科學基金項目(No.2013J01232)資助
【分類號】:TP393.092;TP391.1
【正文快照】: 1引言微博現(xiàn)在已成為互聯(lián)網(wǎng)交流的一種時尚,同時也是熱點話題產(chǎn)生和討論的重要場所.微博信息的指數(shù)增長使得如何有效地掌控海量信息并提取熱點話題成為亟待解決的問題.熱點話題是指在一段時間內(nèi),頻繁出現(xiàn)在網(wǎng)絡(luò)上的人們廣泛關(guān)注并討論的話題.最早在該領(lǐng)域開展研究的是由DARPA
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 曾依靈;許洪波;白碩;;網(wǎng)絡(luò)文本主題詞的提取與組織研究[J];中文信息學報;2008年03期
2 曹玉娟;牛振東;趙X;彭學平;;基于概念和語義網(wǎng)絡(luò)的近似網(wǎng)頁檢測算法[J];軟件學報;2011年08期
3 龍志yN;程葳;;基于詞聚類的熱點話題檢測算法[J];計算機工程與設(shè)計;2011年06期
4 周亞東;孫欽東;管曉宏;李衛(wèi);陶敬;;流量內(nèi)容詞語相關(guān)度的網(wǎng)絡(luò)熱點話題提取[J];西安交通大學學報;2007年10期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張召靈;張元林;;網(wǎng)絡(luò)信息內(nèi)容審計研究的現(xiàn)狀及趨勢[J];中國管理信息化;2010年22期
2 魏詩云;楊家駿;;網(wǎng)頁近似重復(fù)檢測算法研究[J];計算機光盤軟件與應(yīng)用;2012年08期
3 程們森;安俊秀;;基于特征詞群的新聞類重復(fù)網(wǎng)頁和近似網(wǎng)頁識別算法[J];成都信息工程學院學報;2012年04期
4 李巖;婁云;;文本聚類算法在輿情監(jiān)控中的應(yīng)用分析[J];電子設(shè)計工程;2013年01期
5 潘大慶;;基于層次聚類的微博敏感話題檢測算法研究[J];廣西民族大學學報(自然科學版);2012年04期
6 袁勝;;基于LDA模型的科技文獻話題演化分析[J];計算機光盤軟件與應(yīng)用;2014年21期
7 潘大慶;;基于數(shù)據(jù)挖掘的輿情監(jiān)測系統(tǒng)設(shè)計[J];大眾科技;2014年11期
8 陳婧;;基于語義網(wǎng)的軟件工程數(shù)據(jù)查詢處理技術(shù)[J];電子技術(shù)與軟件工程;2015年04期
9 孫欽東;管曉宏;周亞東;;網(wǎng)絡(luò)信息內(nèi)容審計研究的現(xiàn)狀及趨勢[J];計算機研究與發(fā)展;2009年08期
10 龐海杰;;面向文本情感分析的商品評價信息檢測[J];計算機應(yīng)用;2012年07期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 李恒訓;張華平;秦鵬;于滿泉;劉金剛;;基于主題詞的網(wǎng)絡(luò)熱點話題發(fā)現(xiàn)[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年
2 許磊;張冬梅;;基于事件關(guān)聯(lián)的輿情熱度預(yù)測分析[A];虛擬運營與云計算——第十八屆全國青年通信學術(shù)年會論文集(下冊)[C];2013年
3 許磊;張冬梅;;基于事件關(guān)聯(lián)的輿情熱度預(yù)測分析[A];第十八屆全國青年通信學術(shù)年會論文集(下冊)[C];2013年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學;2011年
2 張博;多視點商品本體學習研究[D];武漢理工大學;2010年
3 向東;產(chǎn)品設(shè)計中多領(lǐng)域知識表達、獲取及應(yīng)用研究[D];華中科技大學;2012年
4 彭菲菲;網(wǎng)絡(luò)熱點話題發(fā)現(xiàn)的關(guān)鍵技術(shù)研究[D];中國礦業(yè)大學(北京);2012年
5 周而重;博客輿情熱點發(fā)現(xiàn)與分析[D];北京工業(yè)大學;2013年
6 程文娟;基于文本挖掘的定向性信息分析研究[D];合肥工業(yè)大學;2012年
7 何東曉;復(fù)雜網(wǎng)絡(luò)社團結(jié)構(gòu)發(fā)現(xiàn)方法研究[D];吉林大學;2014年
8 任薇;基于微博的社會網(wǎng)絡(luò)特征研究[D];西南大學;2014年
9 朱牧;復(fù)雜網(wǎng)絡(luò)中社區(qū)發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];中國礦業(yè)大學;2014年
10 趙學華;統(tǒng)計網(wǎng)絡(luò)模型若干關(guān)鍵問題研究[D];吉林大學;2014年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 李振;網(wǎng)絡(luò)輿情預(yù)測關(guān)鍵技術(shù)研究[D];鄭州大學;2010年
2 秦宏宇;網(wǎng)絡(luò)輿情熱點發(fā)現(xiàn)相關(guān)技術(shù)研究[D];哈爾濱工程大學;2010年
3 周杰;網(wǎng)絡(luò)輿情話題情感傾向性分析技術(shù)研究[D];解放軍信息工程大學;2010年
4 李海林;網(wǎng)絡(luò)輿情熱點信息發(fā)現(xiàn)及其傾向性研究[D];武漢理工大學;2010年
5 李恒訓;網(wǎng)絡(luò)論壇采集及熱點話題發(fā)現(xiàn)研究[D];首都師范大學;2011年
6 徐暢;我國網(wǎng)絡(luò)輿論危機應(yīng)急管理決策支持系統(tǒng)研究[D];華中師范大學;2011年
7 劉偉;基于數(shù)據(jù)挖掘的BBS用戶評價系統(tǒng)研究[D];長春理工大學;2011年
8 王宏勇;網(wǎng)絡(luò)輿情熱點發(fā)現(xiàn)與分析研究[D];西南交通大學;2011年
9 王瑞雷;Web數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)教育論壇中的應(yīng)用研究[D];新疆師范大學;2011年
10 張靜;基于微博的網(wǎng)絡(luò)熱點發(fā)現(xiàn)模型及平臺研究[D];華中科技大學;2010年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 邱立坤;龍志yN;鐘華;程葳;;層次化話題發(fā)現(xiàn)與跟蹤方法及系統(tǒng)實現(xiàn)[J];廣西師范大學學報(自然科學版);2007年02期
2 王澤彬,金飛,李夏,王冠;Web數(shù)據(jù)挖掘技術(shù)及實現(xiàn)[J];哈爾濱工業(yè)大學學報;2005年10期
3 于滿泉;駱衛(wèi)華;許洪波;白碩;;話題識別與跟蹤中的層次化話題識別技術(shù)研究[J];計算機研究與發(fā)展;2006年03期
4 李保利,俞士汶;話題識別與跟蹤研究[J];計算機工程與應(yīng)用;2003年17期
5 程葳;龍志yN;;面向互聯(lián)網(wǎng)新聞的在線話題檢測算法[J];計算機工程;2009年18期
6 張曉艷;王挺;;話題發(fā)現(xiàn)與追蹤技術(shù)研究[J];計算機科學與探索;2009年04期
7 吳平博,陳群秀,馬亮;基于特征串的大規(guī)模中文網(wǎng)頁快速去重算法研究[J];中文信息學報;2003年02期
8 劉遠超;王曉龍;徐志明;關(guān)毅;;文檔聚類綜述[J];中文信息學報;2006年03期
9 洪宇;張宇;劉挺;李生;;話題檢測與跟蹤的評測及研究綜述[J];中文信息學報;2007年06期
10 曾依靈;許洪波;白碩;;網(wǎng)絡(luò)文本主題詞的提取與組織研究[J];中文信息學報;2008年03期
中國碩士學位論文全文數(shù)據(jù)庫 前2條
1 鄒綱;中文新詞語自動檢測研究[D];中國科學院研究生院(計算技術(shù)研究所);2004年
2 周昭濤;文本聚類分析效果評價及文本表示研究[D];中國科學院研究生院(計算技術(shù)研究所);2005年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 徐恩元;徐建華;;文獻老化理論研究[J];四川圖書館學報;2006年06期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
,本文編號:619640
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/619640.html