面向微博熱點(diǎn)話題發(fā)現(xiàn)的多標(biāo)簽傳播聚類方法研究
本文關(guān)鍵詞:面向微博熱點(diǎn)話題發(fā)現(xiàn)的多標(biāo)簽傳播聚類方法研究
更多相關(guān)文章: 微博 熱點(diǎn)話題發(fā)現(xiàn) 老化理論 熱詞抽取 多標(biāo)簽傳播
【摘要】:微博熱點(diǎn)話題發(fā)現(xiàn)是目前的研究熱點(diǎn).針對(duì)傳統(tǒng)熱詞抽取方法難以適用于微博數(shù)據(jù)的問題,提出一種基于老化理論的詞生命值計(jì)算模型用于熱詞抽取,并基于熱詞間的相關(guān)性構(gòu)建詞共現(xiàn)網(wǎng)絡(luò);針對(duì)傳統(tǒng)的詞聚類算法不能較好地解決話題間存在重疊熱詞以及時(shí)間效率不佳的問題,引入多標(biāo)簽傳播思想,設(shè)計(jì)一種接近線性時(shí)間復(fù)雜度的多標(biāo)簽傳播聚類算法(TCMLPA)用于詞共現(xiàn)網(wǎng)絡(luò)的熱詞聚類,獲得熱點(diǎn)話題集.實(shí)驗(yàn)結(jié)果表明,詞生命值計(jì)算模型能夠有效過濾噪聲并提取熱詞,TCMLPA算法則能夠在保證聚類結(jié)果穩(wěn)定性的情況下,有效提高熱點(diǎn)話題發(fā)現(xiàn)的精度和效率.
【作者單位】: 福州大學(xué)
【關(guān)鍵詞】: 微博 熱點(diǎn)話題發(fā)現(xiàn) 老化理論 熱詞抽取 多標(biāo)簽傳播
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(No.61103175) 福建省教育廳重點(diǎn)項(xiàng)目(No.JK2012003) 福建省科技創(chuàng)新平臺(tái)項(xiàng)目(No.2009J1007) 福建省自然科學(xué)基金項(xiàng)目(No.2013J01232)資助
【分類號(hào)】:TP393.092;TP391.1
【正文快照】: 1引言微博現(xiàn)在已成為互聯(lián)網(wǎng)交流的一種時(shí)尚,同時(shí)也是熱點(diǎn)話題產(chǎn)生和討論的重要場(chǎng)所.微博信息的指數(shù)增長(zhǎng)使得如何有效地掌控海量信息并提取熱點(diǎn)話題成為亟待解決的問題.熱點(diǎn)話題是指在一段時(shí)間內(nèi),頻繁出現(xiàn)在網(wǎng)絡(luò)上的人們廣泛關(guān)注并討論的話題.最早在該領(lǐng)域開展研究的是由DARPA
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條
1 曾依靈;許洪波;白碩;;網(wǎng)絡(luò)文本主題詞的提取與組織研究[J];中文信息學(xué)報(bào);2008年03期
2 曹玉娟;牛振東;趙X;彭學(xué)平;;基于概念和語(yǔ)義網(wǎng)絡(luò)的近似網(wǎng)頁(yè)檢測(cè)算法[J];軟件學(xué)報(bào);2011年08期
3 龍志yN;程葳;;基于詞聚類的熱點(diǎn)話題檢測(cè)算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2011年06期
4 周亞東;孫欽東;管曉宏;李衛(wèi);陶敬;;流量?jī)?nèi)容詞語(yǔ)相關(guān)度的網(wǎng)絡(luò)熱點(diǎn)話題提取[J];西安交通大學(xué)學(xué)報(bào);2007年10期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張召靈;張?jiān)?;網(wǎng)絡(luò)信息內(nèi)容審計(jì)研究的現(xiàn)狀及趨勢(shì)[J];中國(guó)管理信息化;2010年22期
2 魏詩(shī)云;楊家駿;;網(wǎng)頁(yè)近似重復(fù)檢測(cè)算法研究[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2012年08期
3 程們森;安俊秀;;基于特征詞群的新聞?lì)愔貜?fù)網(wǎng)頁(yè)和近似網(wǎng)頁(yè)識(shí)別算法[J];成都信息工程學(xué)院學(xué)報(bào);2012年04期
4 李巖;婁云;;文本聚類算法在輿情監(jiān)控中的應(yīng)用分析[J];電子設(shè)計(jì)工程;2013年01期
5 潘大慶;;基于層次聚類的微博敏感話題檢測(cè)算法研究[J];廣西民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年04期
6 袁勝;;基于LDA模型的科技文獻(xiàn)話題演化分析[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2014年21期
7 潘大慶;;基于數(shù)據(jù)挖掘的輿情監(jiān)測(cè)系統(tǒng)設(shè)計(jì)[J];大眾科技;2014年11期
8 陳婧;;基于語(yǔ)義網(wǎng)的軟件工程數(shù)據(jù)查詢處理技術(shù)[J];電子技術(shù)與軟件工程;2015年04期
9 孫欽東;管曉宏;周亞東;;網(wǎng)絡(luò)信息內(nèi)容審計(jì)研究的現(xiàn)狀及趨勢(shì)[J];計(jì)算機(jī)研究與發(fā)展;2009年08期
10 龐海杰;;面向文本情感分析的商品評(píng)價(jià)信息檢測(cè)[J];計(jì)算機(jī)應(yīng)用;2012年07期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前3條
1 李恒訓(xùn);張華平;秦鵬;于滿泉;劉金剛;;基于主題詞的網(wǎng)絡(luò)熱點(diǎn)話題發(fā)現(xiàn)[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
2 許磊;張冬梅;;基于事件關(guān)聯(lián)的輿情熱度預(yù)測(cè)分析[A];虛擬運(yùn)營(yíng)與云計(jì)算——第十八屆全國(guó)青年通信學(xué)術(shù)年會(huì)論文集(下冊(cè))[C];2013年
3 許磊;張冬梅;;基于事件關(guān)聯(lián)的輿情熱度預(yù)測(cè)分析[A];第十八屆全國(guó)青年通信學(xué)術(shù)年會(huì)論文集(下冊(cè))[C];2013年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
2 張博;多視點(diǎn)商品本體學(xué)習(xí)研究[D];武漢理工大學(xué);2010年
3 向東;產(chǎn)品設(shè)計(jì)中多領(lǐng)域知識(shí)表達(dá)、獲取及應(yīng)用研究[D];華中科技大學(xué);2012年
4 彭菲菲;網(wǎng)絡(luò)熱點(diǎn)話題發(fā)現(xiàn)的關(guān)鍵技術(shù)研究[D];中國(guó)礦業(yè)大學(xué)(北京);2012年
5 周而重;博客輿情熱點(diǎn)發(fā)現(xiàn)與分析[D];北京工業(yè)大學(xué);2013年
6 程文娟;基于文本挖掘的定向性信息分析研究[D];合肥工業(yè)大學(xué);2012年
7 何東曉;復(fù)雜網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)發(fā)現(xiàn)方法研究[D];吉林大學(xué);2014年
8 任薇;基于微博的社會(huì)網(wǎng)絡(luò)特征研究[D];西南大學(xué);2014年
9 朱牧;復(fù)雜網(wǎng)絡(luò)中社區(qū)發(fā)現(xiàn)關(guān)鍵技術(shù)研究[D];中國(guó)礦業(yè)大學(xué);2014年
10 趙學(xué)華;統(tǒng)計(jì)網(wǎng)絡(luò)模型若干關(guān)鍵問題研究[D];吉林大學(xué);2014年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李振;網(wǎng)絡(luò)輿情預(yù)測(cè)關(guān)鍵技術(shù)研究[D];鄭州大學(xué);2010年
2 秦宏宇;網(wǎng)絡(luò)輿情熱點(diǎn)發(fā)現(xiàn)相關(guān)技術(shù)研究[D];哈爾濱工程大學(xué);2010年
3 周杰;網(wǎng)絡(luò)輿情話題情感傾向性分析技術(shù)研究[D];解放軍信息工程大學(xué);2010年
4 李海林;網(wǎng)絡(luò)輿情熱點(diǎn)信息發(fā)現(xiàn)及其傾向性研究[D];武漢理工大學(xué);2010年
5 李恒訓(xùn);網(wǎng)絡(luò)論壇采集及熱點(diǎn)話題發(fā)現(xiàn)研究[D];首都師范大學(xué);2011年
6 徐暢;我國(guó)網(wǎng)絡(luò)輿論危機(jī)應(yīng)急管理決策支持系統(tǒng)研究[D];華中師范大學(xué);2011年
7 劉偉;基于數(shù)據(jù)挖掘的BBS用戶評(píng)價(jià)系統(tǒng)研究[D];長(zhǎng)春理工大學(xué);2011年
8 王宏勇;網(wǎng)絡(luò)輿情熱點(diǎn)發(fā)現(xiàn)與分析研究[D];西南交通大學(xué);2011年
9 王瑞雷;Web數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)教育論壇中的應(yīng)用研究[D];新疆師范大學(xué);2011年
10 張靜;基于微博的網(wǎng)絡(luò)熱點(diǎn)發(fā)現(xiàn)模型及平臺(tái)研究[D];華中科技大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 邱立坤;龍志yN;鐘華;程葳;;層次化話題發(fā)現(xiàn)與跟蹤方法及系統(tǒng)實(shí)現(xiàn)[J];廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年02期
2 王澤彬,金飛,李夏,王冠;Web數(shù)據(jù)挖掘技術(shù)及實(shí)現(xiàn)[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2005年10期
3 于滿泉;駱衛(wèi)華;許洪波;白碩;;話題識(shí)別與跟蹤中的層次化話題識(shí)別技術(shù)研究[J];計(jì)算機(jī)研究與發(fā)展;2006年03期
4 李保利,俞士汶;話題識(shí)別與跟蹤研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年17期
5 程葳;龍志yN;;面向互聯(lián)網(wǎng)新聞的在線話題檢測(cè)算法[J];計(jì)算機(jī)工程;2009年18期
6 張曉艷;王挺;;話題發(fā)現(xiàn)與追蹤技術(shù)研究[J];計(jì)算機(jī)科學(xué)與探索;2009年04期
7 吳平博,陳群秀,馬亮;基于特征串的大規(guī)模中文網(wǎng)頁(yè)快速去重算法研究[J];中文信息學(xué)報(bào);2003年02期
8 劉遠(yuǎn)超;王曉龍;徐志明;關(guān)毅;;文檔聚類綜述[J];中文信息學(xué)報(bào);2006年03期
9 洪宇;張宇;劉挺;李生;;話題檢測(cè)與跟蹤的評(píng)測(cè)及研究綜述[J];中文信息學(xué)報(bào);2007年06期
10 曾依靈;許洪波;白碩;;網(wǎng)絡(luò)文本主題詞的提取與組織研究[J];中文信息學(xué)報(bào);2008年03期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 鄒綱;中文新詞語(yǔ)自動(dòng)檢測(cè)研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2004年
2 周昭濤;文本聚類分析效果評(píng)價(jià)及文本表示研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 徐恩元;徐建華;;文獻(xiàn)老化理論研究[J];四川圖書館學(xué)報(bào);2006年06期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
,本文編號(hào):619640
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/619640.html