基于箱線圖的微博客熱點(diǎn)話題發(fā)現(xiàn)
本文關(guān)鍵詞:基于箱線圖的微博客熱點(diǎn)話題發(fā)現(xiàn)
更多相關(guān)文章: 微博客 熱點(diǎn)話題 突發(fā)詞 箱線圖 噪聲微博
【摘要】:提出了一種基于箱線圖原理識別突發(fā)詞的熱點(diǎn)話題發(fā)現(xiàn)方法。該方法首先統(tǒng)計(jì)了噪聲微博的特征,并根據(jù)這些特征對微博進(jìn)行了過濾,然后利用箱線圖原理識別突發(fā)詞,最后通過計(jì)算不同時段突發(fā)詞的權(quán)重來發(fā)現(xiàn)微博熱點(diǎn)話題。實(shí)驗(yàn)結(jié)果表明,與SSM、EC、ELM方法相比,基于箱線圖原理識別突發(fā)詞的熱點(diǎn)話題發(fā)現(xiàn)方法在F1值上平均提高了13.8%,而且對噪聲不敏感。
【作者單位】: 福州大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院;
【關(guān)鍵詞】: 微博客 熱點(diǎn)話題 突發(fā)詞 箱線圖 噪聲微博
【基金】:福建省科技重大項(xiàng)目(2013H6012) 教育部博士點(diǎn)基金聯(lián)合資助項(xiàng)目(2012351410010) 福建省自然科學(xué)基金(2010J05133) 福州市科技計(jì)劃(2012-G-113)
【分類號】:TP393.092;TP391.1
【正文快照】: 0引言微博[1],即微博客(Microblog)的簡稱,是一個基于用戶關(guān)系信息分享、傳播以及獲取的平臺,以140字左右的文字更新信息,具有草根性強(qiáng)、分布廣、即時性、多噪聲等特點(diǎn)。CNNIC發(fā)布的第31次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告顯示[2],截至2012年12月底,我國微博用戶規(guī)模為3.09億,較2
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 楊亮;林原;林鴻飛;;基于情感分布的微博熱點(diǎn)事件發(fā)現(xiàn)[J];中文信息學(xué)報(bào);2012年01期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 苗蕊;劉魯;劉志明;;基于隱馬爾可夫模型的突發(fā)事件新聞報(bào)道的爆發(fā)性分析[J];系統(tǒng)工程;2010年08期
2 王君澤;馬靜;杜洪濤;;微博輿情分析平臺的框架與支撐技術(shù)研究[J];電子政務(wù);2013年01期
3 張東霞;;基于高校學(xué)生微博的輿情熱點(diǎn)分析與發(fā)現(xiàn)[J];東南傳播;2013年06期
4 牛洪林;孫海萍;;基于CSSCI(2000~2011)的我國體育學(xué)學(xué)科知識圖譜研究[J];圖書與情報(bào);2014年01期
5 胡榜利;覃山羽;黃鑫;楊光業(yè);陳斌冠;鄧?yán)?蔡金華;;內(nèi)鏡逆行胰膽管造影術(shù)的文獻(xiàn)計(jì)量學(xué)研究[J];重慶醫(yī)學(xué);2014年10期
6 胡改麗;陳福集;;網(wǎng)絡(luò)輿情熱點(diǎn)話題傳播結(jié)構(gòu)研究[J];發(fā)展研究;2014年08期
7 周澍綺;;基于Kleinberg算法的楚辭文獻(xiàn)突發(fā)信息監(jiān)測研究[J];電腦知識與技術(shù);2015年04期
8 冀俊忠;貝飛;吳晨生;柴鷹;宋辰;;詞性對新聞和微博網(wǎng)絡(luò)話題檢測的影響[J];北京工業(yè)大學(xué)學(xué)報(bào);2015年04期
9 張鈺莎;蔣盛益;;微博公共事件演化分析研究綜述[J];廣東工業(yè)大學(xué)學(xué)報(bào);2015年02期
10 DONG Guozhong;LI Ruiguang;YANG Wu;WANG Wei;GONG Liangyi;SHEN Guowei;YU Miao;LV Jiguang;;Microblog Burst Keywords Detection Based on Social Trust and Dynamics Model[J];Chinese Journal of Electronics;2014年04期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 高繼平;丁X;;基于德溫特專利數(shù)據(jù)庫兩岸納米專利的定量研究[A];經(jīng)濟(jì)發(fā)展方式轉(zhuǎn)變與自主創(chuàng)新——第十二屆中國科學(xué)技術(shù)協(xié)會年會(第四卷)[C];2010年
2 高繼平;丁X;;基于德溫特專利數(shù)據(jù)庫兩岸納米專利的定量研究[A];第12屆中國科協(xié)年會第31分會場海峽兩岸區(qū)域合作與協(xié)同發(fā)展論壇論文集[C];2010年
3 周春姐;孟小峰;文潔;;Flickr中的復(fù)合事件檢測[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
4 邱均平;柴雯;;國際科學(xué)計(jì)量學(xué)研究的進(jìn)展與趨勢[A];第十屆中國科技政策與管理學(xué)術(shù)年會論文集——分6:區(qū)域創(chuàng)新與綠色發(fā)展(Ⅰ)[C];2014年
5 杜剛;張晨;朱艷云;杜雪濤;孟德香;;移動偽基站定位和軌跡追蹤技術(shù)研究[A];2014全國無線及移動通信學(xué)術(shù)大會論文集[C];2014年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳偉;基于時序文本挖掘的新聞內(nèi)容理解與推薦技術(shù)研究[D];浙江大學(xué);2010年
2 謝興;社會網(wǎng)絡(luò)中興趣發(fā)現(xiàn)與信息組織的研究[D];復(fù)旦大學(xué);2011年
3 龐杰;知識流動理論框架下的科學(xué)前沿與技術(shù)前沿研究[D];大連理工大學(xué);2011年
4 張?zhí)斐?實(shí)時數(shù)據(jù)流相關(guān)性分析與挖掘技術(shù)研究[D];東北大學(xué);2008年
5 李小寧;藥品監(jiān)管的多元參與:科學(xué)計(jì)量學(xué)的視角[D];大連理工大學(xué);2010年
6 杜剛;新聞數(shù)據(jù)中突發(fā)話題檢測研究[D];北京郵電大學(xué);2012年
7 李軍;基于用戶行為挖掘的數(shù)據(jù)流管理技術(shù)研究[D];北京郵電大學(xué);2012年
8 郭涵寧;多元科學(xué)指標(biāo)視角下的新興研究領(lǐng)域識別探索[D];大連理工大學(xué);2013年
9 盛立;生物醫(yī)學(xué)領(lǐng)域研究前沿識別與趨勢預(yù)測[D];中國人民解放軍軍事醫(yī)學(xué)科學(xué)院;2013年
10 吳聯(lián)仁;基于人類動力學(xué)的社交網(wǎng)絡(luò)信息傳播實(shí)證分析與建模研究[D];北京郵電大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 喬文妤;高校BBS平臺信息有序化研究[D];南京大學(xué);2011年
2 徐東亮;基于聚類分析的網(wǎng)絡(luò)論壇輿情信息挖掘技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年
3 孔旗;基于并行機(jī)器學(xué)習(xí)的大規(guī)模專利分類[D];上海交通大學(xué);2011年
4 劉豐;基于微博的突發(fā)事件檢測和信息傳播建模[D];哈爾濱工業(yè)大學(xué);2011年
5 李璐e,
本文編號:897180
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/897180.html