熱點特征深挖下的高效微博熱門話題預(yù)測
本文關(guān)鍵詞:熱點特征深挖下的高效微博熱門話題預(yù)測
更多相關(guān)文章: 數(shù)據(jù)挖掘 微博 熱門話題預(yù)測 聚類性
【摘要】:提出一種基于數(shù)據(jù)挖掘的微博熱門話題預(yù)測方法,在對微博詞匯進行基于詞頻的熱門分類基礎(chǔ)上,通過熱點發(fā)現(xiàn)、特征提取、發(fā)現(xiàn)學(xué)術(shù)領(lǐng)袖、熱點追蹤、關(guān)注學(xué)術(shù)領(lǐng)袖和熱點分析6個階段對預(yù)測進行分析和處理。通過統(tǒng)計的方法實現(xiàn)熱門預(yù)測結(jié)果輸出。采用一組網(wǎng)絡(luò)詞匯進行實際的熱門預(yù)測仿真分析,結(jié)果顯示,基于數(shù)據(jù)挖掘的微博熱門話題預(yù)測方法能夠更好的實現(xiàn)微博熱門話題的預(yù)測,預(yù)測結(jié)果聚類特性優(yōu)于傳統(tǒng)預(yù)測方法,算法收斂特性好,具有很好的預(yù)測使用價值。
【作者單位】: 河南廣播電視大學(xué);
【基金】:2013河南省社科聯(lián)資助項目(SKL-2013-598)
【分類號】:TP311.13;TP393.092
【正文快照】: 0引言數(shù)據(jù)挖掘技術(shù)是現(xiàn)代先進的數(shù)據(jù)深處理技術(shù),它采用數(shù)據(jù)與數(shù)據(jù)之間、數(shù)據(jù)與文本之間的相互特征關(guān)系作為研究和識別對象,通過深層次的細(xì)微特征提取方法,將數(shù)據(jù)之間深層次的特征提取出來,作為下一步數(shù)據(jù)處理的輸入因素。由于數(shù)據(jù)挖掘方法是一種先進的數(shù)據(jù)處理手段[1],所以在
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 李丹;;公民社會視角下中國微博輿情的發(fā)展與走向[J];東南傳播;2011年05期
2 何黎;何躍;霍葉青;;微博用戶特征分析和核心用戶挖掘[J];情報理論與實踐;2011年11期
3 歐健文,董守斌,蔡斌;模板化網(wǎng)頁主題信息的提取方法[J];清華大學(xué)學(xué)報(自然科學(xué)版);2005年S1期
4 廉捷;周欣;曹偉;劉云;;新浪微博數(shù)據(jù)挖掘方案[J];清華大學(xué)學(xué)報(自然科學(xué)版);2011年10期
5 喬良;;文本挖掘技術(shù)研究及其在信息檢索中的應(yīng)用[J];軟件導(dǎo)刊;2009年04期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張彥超;劉云;李勇;沈波;;基于自動生成模板的Web信息抽取技術(shù)[J];北京交通大學(xué)學(xué)報;2009年05期
2 廉捷;劉云;;網(wǎng)絡(luò)輿情中的信息預(yù)處理與自動摘要算法[J];北京交通大學(xué)學(xué)報;2010年05期
3 翟東升;楊洋;;基于XML技術(shù)的USPTO專利抽取系統(tǒng)[J];北京工業(yè)大學(xué)學(xué)報;2011年04期
4 馮少卿;都云程;;網(wǎng)頁結(jié)構(gòu)模板生成新方法研究[J];北京機械工業(yè)學(xué)院學(xué)報;2007年03期
5 翟菁;張莉鑰;;譜寫2011年社交媒體研究“五部曲”[J];今傳媒;2012年07期
6 張志強;;基于分塊頻繁集抽取的Web文本關(guān)聯(lián)分類[J];福建電腦;2011年11期
7 楊志偉;王鑫;;基于本體的氣象領(lǐng)域聚焦爬蟲[J];中國管理信息化;2011年04期
8 徐中華;;Web信息抽取方法概述[J];經(jīng)營管理者;2008年09期
9 劉晨曦;吳揚揚;;一種基于塊分析的網(wǎng)頁去噪音方法[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年02期
10 李舒晨;劉云;李勇;;網(wǎng)絡(luò)輿情分析中網(wǎng)頁信息預(yù)處理方案的實現(xiàn)[J];電腦與電信;2008年10期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 李連霞;馬軍;陳竹敏;;基于多特征的網(wǎng)頁內(nèi)容提取研究[A];第三屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2007)論文集[C];2007年
2 時達(dá)明;林鴻飛;楊志豪;;基于網(wǎng)頁框架和規(guī)則的網(wǎng)頁噪音去除方法[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
3 馮少卿;都云程;施水才;;基于模板的網(wǎng)頁主題信息抽取[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 彭濤;面向?qū)I(yè)搜索引擎的主題爬行技術(shù)研究[D];吉林大學(xué);2007年
2 陳竹敏;面向垂直搜索引擎的主題爬行技術(shù)研究[D];山東大學(xué);2008年
3 劉丹;大成組技術(shù)中的若干關(guān)鍵技術(shù)研究[D];浙江大學(xué);2010年
4 張彥超;社交網(wǎng)絡(luò)服務(wù)中信息傳播模式與輿論演進過程研究[D];北京交通大學(xué);2012年
5 黃石;轉(zhuǎn)型期犯罪治理模式變遷研究[D];武漢大學(xué);2013年
6 劉行軍;微博用戶及其信息傳播影響因素研究[D];華中師范大學(xué);2013年
7 萬平;中國公眾參與預(yù)算研究[D];南開大學(xué);2013年
8 廉捷;基于用戶特征的社交網(wǎng)絡(luò)數(shù)據(jù)挖掘研究[D];北京交通大學(xué);2014年
9 黃煥;面向e-Learning的學(xué)習(xí)者情感建模及應(yīng)用研究[D];華中師范大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王樂超;Web環(huán)境下文獻(xiàn)信息的提取與匹配研究[D];大連理工大學(xué);2010年
2 李元乾;基于移動搜索用戶關(guān)聯(lián)的信息檢索研究[D];北京交通大學(xué);2010年
3 汪涵;金融投資數(shù)據(jù)倉庫中數(shù)據(jù)融合的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2010年
4 李瓊瓊;網(wǎng)絡(luò)文本自動分類器的設(shè)計與實現(xiàn)[D];電子科技大學(xué);2010年
5 甄濤;基于社團發(fā)現(xiàn)的Blog信息收集原型系統(tǒng)的研究[D];解放軍信息工程大學(xué);2009年
6 劉繼勇;網(wǎng)絡(luò)輿情預(yù)警輔助決策支持系統(tǒng)模型及關(guān)鍵技術(shù)研究[D];石家莊經(jīng)濟學(xué)院;2010年
7 許世明;中文網(wǎng)頁分類技術(shù)研究及預(yù)分類算法實現(xiàn)[D];西安電子科技大學(xué);2009年
8 王偉;搜索引擎智能化技術(shù)中若干關(guān)鍵問題的研究與實現(xiàn)[D];河北科技大學(xué);2011年
9 戴支榮;基于Lucene的面向主題信息搜索系統(tǒng)的關(guān)鍵技術(shù)分析及應(yīng)用[D];武漢理工大學(xué);2011年
10 高永勝;基于樹形結(jié)構(gòu)的網(wǎng)頁數(shù)據(jù)抽取模式研究及應(yīng)用[D];大連理工大學(xué);2011年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 張彥超;劉云;李勇;沈波;;基于自動生成模板的Web信息抽取技術(shù)[J];北京交通大學(xué)學(xué)報;2009年05期
2 劉婷;胡寶清;;基于聚類分析的復(fù)雜網(wǎng)絡(luò)中的社團探測[J];復(fù)雜系統(tǒng)與復(fù)雜性科學(xué);2007年01期
3 荊濤,左萬利;基于可視布局信息的網(wǎng)頁噪音去除算法[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2004年S1期
4 楊楠,弓丹志,李_,
本文編號:1228502
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1228502.html