基于鏈接和螢火蟲算法聚類博文發(fā)現(xiàn)熱點話題
本文關(guān)鍵詞:基于鏈接和螢火蟲算法聚類博文發(fā)現(xiàn)熱點話題
更多相關(guān)文章: 網(wǎng)絡(luò)輿情 博客話題 熱點發(fā)現(xiàn) 鏈接 螢火蟲算法 聚類 簇結(jié)構(gòu)
【摘要】:針對已有的基于鏈接分析的熱點發(fā)現(xiàn)方法存在準(zhǔn)確度較低、易受作弊鏈接影響、易產(chǎn)生主題漂移現(xiàn)象等問題,利用復(fù)雜網(wǎng)絡(luò)簇結(jié)構(gòu)具有高度主題相關(guān)的特點,提出一種融合應(yīng)用鏈接分析和螢火蟲算法聚類博文的熱點話題發(fā)現(xiàn)算法。以博文頁面為節(jié)點,與博文內(nèi)容相同或相關(guān)的鏈接作為邊,根據(jù)博文及博主的相關(guān)屬性,綜合評定頁面權(quán)重,建立博客話題模型;運用螢火蟲算法對博文進行聚類獲得聚類中心,按頁面權(quán)重將聚類中心從大到小排序,形成熱點話題熱度排行。實驗結(jié)果表明,該方法能夠發(fā)現(xiàn)精度更高、數(shù)量更多的博客熱點話題。
【作者單位】: 廣西大學(xué)計算機與電子信息學(xué)院;
【關(guān)鍵詞】: 網(wǎng)絡(luò)輿情 博客話題 熱點發(fā)現(xiàn) 鏈接 螢火蟲算法 聚類 簇結(jié)構(gòu)
【基金】:廣西科學(xué)研究與技術(shù)開發(fā)計劃基金項目(桂科能114008-3B) 廣西大學(xué)科研基金項目(XJZ130355) 廣西研究生教育創(chuàng)新計劃基金項目(YCSZ2014034)
【分類號】:TP393.092
【正文快照】: 0引言基于純文本的熱點話題發(fā)現(xiàn)方法未考慮網(wǎng)頁文本的特殊性,獲得的結(jié)果準(zhǔn)確度不高[1-3],為此,研究者開始關(guān)注網(wǎng)頁特征,在文本挖掘的基礎(chǔ)上加入鏈接分析。文獻[4]在內(nèi)容計算網(wǎng)頁相似度的基礎(chǔ)之上,引入鏈接分析,提高了話題相關(guān)性度量的準(zhǔn)確度;文獻[5]通過頁面鏈接來估計信息的
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前8條
1 李東方;俞能海;尹華罡;;一種Web 2.0環(huán)境下互聯(lián)網(wǎng)熱點挖掘算法[J];電子與信息學(xué)報;2010年05期
2 鄭魁;疏學(xué)明;袁宏永;;網(wǎng)絡(luò)輿情熱點信息自動發(fā)現(xiàn)方法[J];計算機工程;2010年03期
3 黃敏;胡學(xué)鋼;;基于復(fù)雜網(wǎng)絡(luò)方法的輿情熱點挖掘[J];計算機仿真;2011年09期
4 楊博;劉大有;金弟;馬海賓;;復(fù)雜網(wǎng)絡(luò)聚類方法[J];軟件學(xué)報;2009年01期
5 龍志yN;程葳;;基于詞聚類的熱點話題檢測算法[J];計算機工程與設(shè)計;2011年06期
6 王鐵套;王國營;陳越;黃惠新;;基于語義模式與詞匯情感傾向的輿情態(tài)勢研究[J];計算機工程與設(shè)計;2012年01期
7 謝鳳宏;張大為;黃丹;謝福鼎;;基于加權(quán)復(fù)雜網(wǎng)絡(luò)的文本關(guān)鍵詞提取[J];系統(tǒng)科學(xué)與數(shù)學(xué);2010年11期
8 何建民;張義;;基于類熵距離測量的熱點話題識別方法研究[J];情報科學(xué);2012年08期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 周而重;博客輿情熱點發(fā)現(xiàn)與分析[D];北京工業(yè)大學(xué);2013年
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 李東生;高明倫;;高密度集成與單芯片多核系統(tǒng)及其研究進展[J];半導(dǎo)體技術(shù);2012年02期
2 武森;魏桂英;白塵;張桂瓊;;分類屬性高維數(shù)據(jù)基于集合差異度的聚類算法[J];北京科技大學(xué)學(xué)報;2010年08期
3 黃美璇;;基于主題發(fā)現(xiàn)的輿情分析系統(tǒng)的設(shè)計與實現(xiàn)[J];北京聯(lián)合大學(xué)學(xué)報(自然科學(xué)版);2012年01期
4 趙金利;張群華;余貽鑫;賈宏杰;楊錦;;輸電網(wǎng)網(wǎng)架結(jié)構(gòu)的譜聚類分析算法[J];電力系統(tǒng)及其自動化學(xué)報;2009年04期
5 李翔;李仕強;趙青虎;;基于邊聚類方法的復(fù)雜網(wǎng)絡(luò)社團挖掘研究[J];電腦知識與技術(shù);2012年10期
6 王娟;靳京;錢偉中;秦志光;;基于小波分解的群落流量異常檢測[J];電子測量與儀器學(xué)報;2010年04期
7 金弟;劉大有;楊博;劉杰;何東曉;田野;;基于局部探測的快速復(fù)雜網(wǎng)絡(luò)聚類算法[J];電子學(xué)報;2011年11期
8 王娟;秦志光;劉嶠;錢偉中;;基于網(wǎng)絡(luò)模塊化結(jié)構(gòu)的異常發(fā)現(xiàn)[J];電子與信息學(xué)報;2011年01期
9 劉旭;易東云;;基于保守合并策略的復(fù)雜網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)發(fā)現(xiàn)[J];復(fù)雜系統(tǒng)與復(fù)雜性科學(xué);2011年04期
10 董俊;任家東;盧海濤;;一種基于復(fù)雜網(wǎng)絡(luò)屬性值的K-means聚類算法[J];燕山大學(xué)學(xué)報;2012年04期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 劉j;戴偉;李仕明;;基于多Agent的非常規(guī)突發(fā)事件在線信息預(yù)警策略研究[A];第十六屆中國管理科學(xué)學(xué)術(shù)年會論文集[C];2014年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 王娟;大規(guī)模網(wǎng)絡(luò)安全態(tài)勢感知關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2010年
2 杜方;復(fù)雜網(wǎng)絡(luò)系統(tǒng)間相似性識別及其應(yīng)用[D];浙江大學(xué);2010年
3 李偉;復(fù)雜網(wǎng)絡(luò)特征結(jié)構(gòu)的挖掘方法研究[D];南京理工大學(xué);2010年
4 彭佳揚;代謝網(wǎng)絡(luò)中功能模塊挖掘和進化分析研究[D];中南大學(xué);2011年
5 鄧小龍;基于復(fù)雜網(wǎng)絡(luò)分析的新一代電信CRM關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2011年
6 葉祺;大規(guī)模網(wǎng)絡(luò)的社團發(fā)現(xiàn)與多層次可視化分析[D];北京郵電大學(xué);2011年
7 孫鵬崗;聚類算法研究及其在網(wǎng)絡(luò)模塊性分析中的應(yīng)用[D];西安電子科技大學(xué);2011年
8 竇炳琳;復(fù)雜網(wǎng)絡(luò)中的動態(tài)過程問題研究[D];復(fù)旦大學(xué);2011年
9 張長勝;求解規(guī)劃、聚類和調(diào)度問題的混合粒子群算法研究[D];吉林大學(xué);2009年
10 李向華;基于人工免疫系統(tǒng)的增量聚類算法及其優(yōu)化與應(yīng)用的研究[D];吉林大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 周斌;復(fù)雜網(wǎng)絡(luò)的社團結(jié)構(gòu)挖掘及應(yīng)用研究[D];廣西師范學(xué)院;2010年
2 李亞杰;基于復(fù)雜網(wǎng)絡(luò)理論的產(chǎn)業(yè)網(wǎng)絡(luò)研究[D];浙江工商大學(xué);2011年
3 王延鵬;復(fù)雜網(wǎng)絡(luò)重疊社區(qū)發(fā)現(xiàn)算法研究[D];太原理工大學(xué);2011年
4 張景陽;基于局部介數(shù)的復(fù)雜網(wǎng)絡(luò)社區(qū)動態(tài)演化研究[D];太原理工大學(xué);2011年
5 張博;高校網(wǎng)絡(luò)突發(fā)事件應(yīng)急處置系統(tǒng)的研究[D];北京交通大學(xué);2011年
6 張冬威;基于網(wǎng)絡(luò)聚類選擇的神經(jīng)網(wǎng)絡(luò)集成方法及其在農(nóng)業(yè)中的應(yīng)用[D];吉林大學(xué);2011年
7 張劍;復(fù)雜網(wǎng)絡(luò)中的層次社團發(fā)現(xiàn)與應(yīng)用[D];北京郵電大學(xué);2011年
8 王俊;基于Web搜索的輿情分析系統(tǒng)的設(shè)計與實現(xiàn)[D];北京郵電大學(xué);2011年
9 張翼;復(fù)雜網(wǎng)絡(luò)節(jié)點重要性評估及其應(yīng)用研究[D];華中師范大學(xué);2011年
10 張華;面向應(yīng)急決策的Web數(shù)據(jù)挖掘研究[D];蘭州大學(xué);2011年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 熊文濤;齊歡;雍龍泉;;一種新的基于離差最大化的客觀權(quán)重確定模型[J];系統(tǒng)工程;2010年05期
2 邱立坤;龍志yN;鐘華;程葳;;層次化話題發(fā)現(xiàn)與跟蹤方法及系統(tǒng)實現(xiàn)[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年02期
3 劉群,張華平,俞鴻魁,程學(xué)旗;基于層疊隱馬模型的漢語詞法分析[J];計算機研究與發(fā)展;2004年08期
4 任克強;趙光甫;張國萍;;基于帶權(quán)語言網(wǎng)絡(luò)的網(wǎng)頁關(guān)鍵詞抽取[J];計算機工程與應(yīng)用;2008年08期
5 聞彬;何婷婷;羅樂;宋樂;王倩;;基于語義理解的文本情感分類方法研究[J];計算機科學(xué);2010年06期
6 熊文新;宋柔;;信息檢索用戶查詢語句的停用詞過濾[J];計算機工程;2007年06期
7 張素智;劉放美;;基于矩陣約束法的中文分詞研究[J];計算機工程;2007年15期
8 王曉斌;溫春;石昭祥;;基于貝葉斯信息準(zhǔn)則的文本主題數(shù)估計[J];計算機工程;2009年07期
9 程葳;龍志yN;;面向互聯(lián)網(wǎng)新聞的在線話題檢測算法[J];計算機工程;2009年18期
10 洪宇;張宇;范基禮;劉挺;李生;;基于子話題分治匹配的新事件檢測[J];計算機學(xué)報;2008年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 司夏萌;互聯(lián)網(wǎng)信息傳播結(jié)構(gòu)下的輿論涌現(xiàn)過程研究[D];北京交通大學(xué);2011年
2 朱天;社會網(wǎng)絡(luò)中節(jié)點角色以及群體演化研究[D];北京郵電大學(xué);2011年
3 羅芳;意見挖掘中若干關(guān)鍵問題研究[D];武漢理工大學(xué);2011年
4 李澍淞;基于蜂擁策略的網(wǎng)絡(luò)輿論演化模型研究[D];復(fù)旦大學(xué);2011年
5 孫曉;中文詞法分析的研究及其應(yīng)用[D];大連理工大學(xué);2010年
6 余秀才;網(wǎng)絡(luò)輿論傳播的行為與動因[D];華中科技大學(xué);2010年
7 張博;多視點商品本體學(xué)習(xí)研究[D];武漢理工大學(xué);2010年
8 趙潔;基于粒計算的Web使用挖掘研究[D];華南理工大學(xué);2010年
9 潘新;基于復(fù)雜網(wǎng)絡(luò)的輿情傳播模型研究[D];大連理工大學(xué);2010年
10 夢非;社會化商務(wù)環(huán)境下意見領(lǐng)袖對購買意愿的影響研究[D];南京大學(xué);2012年
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 張偉哲;張宏莉;張研;顧學(xué)邁;;基于簇結(jié)構(gòu)的多中心網(wǎng)格資源監(jiān)測系統(tǒng)[J];中國科技論文在線;2009年02期
,本文編號:1134430
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1134430.html