微博自動(dòng)分類系統(tǒng)設(shè)計(jì)
本文關(guān)鍵詞:微博自動(dòng)分類系統(tǒng)設(shè)計(jì)
更多相關(guān)文章: 微博分類 用戶聚類 輪廓系數(shù)
【摘要】:文章提出了一種熱門微博分類的新思路,通過對(duì)熱門微博的轉(zhuǎn)發(fā)用戶進(jìn)行聚類分析,并根據(jù)不同的用戶聚集狀態(tài)來區(qū)分不同種類的熱門微博。在用戶聚類中采用了基于K-means聚類算法的改進(jìn)算法X-means,并根據(jù)微博用戶數(shù)據(jù)特點(diǎn)對(duì)X-means算法進(jìn)行了進(jìn)一步改進(jìn),將屬性差異和用戶節(jié)點(diǎn)差異考慮在聚類過程當(dāng)中。其中,在對(duì)X-means算法改進(jìn)過程中,對(duì)于用戶屬性的加權(quán)采用了基于對(duì)數(shù)函數(shù)的加權(quán)方式,確保聚類結(jié)果更加科學(xué)、準(zhǔn)確;在對(duì)用戶自身權(quán)重的加權(quán)中,通過建立重點(diǎn)人員信息庫的方式,實(shí)現(xiàn)了對(duì)特殊用戶節(jié)點(diǎn)的加權(quán),并利用HITS算法對(duì)重點(diǎn)人員信息庫實(shí)現(xiàn)動(dòng)態(tài)更新。在完成用戶聚類之后,將得到的重要用戶的信息分領(lǐng)域錄入重點(diǎn)人員信息庫,實(shí)現(xiàn)聚類過程與信息庫的反饋機(jī)制。另外,實(shí)驗(yàn)將相同數(shù)據(jù)分別代入改進(jìn)前后的K-means算法與X-means算法中,并通過輪廓系數(shù)評(píng)價(jià)聚類結(jié)果,證明了改進(jìn)后的X-means算法在微博用戶聚類中更有優(yōu)勢(shì)。
【作者單位】: 中國人民公安大學(xué)網(wǎng)絡(luò)安全保衛(wèi)學(xué)院;
【關(guān)鍵詞】: 微博分類 用戶聚類 輪廓系數(shù)
【基金】:公安部重點(diǎn)研究計(jì)劃[2011ZDYJGADX016]
【分類號(hào)】:TP391.1
【正文快照】: 0引言在新興的互聯(lián)網(wǎng)時(shí)代,微博作為一種短內(nèi)容交互式的社交平臺(tái)已經(jīng)成為人們發(fā)表意見、共享信息的一種主要工具。而隨著微博的普及,在微博中也出現(xiàn)了許多影響社會(huì)穩(wěn)定、危害社會(huì)治安的輿情事件,其中包括誹謗、謠言、反動(dòng)言論以及恐嚇威脅等內(nèi)容。公安網(wǎng)監(jiān)部門必須仔細(xì)地對(duì)微博
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 丁向榮;;基于用戶聚類的框計(jì)算改進(jìn)模型研究[J];科技通報(bào);2012年12期
2 王榮;李晉宏;宋威;;基于關(guān)鍵字的用戶聚類算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年09期
3 張晨;;集群環(huán)境下用戶聚類算法的智能化站點(diǎn)的架構(gòu)[J];硅谷;2012年24期
4 彭艷;王小玲;;一種混合聚類算法在用戶聚類中的應(yīng)用研究[J];信息技術(shù);2008年01期
5 張海榮;朱信忠;趙建民;徐慧英;;一種優(yōu)化的基于用戶聚類的過濾推薦策略[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2008年11期
6 王燕;孫玲芳;徐曰光;陳思光;黎維良;王雁秋;閆超;;基于高效多功能的聚類算法在Web挖掘中應(yīng)用的研究[J];科學(xué)技術(shù)與工程;2008年04期
7 趙潔;董振寧;張沙清;肖南峰;;一種基于粒度原理的多指標(biāo)綜合Web用戶聚類算法[J];計(jì)算機(jī)應(yīng)用研究;2011年07期
8 劉芳先;李國;;基于項(xiàng)目簇偏好的用戶聚類算法[J];現(xiàn)代計(jì)算機(jī);2013年18期
9 王瓊;顧文軒;徐汀榮;;結(jié)合關(guān)聯(lián)規(guī)則與FCM的用戶聚類改進(jìn)[J];微電子學(xué)與計(jì)算機(jī);2008年03期
10 翁偉;朱順痣;鐘瑛;;基于訪問路徑的Web用戶聚類算法[J];福建電腦;2013年01期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 趙潔;基于粒計(jì)算的Web使用挖掘研究[D];華南理工大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 顧振宇;基于點(diǎn)擊的用戶聚類的研究[D];電子科技大學(xué);2011年
2 陳澤紅;基于Web訪問日志的用戶聚類研究[D];廈門大學(xué);2014年
3 付志濤;基于Web日志的網(wǎng)絡(luò)用戶聚類研究與實(shí)現(xiàn)[D];南京理工大學(xué);2007年
4 蔣超;基于用戶聚類和語義詞典的微博推薦系統(tǒng)[D];浙江大學(xué);2013年
5 肖宗花;基于用戶訪問行為與內(nèi)容的用戶聚類算法的研究與實(shí)現(xiàn)[D];北京交通大學(xué);2013年
6 郝建斌;基于模糊理論的Web用戶聚類的研究[D];北京理工大學(xué);2011年
7 周松松;基于MapReduce用戶聚類算法在Web日志挖掘中應(yīng)用[D];河北工業(yè)大學(xué);2015年
8 楊登武;基于改進(jìn)的混合蛙跳算法的Web用戶聚類研究[D];西南大學(xué);2015年
9 鄭富蘭;基于Web用戶聚類的多Markov鏈預(yù)測(cè)模型研究[D];山西師范大學(xué);2013年
,本文編號(hào):742279
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/742279.html