基于SOM-K-means的天涯BBS水軍帖的聚類分析
[Abstract]:The emergence and popularization of the Internet have brought about tremendous changes in people's lives, and various network forums have greatly expanded the channels for people to exchange and share information. However, the intermingling of network forces greatly reduces the authenticity and effectiveness of network information, interferes with the true trend of public opinion, and even leads to network trust crisis. Therefore, it is of great significance to understand the characteristics of watermen and how to identify them. This paper starts with the active BBS of the network army, grabs the characteristic attribute data of some hot posts, first carries on the data preprocessing, proposes the registration date of the user's home page through the variable correlation analysis. The number of login and the number of fans are three effective clustering variables. Then, based on the self-organizing mapping neural network (SOM) clustering, the interval value and the final clustering center of the reasonable clustering number N are found out, which is used as the clustering number and the initial clustering center of K-means clustering, and the SOM K-means two-stage clustering analysis is realized. In order to improve the accuracy of clustering. From the point of view of clustering, it is found that the registration date of water army group is obviously concentrated on individual date, the number of fans and posts is less, the similarity of variable data is obvious, the rule of user ID naming is abnormal and so on, and the centrality of registration date is put forward. The data consistency of each variable, the registration date concentration of users in the first two pages and the naming rules of user ID are four aspects to identify the waterfront posts, and an example is given to show that the rules can be effectively applied to the identification of Shuijun posts. Finally, the deficiency and future research direction of this study are put forward. In summary, according to the idea of data acquisition, processing, analysis and application, this paper organizes the content, studies the attribute characteristics of users of BBS posts from the perspective of clustering, and summarizes the characteristics of water army groups, which provides an effective method for the identification of water posts.
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類號(hào)】:C913.4
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陶長(zhǎng)春;李和山;;基于大學(xué)生BBS行為特征的互動(dòng)式和諧高校論壇建設(shè)[J];東南傳播;2010年08期
2 ;BBS武功大血拼[J];作文大王(初中版);2006年01期
3 郭達(dá)陽(yáng);;談開發(fā)高校校園網(wǎng)BBS思想政治教育功能的必要性[J];現(xiàn)代企業(yè)教育;2012年21期
4 丁雪全;;BBS在圖書館的應(yīng)用[J];學(xué)園;2013年21期
5 ;《教師博覽》網(wǎng)上BBS(論壇)已開通[J];教師博覽;2003年02期
6 ;下期BBS話題:[J];當(dāng)代學(xué)生;2004年08期
7 ;上期《暑期合同》的BBS跟帖:[J];素質(zhì)教育博覽;2004年17期
8 張瑜,洪波;多角度看大學(xué)生BBS昵稱[J];思想教育研究;2004年03期
9 劉冰;從BBS看校園網(wǎng)絡(luò)文化對(duì)大學(xué)生學(xué)習(xí)的影響[J];現(xiàn)代遠(yuǎn)程教育研究;2005年02期
10 李愛民;;借助BBS營(yíng)造和諧輿論[J];國(guó)際公關(guān);2006年05期
相關(guān)會(huì)議論文 前2條
1 何冰;;BBS在大學(xué)英語(yǔ)寫作教學(xué)中的應(yīng)用[A];全國(guó)大學(xué)英語(yǔ)教學(xué)改革暨網(wǎng)絡(luò)環(huán)境下外語(yǔ)教學(xué)學(xué)術(shù)研討會(huì)論文集[C];2004年
2 楊國(guó)俊;朱曉東;;基于BBS挖掘的危機(jī)預(yù)測(cè)算法[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
相關(guān)重要報(bào)紙文章 前10條
1 本報(bào)記者 鄒偉;“小區(qū)BBS”拉近都市鄰里距離[N];南京日?qǐng)?bào);2008年
2 ;跟隨BBS去旅游[N];中國(guó)旅游報(bào);2002年
3 記者 唐茹 通訊員 張建國(guó);“西鐵改革發(fā)展論壇”成為高鐵時(shí)代“BBS”[N];人民鐵道;2010年
4 湖北 寂寞高手;BBS社區(qū)輕松找信息[N];電腦報(bào);2002年
5 山東省萊州市城港中街道朱杲小學(xué) 王偉光;如何教導(dǎo)小學(xué)生學(xué)BBS[N];中國(guó)電腦教育報(bào);2004年
6 ;網(wǎng)上自由討論的空間——BBS[N];兵團(tuán)日?qǐng)?bào)(漢);2000年
7 E龍工作室 雙龍一劍;將搜索進(jìn)行到底BBS消息,“百曉生”包打聽[N];電腦報(bào);2003年
8 本報(bào)記者 岳綱舉;網(wǎng)易關(guān)閉社區(qū) BBS末日來臨?[N];中國(guó)消費(fèi)者報(bào);2012年
9 本報(bào)記者 王曉雁;BBS侵犯他人商譽(yù) 搜狐被判賠償5萬[N];法制日?qǐng)?bào);2006年
10 ;清華同方高招網(wǎng)BBS系統(tǒng)建立[N];國(guó)際金融報(bào);2000年
相關(guān)碩士學(xué)位論文 前10條
1 陳國(guó)玉;基于SOM-K-means的天涯BBS水軍帖的聚類分析[D];華中科技大學(xué);2013年
2 余蘭;大學(xué)生BBS交往中的網(wǎng)絡(luò)角色研究[D];西南大學(xué);2007年
3 朱偉軍;基于BBS的網(wǎng)上群體學(xué)習(xí)的答疑系統(tǒng)的研究[D];湘潭大學(xué);2002年
4 陳克;基于BBS的政府輿情采集分析系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[D];南京郵電大學(xué);2012年
5 高功敬;BBS虛擬社區(qū)的人際互動(dòng)[D];山東大學(xué);2005年
6 劉偉;基于數(shù)據(jù)挖掘的BBS用戶評(píng)價(jià)系統(tǒng)研究[D];長(zhǎng)春理工大學(xué);2011年
7 安長(zhǎng)俊;基于校園網(wǎng)的BBS開發(fā)[D];南京理工大學(xué);2008年
8 楊國(guó)俊;基于BBS的輿情預(yù)測(cè)算法及應(yīng)用研究[D];合肥工業(yè)大學(xué);2010年
9 周君;BBS中語(yǔ)言使用與性別及年齡的相關(guān)性研究[D];安徽大學(xué);2010年
10 孫潔;一項(xiàng)基于建構(gòu)主義的BBS輔助英語(yǔ)寫作教學(xué)的案例研究[D];山東師范大學(xué);2010年
本文編號(hào):2125522
本文鏈接:http://sikaile.net/shekelunwen/shgj/2125522.html