基于結構與內容的社交網(wǎng)絡水軍團體識別
本文關鍵詞:基于結構與內容的社交網(wǎng)絡水軍團體識別
更多相關文章: 社交網(wǎng)絡 水軍識別 結構特征 內容特征 水軍團體
【摘要】:隨著在線社交網(wǎng)絡的不斷發(fā)展,基于社交網(wǎng)絡的信息傳播也越來越深入和廣泛。然而近年來,有組織的網(wǎng)絡水軍的出現(xiàn),導致社交網(wǎng)絡上謠言信息盛行、欺詐活動猖獗,造成巨大的社會、經(jīng)濟損失,嚴重動搖了社交網(wǎng)絡的安全基礎,最終會影響社交網(wǎng)絡的發(fā)展前景。所以進行網(wǎng)絡水軍識別研究是一項迫在眉睫的工作。在龐大的社交網(wǎng)絡中,傳統(tǒng)的水軍識別工作,主要是基于單個特征進行的,沒有把水軍團體作為識別的目標,這類方法不能全面評價一個水軍的特征,識別準確率和效率有提高的空間。因此,如何檢測出社交網(wǎng)絡中的水軍團體,并提高社交網(wǎng)絡水軍檢測的效率和準確率是一項重要的研究課題。網(wǎng)絡水軍作為一個帶有一定任務的團體,在他們的團體成員結構中會呈現(xiàn)出一種異常特征;谶@一思想,本文提出了一種基于結構與內容的社交網(wǎng)絡水軍團體識別方法?梢酝ㄟ^挖掘網(wǎng)絡水軍在社交網(wǎng)絡中的結構特征,對社交網(wǎng)絡中的水軍團體進行識別;并結合節(jié)點本身所傳播信息的內容特征,對社交網(wǎng)絡中的水軍團體進行綜合分析,從而確認網(wǎng)絡水軍的身份。本文的具體工作:(1)挖掘社交網(wǎng)絡水軍的網(wǎng)絡結構特征。根據(jù)垃圾信息出現(xiàn)的時間,結合社交網(wǎng)絡用戶的轉發(fā)記錄構建社交網(wǎng)絡中的轉發(fā)關系網(wǎng)絡,尋找其中傳播信息能力強的重疊社區(qū)結構,初步識別網(wǎng)絡水軍團體。(2)用戶傳播內容的特征挖掘。分析用戶所發(fā)送內容的特征和垃圾信息的特征,通過度量它們之間的相似度,來判斷一個用戶是否傳播過垃圾信息。(3)綜合用戶的結構特征與發(fā)布內容的特征識別網(wǎng)絡水軍團體。在已識別的重疊結構的基礎上,度量重疊社區(qū)內節(jié)點的內容與垃圾信息的相似度,尋找多次傳播過垃圾信息的重疊社區(qū)節(jié)點,確定為網(wǎng)絡水軍。本文基于網(wǎng)絡水軍整體結構為基點而得到的網(wǎng)絡水軍識別模式,具有全局性特征。在新浪微博數(shù)據(jù)集上,通過對比實驗,驗證了本文提出方法的有效性和可行性。相關成果可以為凈化網(wǎng)絡環(huán)境提供支持,因而具有一定的應用前景。
【關鍵詞】:社交網(wǎng)絡 水軍識別 結構特征 內容特征 水軍團體
【學位授予單位】:南京郵電大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1;TP393.09
【目錄】:
- 摘要4-5
- abstract5-9
- 第一章 緒論9-14
- 1.1 研究背景9-10
- 1.2 網(wǎng)絡水軍識別現(xiàn)狀研究10-12
- 1.3 課題研究內容12-13
- 1.4 論文的組織結構13
- 1.5 本章小結13-14
- 第二章 相關研究14-23
- 2.1 社交網(wǎng)絡概述14-16
- 2.2 網(wǎng)絡水軍識別研究16-21
- 2.2.1 基于內容特征的方法16-17
- 2.2.2 基于行為特征的方法17-18
- 2.2.3 基于網(wǎng)絡特征的方法18-19
- 2.2.4 基于影響力的方法19
- 2.2.5 基于綜合特征的方法19-20
- 2.2.6 目前的研究難點和熱點20-21
- 2.3 網(wǎng)絡水軍識別研究總結21-22
- 2.4 本章小結22-23
- 第三章 基于網(wǎng)絡結構特征的水軍識別23-37
- 3.1 社交網(wǎng)絡水軍的網(wǎng)絡結構特征分析23-27
- 3.1.1 對節(jié)點和邊的度量24-26
- 3.1.2 重疊社區(qū)結構的引入26-27
- 3.2 構建社交網(wǎng)絡中的轉發(fā)關系網(wǎng)絡27-30
- 3.3 重疊社區(qū)結構發(fā)現(xiàn)算法30-36
- 3.3.1 重疊社區(qū)結構發(fā)現(xiàn)研究30-32
- 3.3.2 改進的重疊社區(qū)發(fā)現(xiàn)算法32-33
- 3.3.3 算法偽代碼33-36
- 3.3.4 時間復雜度36
- 3.4 本章小結36-37
- 第四章 基于結構與內容的水軍團體識別37-44
- 4.1 基于內容特征識別水軍問題分析37
- 4.2 總體方案37-38
- 4.3 內容特征的提取38-43
- 4.3.1 主題模型簡介39-41
- 4.3.2 相似度計算41-43
- 4.4 最終水軍團體的確定43
- 4.5 本章小結43-44
- 第五章 實驗44-52
- 5.1 實驗準備44-47
- 5.1.1 實驗數(shù)據(jù)集44-46
- 5.1.2 數(shù)據(jù)集的處理46
- 5.1.3 實驗環(huán)境46-47
- 5.2 重疊社區(qū)的發(fā)現(xiàn)47-48
- 5.2.1 建立轉發(fā)關系網(wǎng)絡47
- 5.2.2 評價指標47
- 5.2.3 實驗結果及分析47-48
- 5.3 LDA參數(shù)的確定48-49
- 5.4 水軍識別實驗與分析49-51
- 5.4.1 實驗評估標準49
- 5.4.2 實驗及結果分析49-51
- 5.5 本章小結51-52
- 第六章 研究工作總結與展望52-54
- 6.1 研究工作總結52
- 6.2 未來的研究內容展望52-54
- 參考文獻54-57
- 附錄1 攻讀碩士學位期間撰寫的論文57-58
- 致謝58
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 ;基于位置的手機社交網(wǎng)絡“貝多”正式發(fā)布[J];中國新通信;2008年06期
2 曹增輝;;社交網(wǎng)絡更偏向于用戶工具[J];信息網(wǎng)絡;2009年11期
3 ;美國:印刷企業(yè)青睞社交網(wǎng)絡營銷新方式[J];中國包裝工業(yè);2010年Z1期
4 李智惠;柳承燁;;韓國移動社交網(wǎng)絡服務的類型分析與促進方案[J];現(xiàn)代傳播(中國傳媒大學學報);2010年08期
5 賈富;;改變一切的社交網(wǎng)絡[J];互聯(lián)網(wǎng)天地;2011年04期
6 譚拯;;社交網(wǎng)絡:連接與發(fā)現(xiàn)[J];廣東通信技術;2011年07期
7 陳一舟;;社交網(wǎng)絡的發(fā)展趨勢[J];傳媒;2011年12期
8 殷樂;;全球社交網(wǎng)絡新態(tài)勢及文化影響[J];新聞與寫作;2012年01期
9 許麗;;社交網(wǎng)絡:孤獨年代的集體狂歡[J];上海信息化;2012年09期
10 李玲麗;吳新年;;科研社交網(wǎng)絡的發(fā)展現(xiàn)狀及趨勢分析[J];圖書館學研究;2013年01期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 趙云龍;李艷兵;;社交網(wǎng)絡用戶的人格預測與關系強度研究[A];第七屆(2012)中國管理學年會商務智能分會場論文集(選編)[C];2012年
2 宮廣宇;李開軍;;對社交網(wǎng)絡中信息傳播的分析和思考——以人人網(wǎng)為例[A];首屆華中地區(qū)新聞與傳播學科研究生學術論壇獲獎論文[C];2010年
3 楊子鵬;喬麗娟;王夢思;楊雪迎;孟子冰;張禹;;社交網(wǎng)絡與大學生焦慮緩解[A];心理學與創(chuàng)新能力提升——第十六屆全國心理學學術會議論文集[C];2013年
4 畢雪梅;;體育虛擬社區(qū)中的體育社交網(wǎng)絡解析[A];第九屆全國體育科學大會論文摘要匯編(4)[C];2011年
5 杜p,
本文編號:988876
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/988876.html