天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

微博網(wǎng)絡(luò)水軍識別技術(shù)研究

發(fā)布時(shí)間:2017-05-13 11:08

  本文關(guān)鍵詞:微博網(wǎng)絡(luò)水軍識別技術(shù)研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來,以微博為代表的社會(huì)化媒體成為熱點(diǎn)信息傳播的重要平臺。同時(shí),網(wǎng)絡(luò)中活躍的大量水軍用戶受利益驅(qū)動(dòng),散布網(wǎng)絡(luò)謠言與虛假信息,嚴(yán)重干擾正常的網(wǎng)絡(luò)秩序,影響社會(huì)和諧穩(wěn)定。目前,針對微博網(wǎng)絡(luò)中水軍用戶識別的研究,主要存在以下問題:(1)傳統(tǒng)傳播模型刻畫不夠準(zhǔn)確,無法有效發(fā)現(xiàn)水軍的存在;(2)網(wǎng)絡(luò)水軍隱藏策略的升級,使傳統(tǒng)基于內(nèi)容與基于行為的識別方法對新型水軍識別準(zhǔn)確率低;(3)微博用戶數(shù)據(jù)存在海量高維問題,同時(shí)現(xiàn)實(shí)中常伴有數(shù)值缺失,使得現(xiàn)有算法無法實(shí)現(xiàn)高效檢測。針對以上問題,本文從微博網(wǎng)絡(luò)結(jié)構(gòu)與傳統(tǒng)信息傳播模型入手,分析了影響網(wǎng)絡(luò)信息傳播的幾大因素,建立一種基于局域信息的微博網(wǎng)絡(luò)信息傳播模型,并通過分析正常傳播與水軍鼓動(dòng)的非正常傳播的差異,實(shí)現(xiàn)對水軍群體的定位。然后通過對傳播者用戶關(guān)系網(wǎng)絡(luò)的分析,提出一種融合關(guān)系圖特征的微博水軍識別方法,對新型微博造勢水軍有更好的識別效果。最后,為解決微博用戶數(shù)據(jù)的海量高維性對識別時(shí)間的挑戰(zhàn)以及存在的數(shù)值缺失問題,提出一種基于MapReduce隨機(jī)森林的微博水軍識別算法,提高對網(wǎng)絡(luò)水軍的識別效率。主要工作和研究成果如下:1.針對傳統(tǒng)傳播模型刻畫不準(zhǔn)確的問題,提出一種基于局域信息的微博網(wǎng)絡(luò)信息傳播模型。該模型中引入網(wǎng)絡(luò)結(jié)構(gòu)中的局域信息,同時(shí)考慮到每個(gè)傳播者的影響力差異,從而細(xì)粒度展現(xiàn)信息傳播過程,通過觀察微博網(wǎng)絡(luò)中用戶個(gè)體對傳播路徑的影響,發(fā)現(xiàn)網(wǎng)絡(luò)中摻雜水軍干擾的非正常信息傳播,為微博網(wǎng)絡(luò)中的水軍識別和管控防范策略的制定奠定基礎(chǔ)。2.傳統(tǒng)基于用戶內(nèi)容特征和行為特征的識別方法對新型造勢水軍識別率低,針對該問題,提出一種用戶關(guān)系圖特征表示與提取方法,并在貝葉斯網(wǎng)絡(luò)、C4.5決策樹和樸素貝葉斯三種常用的機(jī)器學(xué)習(xí)框架下融合包括關(guān)系圖特征在內(nèi)的多種特征識別水軍用戶,通過實(shí)驗(yàn)驗(yàn)證了方法的有效性。仿真結(jié)果表明,添加關(guān)系圖特征后對水軍賬號的識別準(zhǔn)確率、召回率提高5%以上,從而驗(yàn)證了關(guān)系圖特征在水軍識別中的有效性。3.針對水軍識別中存在特征項(xiàng)缺失和用戶數(shù)據(jù)量龐大的問題,提出一種基于MapReduce隨機(jī)森林的微博水軍識別算法。利用隨機(jī)森林算法的隨機(jī)性解決水軍識別中的過擬合和特征項(xiàng)的數(shù)值缺失問題;通過采用MapReduce模型實(shí)現(xiàn)算法的并行化,提高對水軍數(shù)據(jù)的處理速度,以更好的滿足輿論熱點(diǎn)事件中對水軍檢測的實(shí)時(shí)性要求。仿真實(shí)驗(yàn)表明,該算法可以獲得近似線性的加速比,有效提高水軍識別的時(shí)間效率,同時(shí)對數(shù)據(jù)缺失問題有較好的魯棒性,較RBF神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)算法準(zhǔn)確率提高10%。
【關(guān)鍵詞】:微博網(wǎng)絡(luò) 網(wǎng)絡(luò)水軍 信息傳播模型 關(guān)系圖 機(jī)器學(xué)習(xí) MapReduce 隨機(jī)森林
【學(xué)位授予單位】:解放軍信息工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.08
【目錄】:
  • 摘要4-5
  • ABSTRACT5-12
  • 第一章 緒論12-20
  • 1.1 研究背景和意義12-13
  • 1.2 國內(nèi)外研究現(xiàn)狀13-16
  • 1.2.1 信息傳播研究現(xiàn)狀14-15
  • 1.2.2 水軍識別研究現(xiàn)狀15-16
  • 1.3 問題提出16-17
  • 1.4 本文主要內(nèi)容和章節(jié)安排17-20
  • 1.4.1 主要內(nèi)容17-19
  • 1.4.2 章節(jié)安排19-20
  • 第二章 微博網(wǎng)絡(luò)傳播及其水軍識別概述20-24
  • 2.1 微博網(wǎng)絡(luò)傳播方式20-21
  • 2.2 微博水軍識別技術(shù)21-24
  • 2.2.1 內(nèi)容檢測21-22
  • 2.2.2 用戶行為分析22-23
  • 2.2.3 人工標(biāo)注23-24
  • 第三章 基于局域信息的微博網(wǎng)絡(luò)信息傳播模型24-34
  • 3.1 引言24
  • 3.2 相關(guān)工作24-25
  • 3.3 信息傳播特征分析25-26
  • 3.3.1 正常情況的信息傳播25-26
  • 3.3.2 水軍干擾的信息傳播26
  • 3.4 基于局域信息的微博網(wǎng)絡(luò)信息傳播模型26-29
  • 3.4.1 模型建立26-27
  • 3.4.2 傳播機(jī)制及符號說明27
  • 3.4.3 模型推導(dǎo)27-29
  • 3.4.4 考慮感染概率隨用戶影響力遞變的影響29
  • 3.5 實(shí)驗(yàn)分析29-33
  • 3.5.1 實(shí)驗(yàn)數(shù)據(jù)29-30
  • 3.5.2 微博網(wǎng)絡(luò)對比實(shí)驗(yàn)30-31
  • 3.5.3 參數(shù)敏感性對比實(shí)驗(yàn)31-33
  • 3.6 本章小結(jié)33-34
  • 第四章 基于關(guān)系圖特征的微博水軍識別方法34-48
  • 4.1 引言34
  • 4.2 相關(guān)工作34
  • 4.3 用戶關(guān)系圖特征34-40
  • 4.3.1 用戶關(guān)系圖34-36
  • 4.3.2 圖特征提取36-38
  • 4.3.3 其他特征38-40
  • 4.4 基于關(guān)系圖特征的水軍識別方法40-42
  • 4.4.1 樸素貝葉斯算法40-41
  • 4.4.2 貝葉斯網(wǎng)絡(luò)41
  • 4.4.3 C4.5決策樹41-42
  • 4.5 實(shí)驗(yàn)分析42-46
  • 4.5.1 實(shí)驗(yàn)數(shù)據(jù)42-43
  • 4.5.2 評價(jià)指標(biāo)43
  • 4.5.3 實(shí)驗(yàn)結(jié)果與分析43-46
  • 4.6 本章小結(jié)46-48
  • 第五章 基于MapReduce隨機(jī)森林的微博水軍識別算法48-60
  • 5.1 引言48
  • 5.2 相關(guān)工作48-49
  • 5.2.1 MapReduce48-49
  • 5.2.2 隨機(jī)森林的基本思想49
  • 5.3 基于MapReduce隨機(jī)森林的水軍識別算法設(shè)計(jì)49-55
  • 5.3.1 用戶特征向量50-51
  • 5.3.2 屬性選擇度量51-52
  • 5.3.3 算法設(shè)計(jì)52-54
  • 5.3.4 算法分析54-55
  • 5.4 實(shí)驗(yàn)分析55-59
  • 5.4.1 實(shí)驗(yàn)準(zhǔn)備55
  • 5.4.2 評價(jià)指標(biāo)55-56
  • 5.4.3 結(jié)果與分析56-59
  • 5.5 本章小結(jié)59-60
  • 第六章 總結(jié)與展望60-62
  • 6.1 全文總結(jié)60
  • 6.2 本文的主要?jiǎng)?chuàng)新點(diǎn)60-61
  • 6.3 未來研究工作展望61-62
  • 致謝62-64
  • 參考文獻(xiàn)64-68
  • 作者簡歷攻讀碩士學(xué)位期間完成的主要工作68

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 劉足華;熊惠霖;;基于隨機(jī)森林的目標(biāo)檢測與定位[J];計(jì)算機(jī)工程;2012年13期

2 董師師;黃哲學(xué);;隨機(jī)森林理論淺析[J];集成技術(shù);2013年01期

3 王象剛;;基于K均值隨機(jī)森林快速算法及入侵檢測中的應(yīng)用[J];科技通報(bào);2013年08期

4 陳姝;彭小寧;;基于粒子濾波和在線隨機(jī)森林分類的目標(biāo)跟蹤[J];江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年02期

5 羅知林;陳挺;蔡皖東;;一個(gè)基于隨機(jī)森林的微博轉(zhuǎn)發(fā)預(yù)測算法[J];計(jì)算機(jī)科學(xué);2014年04期

6 王麗婷;丁曉青;方馳;;基于隨機(jī)森林的人臉關(guān)鍵點(diǎn)精確定位方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年04期

7 李建更;高志坤;;隨機(jī)森林針對小樣本數(shù)據(jù)類權(quán)重設(shè)置[J];計(jì)算機(jī)工程與應(yīng)用;2009年26期

8 張建;武東英;劉慧生;;基于隨機(jī)森林的流量分類方法[J];信息工程大學(xué)學(xué)報(bào);2012年05期

9 吳華芹;;基于訓(xùn)練集劃分的隨機(jī)森林算法[J];科技通報(bào);2013年10期

10 張華偉;王明文;甘麗新;;基于隨機(jī)森林的文本分類模型研究[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2006年03期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前7條

1 謝程利;王金橋;盧漢清;;核森林及其在目標(biāo)檢測中的應(yīng)用[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年

2 武曉巖;方慶偉;;基因表達(dá)數(shù)據(jù)分析的隨機(jī)森林方法及算法改進(jìn)[A];黑龍江省第十次統(tǒng)計(jì)科學(xué)討論會(huì)論文集[C];2008年

3 張?zhí)忑?梁龍;王康;李華;;隨機(jī)森林結(jié)合激光誘導(dǎo)擊穿光譜技術(shù)用于的鋼鐵分類[A];中國化學(xué)會(huì)第29屆學(xué)術(shù)年會(huì)摘要集——第19分會(huì):化學(xué)信息學(xué)與化學(xué)計(jì)量學(xué)[C];2014年

4 相玉紅;張卓勇;;組蛋白去乙;敢种苿┑臉(gòu)效關(guān)系研究[A];第十一屆全國計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2011年

5 張濤;李貞子;武曉巖;李康;;隨機(jī)森林回歸分析方法及在代謝組學(xué)中的應(yīng)用[A];2011年中國衛(wèi)生統(tǒng)計(jì)學(xué)年會(huì)會(huì)議論文集[C];2011年

6 馮飛翔;馮輔周;江鵬程;劉菁;劉建敏;;隨機(jī)森林和k-近鄰法在某型坦克變速箱狀態(tài)識別中的應(yīng)用[A];第八屆全國轉(zhuǎn)子動(dòng)力學(xué)學(xué)術(shù)討論會(huì)論文集[C];2008年

7 曹東升;許青松;梁逸曾;陳憲;李洪東;;組合樹的集合體和后向消除策略去分類P-糖蛋白化合物[A];第十屆全國計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2009年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條

1 曹正鳳;隨機(jī)森林算法優(yōu)化研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2014年

2 雷震;隨機(jī)森林及其在遙感影像處理中應(yīng)用研究[D];上海交通大學(xué);2012年

3 岳明;基于隨機(jī)森林和規(guī)則集成法的酒類市場預(yù)測與發(fā)展戰(zhàn)略[D];天津大學(xué);2008年

4 李書艷;單點(diǎn)氨基酸多態(tài)性與疾病相關(guān)關(guān)系的預(yù)測及其機(jī)制研究[D];蘭州大學(xué);2010年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 錢維;藥品不良反應(yīng)監(jiān)測中隨機(jī)森林方法的建立與實(shí)現(xiàn)[D];第二軍醫(yī)大學(xué);2012年

2 賀捷;隨機(jī)森林在文本分類中的應(yīng)用[D];華南理工大學(xué);2015年

3 張文婷;交通環(huán)境下基于改進(jìn)霍夫森林的目標(biāo)檢測與跟蹤[D];華南理工大學(xué);2015年

4 楊畢玉;核電站松動(dòng)件檢測分析研究[D];浙江大學(xué);2016年

5 王宇恒;推薦系統(tǒng)中隨機(jī)森林算法的優(yōu)化與應(yīng)用[D];浙江大學(xué);2016年

6 張玉桃;旅客社會(huì)網(wǎng)絡(luò)中的家庭出行預(yù)測及其行為特征分析[D];北京交通大學(xué);2016年

7 張興;基于Spark大數(shù)據(jù)平臺的火電廠節(jié)能分析[D];太原理工大學(xué);2016年

8 蔡曉路;基于隨機(jī)森林的類風(fēng)濕關(guān)節(jié)炎證型判別模型研究[D];北京中醫(yī)藥大學(xué);2016年

9 楊麗;音頻場景分析與識別方法研究[D];南京大學(xué);2013年

10 朱琪;基于最大平衡度與最大共識的改進(jìn)隨機(jī)森林算法研究[D];吉林大學(xué);2016年


  本文關(guān)鍵詞:微博網(wǎng)絡(luò)水軍識別技術(shù)研究,,由筆耕文化傳播整理發(fā)布。



本文編號:362394

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/362394.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b9772***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com