社交網(wǎng)絡(luò)謠言的及時(shí)檢測(cè)和分析
本文關(guān)鍵詞:社交網(wǎng)絡(luò)謠言的及時(shí)檢測(cè)和分析
更多相關(guān)文章: 社交網(wǎng)絡(luò) 數(shù)據(jù)挖掘 謠言 自然語言處理
【摘要】:社交網(wǎng)絡(luò)在我們的現(xiàn)代生活中扮演著非常大的作用,且隨著現(xiàn)代網(wǎng)絡(luò)的不斷提速以及聯(lián)網(wǎng)終端設(shè)備的逐漸普及,各種各樣多元化的信息充斥在社交網(wǎng)絡(luò)平臺(tái)上,隨之而來的一個(gè)問題是謠言很可能在這種環(huán)境里孕育并進(jìn)行大規(guī)模傳播,甚至造成一定的社會(huì)恐慌。但社交網(wǎng)絡(luò)用戶的專業(yè)性以及目前社交平臺(tái)謠言檢測(cè)的機(jī)制都不足以及時(shí)發(fā)現(xiàn)和組織平臺(tái)上謠言的傳播。因而本文提出了一個(gè)基于社交網(wǎng)絡(luò)平臺(tái)的謠言的自動(dòng)檢測(cè)框架,并用在新浪微博平臺(tái)上盡可能早的檢測(cè)出謠言。本文實(shí)驗(yàn)的目標(biāo)是在給定大范圍話題(關(guān)鍵詞)的前提下,進(jìn)行可疑子話題的分析與檢測(cè),其工作主要分為兩個(gè)部分,一是可疑子話題的檢測(cè),二是對(duì)檢測(cè)出的可疑子話題進(jìn)行可信度的分析。具體的思路主要是,在給定大范圍話題的前提下,每隔固定檢測(cè)時(shí)間從新浪微博平臺(tái)上進(jìn)行數(shù)據(jù)的爬取,將爬取下來的數(shù)據(jù)進(jìn)行分詞、詞向量訓(xùn)練等基本處理后,利用詞與詞之間的相似性進(jìn)行聚類操作,得到當(dāng)前時(shí)段內(nèi)的所有子話題,之后根據(jù)子話題被懷疑的程度進(jìn)行篩選排序,初步篩選出存在謠言可能性的子話題。在這之后的工作主要是通過抽取子話題中微博的相關(guān)特征,包括微博用戶、微博內(nèi)容以及微博在傳播時(shí)的相關(guān)特征進(jìn)行子話題可信度的建模分析,篩選出最有概率成為謠言的子話題。綜上所述,本文就給定關(guān)鍵詞時(shí)可疑子話題的檢測(cè)、子話題的可信度分析探討和分析,并就分析和檢測(cè)的及時(shí)性進(jìn)行了探索和實(shí)踐。本實(shí)驗(yàn)算法框架在真實(shí)的數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn),結(jié)果表明,本文工作在社交網(wǎng)絡(luò)平臺(tái)上謠言的及時(shí)分析和檢測(cè)上取得了不錯(cuò)的效果。
【關(guān)鍵詞】:社交網(wǎng)絡(luò) 數(shù)據(jù)挖掘 謠言 自然語言處理
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:G206
【目錄】:
- 摘要4-5
- Abstract5-11
- 第1章 緒論11-20
- 1.1 課題背景11-14
- 1.1.1 微博的產(chǎn)生發(fā)展以及傳播11-12
- 1.1.2 微博可信度分析12-14
- 1.2 相關(guān)工作14-17
- 1.2.1 互聯(lián)網(wǎng)信息可信度14-15
- 1.2.2 微博信息可信度15-16
- 1.2.3 微博話題檢測(cè)16-17
- 1.3 本文工作及結(jié)構(gòu)17-19
- 1.3.1 本文工作17-19
- 1.3.2 本文結(jié)構(gòu)19
- 1.4 本章小結(jié)19-20
- 第2章 微博子話題識(shí)別20-38
- 2.1 微博子話題識(shí)別概述20-21
- 2.2 微博實(shí)時(shí)爬取21-25
- 2.3 微博分詞25-26
- 2.4 詞向量增量訓(xùn)練26-31
- 2.5 詞庫建設(shè)31-32
- 2.6 子話題聚類32-35
- 2.7 子話題篩選排序35-37
- 2.8 本章小結(jié)37-38
- 第3章 微博子話題可信度分析38-50
- 3.1 微博子話題可信度分析概述38-39
- 3.2 特征抽取39-47
- 3.2.1 微博發(fā)布者特征39-41
- 3.2.2 微博內(nèi)容相關(guān)特征41-46
- 3.2.3 微博轉(zhuǎn)發(fā)相關(guān)特征46-47
- 3.3 實(shí)驗(yàn)建模47-49
- 3.3.1 單微博可信度建模47-48
- 3.3.2 子話題可信度建模48-49
- 3.4 本章小結(jié)49-50
- 第4章 實(shí)驗(yàn)分析50-57
- 4.1 實(shí)驗(yàn)總體介紹50
- 4.2 數(shù)據(jù)分析50-51
- 4.3 實(shí)驗(yàn)分析51-56
- 4.4 本章小結(jié)56-57
- 第5章 總結(jié)與展望57-58
- 參考文獻(xiàn)58-61
- 致謝61
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 ;基于位置的手機(jī)社交網(wǎng)絡(luò)“貝多”正式發(fā)布[J];中國新通信;2008年06期
2 曹增輝;;社交網(wǎng)絡(luò)更偏向于用戶工具[J];信息網(wǎng)絡(luò);2009年11期
3 ;美國:印刷企業(yè)青睞社交網(wǎng)絡(luò)營銷新方式[J];中國包裝工業(yè);2010年Z1期
4 李智惠;柳承燁;;韓國移動(dòng)社交網(wǎng)絡(luò)服務(wù)的類型分析與促進(jìn)方案[J];現(xiàn)代傳播(中國傳媒大學(xué)學(xué)報(bào));2010年08期
5 賈富;;改變一切的社交網(wǎng)絡(luò)[J];互聯(lián)網(wǎng)天地;2011年04期
6 譚拯;;社交網(wǎng)絡(luò):連接與發(fā)現(xiàn)[J];廣東通信技術(shù);2011年07期
7 陳一舟;;社交網(wǎng)絡(luò)的發(fā)展趨勢(shì)[J];傳媒;2011年12期
8 殷樂;;全球社交網(wǎng)絡(luò)新態(tài)勢(shì)及文化影響[J];新聞與寫作;2012年01期
9 許麗;;社交網(wǎng)絡(luò):孤獨(dú)年代的集體狂歡[J];上海信息化;2012年09期
10 李玲麗;吳新年;;科研社交網(wǎng)絡(luò)的發(fā)展現(xiàn)狀及趨勢(shì)分析[J];圖書館學(xué)研究;2013年01期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 趙云龍;李艷兵;;社交網(wǎng)絡(luò)用戶的人格預(yù)測(cè)與關(guān)系強(qiáng)度研究[A];第七屆(2012)中國管理學(xué)年會(huì)商務(wù)智能分會(huì)場(chǎng)論文集(選編)[C];2012年
2 宮廣宇;李開軍;;對(duì)社交網(wǎng)絡(luò)中信息傳播的分析和思考——以人人網(wǎng)為例[A];首屆華中地區(qū)新聞與傳播學(xué)科研究生學(xué)術(shù)論壇獲獎(jiǎng)?wù)撐腫C];2010年
3 楊子鵬;喬麗娟;王夢(mèng)思;楊雪迎;孟子冰;張禹;;社交網(wǎng)絡(luò)與大學(xué)生焦慮緩解[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國心理學(xué)學(xué)術(shù)會(huì)議論文集[C];2013年
4 畢雪梅;;體育虛擬社區(qū)中的體育社交網(wǎng)絡(luò)解析[A];第九屆全國體育科學(xué)大會(huì)論文摘要匯編(4)[C];2011年
5 杜p,
本文編號(hào):722283
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/722283.html