基于多粒度圖卷積網(wǎng)絡(luò)的假新聞檢測
發(fā)布時間:2021-11-05 09:05
互聯(lián)網(wǎng)社交平臺的迅速崛起,極大提升了網(wǎng)絡(luò)信息傳播的效率,但傳播途徑的便捷也助長了虛假新聞的生成和傳播。假新聞不僅會使媒體的可信度減弱,還可能危害政治和經(jīng)濟等領(lǐng)域,造成社會秩序的混亂,影響人們的正常生活。從繁雜的網(wǎng)絡(luò)內(nèi)容中自動檢測出假新聞是一個亟需解決的實際自然語言處理問題,具有減輕甚至消除假新聞負面影響的積極意義。假新聞是指帶有不真實成分的言論或報道,事件的實情往往與描述有所出入,常因政治或經(jīng)濟利益被發(fā)布,較難對其進行準確識別。由于推特、微博等社交平臺的新聞內(nèi)容較為簡短,僅考慮新聞內(nèi)容及其語言特征,無法取得令人滿意的檢測效果,需高效準確的模型對該類新聞進行檢測識別。利用有限的信息進行虛假新聞的自動檢測識別是目前假新聞檢測領(lǐng)域的一個重大挑戰(zhàn)。為利用有限的信息提升檢測性能,已有的大部分研究基于樣本間的獨立性假設(shè)開展,將文本與其他非本文特征同時輸入模型編碼學習,通常忽略了新聞間的相似性,這一可能提升分類表現(xiàn)的因素。本文主要研究了新聞內(nèi)容較為簡短的情況下,有效利用豐富的非文本信息輔助假新聞檢測的問題。由于網(wǎng)絡(luò)社交平臺的文本更為簡短,具有信息內(nèi)容含量少、表達形式多樣和結(jié)構(gòu)成分不完整的特點,為充分...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 虛假新聞檢測
1.2.2 網(wǎng)絡(luò)表示學習
1.3 主要研究內(nèi)容及組織結(jié)構(gòu)
1.3.1 主要研究內(nèi)容
1.3.2 論文的組織結(jié)構(gòu)
第2章 假新聞檢測相關(guān)技術(shù)
2.1 文本特征表示
2.1.1 基于向量空間模型
2.1.2 基于主題模型
2.1.3 基于神經(jīng)網(wǎng)絡(luò)的模型
2.2 假新聞檢測算法
2.2.1 文本分類技術(shù)
2.2.2 典型檢測模型
2.3 注意力機制
2.4 圖神經(jīng)網(wǎng)絡(luò)
2.4.1 圖表示學習定義
2.4.2 圖卷積神經(jīng)網(wǎng)絡(luò)
2.5 本章小結(jié)
第3章 多粒度圖卷積網(wǎng)絡(luò)的新聞檢測框架
3.1 基于圖卷積網(wǎng)絡(luò)的假新聞檢測
3.1.1 任務(wù)描述
3.1.2 新聞節(jié)點表示學習
3.2 改進的多粒度圖卷積網(wǎng)絡(luò)
3.2.1 關(guān)系圖的構(gòu)建
3.2.2 模型訓練
3.3 多粒度特征信息的融合
3.4 本章小結(jié)
第4章 模型驗證及結(jié)果分析
4.1 實驗數(shù)據(jù)
4.2 實驗設(shè)置
4.2.1 數(shù)據(jù)預處理
4.2.2 參數(shù)設(shè)置
4.2.3 評價指標
4.3 實驗結(jié)果
4.3.1 檢測結(jié)果對比
4.3.2 不同輔助信息的影響
4.3.3 參數(shù)敏感性分析
4.3.4 模型可視化結(jié)果
4.4 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其他成果
致謝
【參考文獻】:
期刊論文
[1]歐美新聞事實核查技術(shù)應(yīng)用及趨勢[J]. 楊麗萍. 中國傳媒科技. 2018(06)
[2]融合多模態(tài)特征的社會多媒體謠言檢測技術(shù)研究[J]. 金志威,曹娟,王博,王蕊,張勇東. 南京信息工程大學學報(自然科學版). 2017(06)
[3]網(wǎng)絡(luò)表示學習綜述[J]. 涂存超,楊成,劉知遠,孫茂松. 中國科學:信息科學. 2017(08)
[4]微博謠言識別研究[J]. 賀剛,呂學強,李卓,徐麗萍. 圖書情報工作. 2013(23)
[5]微博短文本預處理及學習研究綜述[J]. 王連喜. 圖書情報工作. 2013(11)
[6]基于LDA的微博文本主題建模方法研究述評[J]. 張培晶,宋蕾. 圖書情報工作. 2012(24)
[7]基于潛在語義分析的微博主題挖掘模型研究[J]. 唐曉波,王洪艷. 圖書情報工作. 2012(24)
[8]基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 路榮,項亮,劉明榮,楊青. 模式識別與人工智能. 2012(03)
[9]文本自動分類技術(shù)研究綜述[J]. 龐觀松,蔣盛益. 情報理論與實踐. 2012(02)
博士論文
[1]面向中文文本的欺騙行為檢測研究[D]. 張虎.山西大學 2014
碩士論文
[1]基于向量空間模型的中文文本相似度算法研究[D]. 陳飛宏.電子科技大學 2011
本文編號:3477503
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 虛假新聞檢測
1.2.2 網(wǎng)絡(luò)表示學習
1.3 主要研究內(nèi)容及組織結(jié)構(gòu)
1.3.1 主要研究內(nèi)容
1.3.2 論文的組織結(jié)構(gòu)
第2章 假新聞檢測相關(guān)技術(shù)
2.1 文本特征表示
2.1.1 基于向量空間模型
2.1.2 基于主題模型
2.1.3 基于神經(jīng)網(wǎng)絡(luò)的模型
2.2 假新聞檢測算法
2.2.1 文本分類技術(shù)
2.2.2 典型檢測模型
2.3 注意力機制
2.4 圖神經(jīng)網(wǎng)絡(luò)
2.4.1 圖表示學習定義
2.4.2 圖卷積神經(jīng)網(wǎng)絡(luò)
2.5 本章小結(jié)
第3章 多粒度圖卷積網(wǎng)絡(luò)的新聞檢測框架
3.1 基于圖卷積網(wǎng)絡(luò)的假新聞檢測
3.1.1 任務(wù)描述
3.1.2 新聞節(jié)點表示學習
3.2 改進的多粒度圖卷積網(wǎng)絡(luò)
3.2.1 關(guān)系圖的構(gòu)建
3.2.2 模型訓練
3.3 多粒度特征信息的融合
3.4 本章小結(jié)
第4章 模型驗證及結(jié)果分析
4.1 實驗數(shù)據(jù)
4.2 實驗設(shè)置
4.2.1 數(shù)據(jù)預處理
4.2.2 參數(shù)設(shè)置
4.2.3 評價指標
4.3 實驗結(jié)果
4.3.1 檢測結(jié)果對比
4.3.2 不同輔助信息的影響
4.3.3 參數(shù)敏感性分析
4.3.4 模型可視化結(jié)果
4.4 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其他成果
致謝
【參考文獻】:
期刊論文
[1]歐美新聞事實核查技術(shù)應(yīng)用及趨勢[J]. 楊麗萍. 中國傳媒科技. 2018(06)
[2]融合多模態(tài)特征的社會多媒體謠言檢測技術(shù)研究[J]. 金志威,曹娟,王博,王蕊,張勇東. 南京信息工程大學學報(自然科學版). 2017(06)
[3]網(wǎng)絡(luò)表示學習綜述[J]. 涂存超,楊成,劉知遠,孫茂松. 中國科學:信息科學. 2017(08)
[4]微博謠言識別研究[J]. 賀剛,呂學強,李卓,徐麗萍. 圖書情報工作. 2013(23)
[5]微博短文本預處理及學習研究綜述[J]. 王連喜. 圖書情報工作. 2013(11)
[6]基于LDA的微博文本主題建模方法研究述評[J]. 張培晶,宋蕾. 圖書情報工作. 2012(24)
[7]基于潛在語義分析的微博主題挖掘模型研究[J]. 唐曉波,王洪艷. 圖書情報工作. 2012(24)
[8]基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 路榮,項亮,劉明榮,楊青. 模式識別與人工智能. 2012(03)
[9]文本自動分類技術(shù)研究綜述[J]. 龐觀松,蔣盛益. 情報理論與實踐. 2012(02)
博士論文
[1]面向中文文本的欺騙行為檢測研究[D]. 張虎.山西大學 2014
碩士論文
[1]基于向量空間模型的中文文本相似度算法研究[D]. 陳飛宏.電子科技大學 2011
本文編號:3477503
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3477503.html
最近更新
教材專著