社交網(wǎng)絡虛假媒體內(nèi)容檢測研究
發(fā)布時間:2023-02-23 19:12
在互聯(lián)網(wǎng)高度發(fā)達的今天,移動資訊高速流動,微博等社交網(wǎng)絡媒體所涵蓋的信息量正以指數(shù)級的速度增長,并逐漸成為人們分享生活、互動交友和獲取信息的主要平臺之一。然而,在進行信息消費時,由于媒體內(nèi)容自身所擁有的便捷訪問、快速傳播、低成本的特點,使其成為當今我國虛假輿情泛濫的主要策源地和傳播介質,影響人們的日常生活。虛假媒體內(nèi)容檢測技術就是一項針對社交網(wǎng)絡中的海量信息進行挖掘、分析、識別和過濾的技術,能夠及時發(fā)現(xiàn)和處理社交網(wǎng)絡中的虛假媒體內(nèi)容,防止人們在認識事物和生活消費時受到此種信息的誤導。本文主要基于傳統(tǒng)機器學習方法和深度學習方法對社交網(wǎng)絡虛假媒體內(nèi)容進行檢測研究,并構建了性能優(yōu)良的分類模型。具體研究內(nèi)容如下:1)本文利用傳統(tǒng)機器學習方法構建基于集成學習的虛假媒體內(nèi)容分類模型。通過觀察數(shù)據(jù)集結構特點,采集所需數(shù)據(jù),制定對應的文本清洗方法,借助正則表達式抽取微博正文內(nèi)容特征,利用人工拓建的中文情感詞庫提取各微博事件的評論情感傾向性特征,結合用戶特征和傳播特征,構建特征集,并借用常用的機器學習方法,構建基分類器,最后使用Stacking集成方法構建強分類器,實驗結果顯示其準確率達到93.19%,...
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文結構安排
第二章 虛假媒體內(nèi)容檢測的相關技術研究
2.1 文本預處理技術
2.1.1 中文分詞
2.1.2 word2vec詞向量模型
2.2 基于傳統(tǒng)機器學習的文本分類方法
2.2.1 樸素貝葉斯
2.2.2 支持向量機
2.2.3 邏輯回歸
2.2.4 決策樹
2.3 基于深度學習的文本分類方法
2.3.1 RNN及其變體
2.3.2 注意力機制
2.4 集成學習
2.5 模型的評價指標
2.6 本章小結
第三章 基于傳統(tǒng)機器學習的虛假媒體內(nèi)容分類方法
3.1 數(shù)據(jù)獲取及預處理
3.1.1 數(shù)據(jù)獲取及詞庫構建
3.1.2 文本清洗
3.1.3 文本切分處理
3.2 特征工程
3.2.1 特征簡介
3.2.2 表層特征提取
3.2.3 評論情感傾向性特征提取
3.3 基于Stacking集成方法的虛假媒體內(nèi)容檢測模型
3.3.1 模型簡述
3.3.2 虛假媒體內(nèi)容檢測算法
3.4 實驗及結果分析
3.4.1 實驗環(huán)境及評估指標
3.4.2 相關特征的有效性驗證與結果分析
3.4.3 集成分類模型的有效性驗證及結果分析
3.5 本章小結
第四章 基于深度學習的虛假媒體內(nèi)容分類方法
4.1 獲取微博正文和評論文本的詞向量
4.2 基于集成學習的虛假媒體內(nèi)容檢測模型
4.2.1 模型描述
4.2.2 微博正文表示
4.2.3 評論文本表示
4.2.4 基于微博正文和評論文本的虛假媒體內(nèi)容檢測算法
4.3 實驗及結果分析
4.3.1 實驗環(huán)境及評價指標
4.3.2 對比方法介紹
4.3.3 各模型對比實驗
4.4 本章小結
第五章 社交網(wǎng)絡虛假媒體內(nèi)容檢測系統(tǒng)
5.1 需求分析
5.2 可行性分析
5.3 系統(tǒng)詳細設計
5.4 功能模塊設計
5.4.1 話題模塊
5.4.2 邏輯處理模塊
5.4.3 模型計算模塊
5.5 功能演示
5.5.1 系統(tǒng)開發(fā)環(huán)境
5.5.2 話題內(nèi)容的虛假性檢測
5.5.3 模型訓練
5.6 本章小結
第六章 總結與展望
6.1 工作總結
6.2 未來工作展望
致謝
參考文獻
攻讀碩士學位期間取得的成果
本文編號:3748579
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 國外研究現(xiàn)狀
1.2.2 國內(nèi)研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 論文結構安排
第二章 虛假媒體內(nèi)容檢測的相關技術研究
2.1 文本預處理技術
2.1.1 中文分詞
2.1.2 word2vec詞向量模型
2.2 基于傳統(tǒng)機器學習的文本分類方法
2.2.1 樸素貝葉斯
2.2.2 支持向量機
2.2.3 邏輯回歸
2.2.4 決策樹
2.3 基于深度學習的文本分類方法
2.3.1 RNN及其變體
2.3.2 注意力機制
2.4 集成學習
2.5 模型的評價指標
2.6 本章小結
第三章 基于傳統(tǒng)機器學習的虛假媒體內(nèi)容分類方法
3.1 數(shù)據(jù)獲取及預處理
3.1.1 數(shù)據(jù)獲取及詞庫構建
3.1.2 文本清洗
3.1.3 文本切分處理
3.2 特征工程
3.2.1 特征簡介
3.2.2 表層特征提取
3.2.3 評論情感傾向性特征提取
3.3 基于Stacking集成方法的虛假媒體內(nèi)容檢測模型
3.3.1 模型簡述
3.3.2 虛假媒體內(nèi)容檢測算法
3.4 實驗及結果分析
3.4.1 實驗環(huán)境及評估指標
3.4.2 相關特征的有效性驗證與結果分析
3.4.3 集成分類模型的有效性驗證及結果分析
3.5 本章小結
第四章 基于深度學習的虛假媒體內(nèi)容分類方法
4.1 獲取微博正文和評論文本的詞向量
4.2 基于集成學習的虛假媒體內(nèi)容檢測模型
4.2.1 模型描述
4.2.2 微博正文表示
4.2.3 評論文本表示
4.2.4 基于微博正文和評論文本的虛假媒體內(nèi)容檢測算法
4.3 實驗及結果分析
4.3.1 實驗環(huán)境及評價指標
4.3.2 對比方法介紹
4.3.3 各模型對比實驗
4.4 本章小結
第五章 社交網(wǎng)絡虛假媒體內(nèi)容檢測系統(tǒng)
5.1 需求分析
5.2 可行性分析
5.3 系統(tǒng)詳細設計
5.4 功能模塊設計
5.4.1 話題模塊
5.4.2 邏輯處理模塊
5.4.3 模型計算模塊
5.5 功能演示
5.5.1 系統(tǒng)開發(fā)環(huán)境
5.5.2 話題內(nèi)容的虛假性檢測
5.5.3 模型訓練
5.6 本章小結
第六章 總結與展望
6.1 工作總結
6.2 未來工作展望
致謝
參考文獻
攻讀碩士學位期間取得的成果
本文編號:3748579
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3748579.html
最近更新
教材專著