面向虛假新聞識(shí)別的主動(dòng)學(xué)習(xí)算法研究與應(yīng)用
發(fā)布時(shí)間:2023-06-08 22:40
信息化時(shí)代方便了人們通過(guò)各種渠道獲取新聞,同時(shí)也使虛假新聞以前所未有的速度快速傳播著。虛假新聞的發(fā)布者一般持有特定的目的,如影響輿論或欺騙大眾。人為識(shí)別虛假新聞需要依據(jù)大量的事實(shí),代價(jià)十分昂貴,機(jī)器學(xué)習(xí)方法的引入為虛假新聞的識(shí)別提供了有效途徑。傳統(tǒng)的監(jiān)督學(xué)習(xí)方式往往需要足夠數(shù)量合格的正反實(shí)例,而對(duì)于虛假新聞來(lái)說(shuō),建立大型的虛假新聞數(shù)據(jù)集是相當(dāng)困難的,并且由于虛假新聞表現(xiàn)形式的多樣性,即使搜集大量的證據(jù),也未必能區(qū)分一條新聞的真假。因此研究能夠通過(guò)少量訓(xùn)練集識(shí)別虛假新聞的機(jī)制是必要的。此外,很多研究者對(duì)于能否通過(guò)文本特征識(shí)別虛假新聞存疑。針對(duì)上述問(wèn)題,本文從主動(dòng)學(xué)習(xí)和虛假新聞文本特征提取這兩個(gè)方面展開(kāi)了研究,本文主要貢獻(xiàn)如下:(1)針對(duì)虛假新聞危害的嚴(yán)重性,本文研究了基于內(nèi)容的虛假新聞識(shí)別。在新聞發(fā)布之前,社交媒體平臺(tái)根據(jù)新聞文本特征判斷新聞的真實(shí)性,有利于在源頭上制止部分虛假新聞的傳播。文中說(shuō)明了基于內(nèi)容識(shí)別的相關(guān)原因,并詳細(xì)分析了真假新聞之間的文本特征區(qū)別。(2)針對(duì)初始集質(zhì)量對(duì)分類器的重要性,以及在當(dāng)前新聞表示下,新聞實(shí)例分布的復(fù)雜性,提出基于中心點(diǎn)選擇的初始集算法,設(shè)計(jì)不同的類中...
【文章頁(yè)數(shù)】:79 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 引言
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)
2 相關(guān)工作
2.1 基于內(nèi)容的虛假新聞識(shí)別
2.1.1 相關(guān)研究
2.1.2 真假新聞文本特征區(qū)別
2.1.3 文本特征提取
2.2 主動(dòng)學(xué)習(xí)
2.2.1 相關(guān)研究
2.2.2 主動(dòng)學(xué)習(xí)框架
2.2.3 初始集選擇和不確定性采樣
2.3 本章總結(jié)
3 基于中心點(diǎn)選擇的初始集算法
3.1 初始集算法描述
3.2 類中心點(diǎn)的確定
3.2.1 類中心點(diǎn)策略描述
3.2.2 k中心點(diǎn)策略
3.3 初始集選取策略
3.3.1 基于聚類的初始集選擇機(jī)制
3.3.2 基于k中心點(diǎn)的初始集選擇機(jī)制
3.4 基于初始集選擇的主動(dòng)學(xué)習(xí)算法
3.5 本章總結(jié)
4 基于異常點(diǎn)處理的主動(dòng)學(xué)習(xí)算法
4.1 識(shí)別算法描述
4.2 學(xué)習(xí)引擎算法的選擇
4.3 選擇引擎異常點(diǎn)處理關(guān)鍵策略
4.3.1 均值處理
4.3.2 相似性處理
4.4 本章總結(jié)
5 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
5.1 數(shù)據(jù)集描述
5.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
5.3 Basic AL與其他經(jīng)典分類方法對(duì)比
5.3.1 實(shí)驗(yàn)設(shè)計(jì)
5.3.2 實(shí)驗(yàn)結(jié)果及分析
5.3.3 其他因素影響
5.4 初始集算法對(duì)比
5.4.1 實(shí)驗(yàn)設(shè)計(jì)
5.4.2 實(shí)驗(yàn)結(jié)果及分析
5.4.3 其他因素影響
5.5 異常點(diǎn)算法對(duì)比
5.5.1 實(shí)驗(yàn)設(shè)計(jì)
5.5.2 Mean AL實(shí)驗(yàn)結(jié)果及分析
5.5.3 SimAL實(shí)驗(yàn)結(jié)果及分析
5.5.4 加入初始集算法的異常點(diǎn)處理實(shí)驗(yàn)結(jié)果及分析
5.6 本章總結(jié)
6 總結(jié)與展望
6.1 結(jié)論
6.2 未來(lái)期望
參考文獻(xiàn)
作者簡(jiǎn)歷及攻讀碩士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集
本文編號(hào):3832636
【文章頁(yè)數(shù)】:79 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 引言
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
1.4 本文組織結(jié)構(gòu)
2 相關(guān)工作
2.1 基于內(nèi)容的虛假新聞識(shí)別
2.1.1 相關(guān)研究
2.1.2 真假新聞文本特征區(qū)別
2.1.3 文本特征提取
2.2 主動(dòng)學(xué)習(xí)
2.2.1 相關(guān)研究
2.2.2 主動(dòng)學(xué)習(xí)框架
2.2.3 初始集選擇和不確定性采樣
2.3 本章總結(jié)
3 基于中心點(diǎn)選擇的初始集算法
3.1 初始集算法描述
3.2 類中心點(diǎn)的確定
3.2.1 類中心點(diǎn)策略描述
3.2.2 k中心點(diǎn)策略
3.3 初始集選取策略
3.3.1 基于聚類的初始集選擇機(jī)制
3.3.2 基于k中心點(diǎn)的初始集選擇機(jī)制
3.4 基于初始集選擇的主動(dòng)學(xué)習(xí)算法
3.5 本章總結(jié)
4 基于異常點(diǎn)處理的主動(dòng)學(xué)習(xí)算法
4.1 識(shí)別算法描述
4.2 學(xué)習(xí)引擎算法的選擇
4.3 選擇引擎異常點(diǎn)處理關(guān)鍵策略
4.3.1 均值處理
4.3.2 相似性處理
4.4 本章總結(jié)
5 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
5.1 數(shù)據(jù)集描述
5.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
5.3 Basic AL與其他經(jīng)典分類方法對(duì)比
5.3.1 實(shí)驗(yàn)設(shè)計(jì)
5.3.2 實(shí)驗(yàn)結(jié)果及分析
5.3.3 其他因素影響
5.4 初始集算法對(duì)比
5.4.1 實(shí)驗(yàn)設(shè)計(jì)
5.4.2 實(shí)驗(yàn)結(jié)果及分析
5.4.3 其他因素影響
5.5 異常點(diǎn)算法對(duì)比
5.5.1 實(shí)驗(yàn)設(shè)計(jì)
5.5.2 Mean AL實(shí)驗(yàn)結(jié)果及分析
5.5.3 SimAL實(shí)驗(yàn)結(jié)果及分析
5.5.4 加入初始集算法的異常點(diǎn)處理實(shí)驗(yàn)結(jié)果及分析
5.6 本章總結(jié)
6 總結(jié)與展望
6.1 結(jié)論
6.2 未來(lái)期望
參考文獻(xiàn)
作者簡(jiǎn)歷及攻讀碩士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集
本文編號(hào):3832636
本文鏈接:http://sikaile.net/xinwenchuanbolunwen/3832636.html
最近更新
教材專著