基于多任務(wù)學(xué)習(xí)的假新聞檢測
發(fā)布時間:2022-01-17 16:05
隨著互聯(lián)網(wǎng)的普及,越來越多的人選擇在網(wǎng)絡(luò)上閱讀新聞。不同于傳統(tǒng)新聞媒體,互聯(lián)網(wǎng)新聞有許多新特點(diǎn),如獲取成本低、時效性高等特點(diǎn)。然而,大量包含虛假信息的新聞得以在各種社交媒體上肆意傳播,其大量涌入給互聯(lián)網(wǎng)新聞這一領(lǐng)域帶來了嚴(yán)重的負(fù)面影響。因此,如何識別假新聞,并及時停止其傳播,對構(gòu)造一個良好的互聯(lián)網(wǎng)氛圍至關(guān)重要。假新聞檢測并非易事,其甄別過程往往需要專業(yè)的背景知識,F(xiàn)階段檢測假新聞的主要方式是人工審核,考慮到互聯(lián)網(wǎng)上新聞的數(shù)據(jù)量之大、傳播范圍之廣,人工審核的方式很難解決效率低、時延性高等不可避免的問題。隨著人工智能的發(fā)展,研究者們期望通過人工智能技術(shù)自動地檢測假新聞。然而,互聯(lián)網(wǎng)上傳播的新聞其文本內(nèi)容的長度較短,這使得傳統(tǒng)的基于文本的假新聞檢測方法難以取得滿意的效果。本文研究了基于多任務(wù)學(xué)習(xí)的假新聞檢測問題;ヂ(lián)網(wǎng)新聞往往會在多個社交媒體上發(fā)布與傳播,這些新聞涵蓋了大量不同的主題,傳統(tǒng)的基于手工設(shè)計特征的機(jī)器學(xué)習(xí)方法很難保證設(shè)計特征集的泛化能力?紤]到在一些主題下假新聞出現(xiàn)的概率更大,本文挖掘了新聞的真實(shí)性和新聞的主題之間的內(nèi)在關(guān)聯(lián),并提出了一個基于多任務(wù)學(xué)習(xí)的假新聞檢測模型(Fake ...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【部分圖文】:
Word2Vec在三維空間的可視化1經(jīng)由Word2Vec訓(xùn)練得到的詞向量蘊(yùn)含了語義信息,其直觀體現(xiàn)為詞義相近的
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文功能主要為用戶提供近年來不同真實(shí)性新聞的數(shù)量統(tǒng)計分析。通過選擇起止時間,系統(tǒng)使用Echarts繪圖工具動態(tài)地繪制各年被人工標(biāo)注為True、Mostly-True、Half-True、Barely-True、False、Pants-Fire的新聞數(shù)量。此外,系統(tǒng)提供了多種圖表展示方式,如區(qū)域圖、折線圖、柱狀圖、極坐標(biāo)系下的柱狀圖等。通過對歷年真假新聞的數(shù)量統(tǒng)計分析,用戶可以直觀的分析出各年份新聞的真實(shí)性分布。如圖5-3展示了2009年至2019年不同真實(shí)性新聞的數(shù)量變化。圖5-32009年至2019年不同真實(shí)性新聞的數(shù)量變化(2)新聞作者可視化(SpeakerVisualization):目前系統(tǒng)中共存儲了4356名新聞作者,用戶可以搜索或者按照索引選擇待分析新聞作者。系統(tǒng)分三個層面展示新聞作者:基本信息、歷史信用表現(xiàn)、詞云。其中,新聞作者的基本信息包括作者所屬政黨和作者家鄉(xiāng);歷史信用表現(xiàn)以餅狀圖的形式展示該作者所述的不同真實(shí)性新聞的數(shù)量,從該餅狀圖可以清晰的了解到該作者的歷史信用表現(xiàn),如圖5-4展示了美國佛羅里達(dá)州參議員RickScott的歷史信用表現(xiàn)。詞云(WorldCloud)則展示了該新聞作者發(fā)布新聞的高頻詞匯。圖5-4RickScott的歷史信用表現(xiàn)-41-
RickScott的歷史信用表現(xiàn)-41-
【參考文獻(xiàn)】:
期刊論文
[1]基于深層特征和集成分類器的微博謠言檢測研究[J]. 毛二松,陳剛,劉欣,王波. 計算機(jī)應(yīng)用研究. 2016(11)
[2]微博謠言檢測方法研究[J]. 程亮,邱云飛,孫魯. 計算機(jī)應(yīng)用與軟件. 2013(02)
本文編號:3595028
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【部分圖文】:
Word2Vec在三維空間的可視化1經(jīng)由Word2Vec訓(xùn)練得到的詞向量蘊(yùn)含了語義信息,其直觀體現(xiàn)為詞義相近的
哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文功能主要為用戶提供近年來不同真實(shí)性新聞的數(shù)量統(tǒng)計分析。通過選擇起止時間,系統(tǒng)使用Echarts繪圖工具動態(tài)地繪制各年被人工標(biāo)注為True、Mostly-True、Half-True、Barely-True、False、Pants-Fire的新聞數(shù)量。此外,系統(tǒng)提供了多種圖表展示方式,如區(qū)域圖、折線圖、柱狀圖、極坐標(biāo)系下的柱狀圖等。通過對歷年真假新聞的數(shù)量統(tǒng)計分析,用戶可以直觀的分析出各年份新聞的真實(shí)性分布。如圖5-3展示了2009年至2019年不同真實(shí)性新聞的數(shù)量變化。圖5-32009年至2019年不同真實(shí)性新聞的數(shù)量變化(2)新聞作者可視化(SpeakerVisualization):目前系統(tǒng)中共存儲了4356名新聞作者,用戶可以搜索或者按照索引選擇待分析新聞作者。系統(tǒng)分三個層面展示新聞作者:基本信息、歷史信用表現(xiàn)、詞云。其中,新聞作者的基本信息包括作者所屬政黨和作者家鄉(xiāng);歷史信用表現(xiàn)以餅狀圖的形式展示該作者所述的不同真實(shí)性新聞的數(shù)量,從該餅狀圖可以清晰的了解到該作者的歷史信用表現(xiàn),如圖5-4展示了美國佛羅里達(dá)州參議員RickScott的歷史信用表現(xiàn)。詞云(WorldCloud)則展示了該新聞作者發(fā)布新聞的高頻詞匯。圖5-4RickScott的歷史信用表現(xiàn)-41-
RickScott的歷史信用表現(xiàn)-41-
【參考文獻(xiàn)】:
期刊論文
[1]基于深層特征和集成分類器的微博謠言檢測研究[J]. 毛二松,陳剛,劉欣,王波. 計算機(jī)應(yīng)用研究. 2016(11)
[2]微博謠言檢測方法研究[J]. 程亮,邱云飛,孫魯. 計算機(jī)應(yīng)用與軟件. 2013(02)
本文編號:3595028
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3595028.html
最近更新
教材專著