網(wǎng)絡(luò)虛假新聞檢測系統(tǒng)的研究與實現(xiàn)
發(fā)布時間:2021-02-09 10:19
隨著互聯(lián)網(wǎng)技術(shù)的進步,人們獲取新聞的方式也隨之發(fā)生改變,更傾向于通過網(wǎng)絡(luò)平臺獲取新聞信息。網(wǎng)絡(luò)新聞同傳統(tǒng)的新聞相比有著較快的更新和傳播速度,此外新聞的發(fā)布平臺也更加多樣化,在為人們帶來便利的同時也使得新聞的真實性無法確定。虛假新聞具有較強的影響力,如果人們誤信并進行傳播,輕則造成群眾的誤解引發(fā)負面情緒,重則將會影響社會穩(wěn)定。因此本文研發(fā)了網(wǎng)絡(luò)虛假新聞檢測系統(tǒng),輔助新聞機構(gòu)和媒體平臺及時識別虛假新聞,阻止虛假新聞的傳播,降低其影響力,從而達到維護社會穩(wěn)定,促進社交網(wǎng)絡(luò)健康發(fā)展的目的。本文仔細分析了國內(nèi)外關(guān)于虛假新聞檢測的研究現(xiàn)狀,發(fā)現(xiàn)在特征選擇方面,大多數(shù)研究提取的都是一些比較淺顯的基于統(tǒng)計的特征,而忽略了新聞文本自身的特征。因此本文在原有的特征基礎(chǔ)上,提出了基于文本內(nèi)容自身的情感傾向性,虛假相似性特征、以及評論的情感類別特征,將提取的特征進行集成,作為SVM模型的輸入特征訓(xùn)練分類器,實現(xiàn)對虛假新聞的識別。本系統(tǒng)實現(xiàn)的主要功能模塊是新聞數(shù)據(jù)和評論數(shù)據(jù)的獲取、新聞數(shù)據(jù)的檢索與分析、網(wǎng)絡(luò)新聞的虛假性檢測、虛假新聞數(shù)據(jù)可視化。在本系統(tǒng)中,首先通過TextRank算法對文本進行主題詞提取,根據(jù)主...
【文章來源】:遼寧大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【部分圖文】:
網(wǎng)民規(guī)模和互聯(lián)網(wǎng)普及率
第1章緒論2圖1-2手機網(wǎng)民規(guī)模及其占比隨著社會和科技的不斷進步,網(wǎng)民使用手機上網(wǎng)的比例日益增長,這使得人們獲取新聞信息的方式發(fā)生了巨大的變化,從前人們只能在報紙或者新聞報道上獲取新聞信息,如今則可以通過移動終端等隨時隨地的獲取新聞信息。同傳統(tǒng)的新聞媒體相比,社交媒體平臺上因其時效性強、內(nèi)容簡短、便于閱讀等特點逐漸成為了當下大多數(shù)年輕人獲取新聞信息的主要平臺,據(jù)統(tǒng)計有超過80%的新聞事件最早都是源自于微博平臺[2]。此外新聞的發(fā)布方式也發(fā)生了一些變化,社交媒體上,不僅僅是只有專業(yè)的新聞工作者能發(fā)布信息,普通用戶也可以發(fā)表信息。這些平臺在為人們提供便利的同時,也滋生了許多問題,比如有一些人為達到某種目的,蓄意編造或傳播虛假新聞,以從中獲取利益或引起社會恐慌,這就導(dǎo)致了一些虛假新聞信息的產(chǎn)生。虛假新聞曾經(jīng)被賦予過各種各樣的標簽,如錯誤信息、謠言或者垃圾郵件等[3]。每個人可能對虛假新聞有著自己的直觀定義,在不同的論文中作者可能會采用不同的角度對虛假新聞一詞進行定義,在本篇論文中主要將虛假新聞定義為社交媒體上用戶發(fā)布的虛假信息,即沒有經(jīng)過官方證實個人發(fā)布的與事實不符的新聞信息或者謠言。對于普通用戶來說,由于所從事的領(lǐng)域不同,對于本專業(yè)領(lǐng)域的虛假新聞可能會迅速識別出來并選擇不相信這種虛假的信息,但由于對于其他領(lǐng)域并不
第1章緒論3了解,從而無法準確判斷每一篇新聞的真實性。如果人們誤信這種虛假新聞并進行傳播,可能會引發(fā)一些不良的后果,輕則造成群眾的誤解引發(fā)負面情緒,重則將會影響社會穩(wěn)定,F(xiàn)在已經(jīng)有一些平臺來曝光虛假新聞,如中國互聯(lián)網(wǎng)聯(lián)合辟謠平臺以及微博社區(qū)管理中心等都會不定時的曝光一些在社交平臺和網(wǎng)絡(luò)媒體上廣為傳播的虛假新聞。微博作為目前用戶最多的社交平臺,也采取了人工識別的方法來曝光其平臺上的虛假新聞,用戶可以舉報發(fā)布不實信息的博主,然后通過微博社區(qū)管理中心的工作人員進行人工鑒定,最終給出這篇微博是否是不實新聞的結(jié)論。但這種人工判別的方式需要舉報人進行舉證,且會耗費大量的時間和精力,判別效率不高,因此對于網(wǎng)絡(luò)上的虛假新聞進行自動檢測成為大勢所趨。如果能夠在短時間內(nèi)識別出虛假新聞并加以澄清,避免虛假新聞的廣泛傳播,則可以維護社會穩(wěn)定,促進社交網(wǎng)絡(luò)健康發(fā)展。圖1-3為微博不實信息人工鑒定平臺。圖1-3微博不實信息人工鑒定平臺1.2研究現(xiàn)狀近年來,許多國內(nèi)外學(xué)者從不同角度對網(wǎng)絡(luò)虛假新聞檢測進行了研究。從
【參考文獻】:
期刊論文
[1]一種改進的基于歐氏距離的SDRSMOTE算法[J]. 李克文,林亞林,楊耀忠. 計算機工程與科學(xué). 2019(11)
[2]基于多部情感詞典和規(guī)則集的中文微博情感分析研究[J]. 吳杰勝,陸奎. 計算機應(yīng)用與軟件. 2019(09)
[3]HanLP2.0[J]. 湯連杰. 軟件和集成電路. 2019(08)
[4]循環(huán)神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 楊麗,吳雨茜,王俊麗,劉義理. 計算機應(yīng)用. 2018(S2)
[5]基于Co-Training的微博垃圾評論識別方法[J]. 李志欣,蘭丹媚,張燦龍,唐素勤. 計算機工程. 2018(07)
[6]基于TF-IDF和余弦相似度的文本分類方法[J]. 武永亮,趙書良,李長鏡,魏娜娣,王子晏. 中文信息學(xué)報. 2017(05)
[7]文本情感分類預(yù)處理研究[J]. 楊歡. 電子技術(shù)與軟件工程. 2016(10)
[8]基于詞頻統(tǒng)計的文本關(guān)鍵詞提取方法[J]. 羅燕,趙書良,李曉超,韓玉輝,丁亞飛. 計算機應(yīng)用. 2016(03)
[9]基于深層特征和集成分類器的微博謠言檢測研究[J]. 毛二松,陳剛,劉欣,王波. 計算機應(yīng)用研究. 2016(11)
[10]基于XPath的新聞信息抽取系統(tǒng)設(shè)計與實現(xiàn)[J]. 阮娟. 智能計算機與應(yīng)用. 2015(02)
博士論文
[1]中國網(wǎng)絡(luò)新聞可信度研究[D]. 劉瓊.華中科技大學(xué) 2011
碩士論文
[1]基于K近鄰的分類算法研究[D]. 桑應(yīng)賓.重慶大學(xué) 2009
本文編號:3025485
【文章來源】:遼寧大學(xué)遼寧省 211工程院校
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【部分圖文】:
網(wǎng)民規(guī)模和互聯(lián)網(wǎng)普及率
第1章緒論2圖1-2手機網(wǎng)民規(guī)模及其占比隨著社會和科技的不斷進步,網(wǎng)民使用手機上網(wǎng)的比例日益增長,這使得人們獲取新聞信息的方式發(fā)生了巨大的變化,從前人們只能在報紙或者新聞報道上獲取新聞信息,如今則可以通過移動終端等隨時隨地的獲取新聞信息。同傳統(tǒng)的新聞媒體相比,社交媒體平臺上因其時效性強、內(nèi)容簡短、便于閱讀等特點逐漸成為了當下大多數(shù)年輕人獲取新聞信息的主要平臺,據(jù)統(tǒng)計有超過80%的新聞事件最早都是源自于微博平臺[2]。此外新聞的發(fā)布方式也發(fā)生了一些變化,社交媒體上,不僅僅是只有專業(yè)的新聞工作者能發(fā)布信息,普通用戶也可以發(fā)表信息。這些平臺在為人們提供便利的同時,也滋生了許多問題,比如有一些人為達到某種目的,蓄意編造或傳播虛假新聞,以從中獲取利益或引起社會恐慌,這就導(dǎo)致了一些虛假新聞信息的產(chǎn)生。虛假新聞曾經(jīng)被賦予過各種各樣的標簽,如錯誤信息、謠言或者垃圾郵件等[3]。每個人可能對虛假新聞有著自己的直觀定義,在不同的論文中作者可能會采用不同的角度對虛假新聞一詞進行定義,在本篇論文中主要將虛假新聞定義為社交媒體上用戶發(fā)布的虛假信息,即沒有經(jīng)過官方證實個人發(fā)布的與事實不符的新聞信息或者謠言。對于普通用戶來說,由于所從事的領(lǐng)域不同,對于本專業(yè)領(lǐng)域的虛假新聞可能會迅速識別出來并選擇不相信這種虛假的信息,但由于對于其他領(lǐng)域并不
第1章緒論3了解,從而無法準確判斷每一篇新聞的真實性。如果人們誤信這種虛假新聞并進行傳播,可能會引發(fā)一些不良的后果,輕則造成群眾的誤解引發(fā)負面情緒,重則將會影響社會穩(wěn)定,F(xiàn)在已經(jīng)有一些平臺來曝光虛假新聞,如中國互聯(lián)網(wǎng)聯(lián)合辟謠平臺以及微博社區(qū)管理中心等都會不定時的曝光一些在社交平臺和網(wǎng)絡(luò)媒體上廣為傳播的虛假新聞。微博作為目前用戶最多的社交平臺,也采取了人工識別的方法來曝光其平臺上的虛假新聞,用戶可以舉報發(fā)布不實信息的博主,然后通過微博社區(qū)管理中心的工作人員進行人工鑒定,最終給出這篇微博是否是不實新聞的結(jié)論。但這種人工判別的方式需要舉報人進行舉證,且會耗費大量的時間和精力,判別效率不高,因此對于網(wǎng)絡(luò)上的虛假新聞進行自動檢測成為大勢所趨。如果能夠在短時間內(nèi)識別出虛假新聞并加以澄清,避免虛假新聞的廣泛傳播,則可以維護社會穩(wěn)定,促進社交網(wǎng)絡(luò)健康發(fā)展。圖1-3為微博不實信息人工鑒定平臺。圖1-3微博不實信息人工鑒定平臺1.2研究現(xiàn)狀近年來,許多國內(nèi)外學(xué)者從不同角度對網(wǎng)絡(luò)虛假新聞檢測進行了研究。從
【參考文獻】:
期刊論文
[1]一種改進的基于歐氏距離的SDRSMOTE算法[J]. 李克文,林亞林,楊耀忠. 計算機工程與科學(xué). 2019(11)
[2]基于多部情感詞典和規(guī)則集的中文微博情感分析研究[J]. 吳杰勝,陸奎. 計算機應(yīng)用與軟件. 2019(09)
[3]HanLP2.0[J]. 湯連杰. 軟件和集成電路. 2019(08)
[4]循環(huán)神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 楊麗,吳雨茜,王俊麗,劉義理. 計算機應(yīng)用. 2018(S2)
[5]基于Co-Training的微博垃圾評論識別方法[J]. 李志欣,蘭丹媚,張燦龍,唐素勤. 計算機工程. 2018(07)
[6]基于TF-IDF和余弦相似度的文本分類方法[J]. 武永亮,趙書良,李長鏡,魏娜娣,王子晏. 中文信息學(xué)報. 2017(05)
[7]文本情感分類預(yù)處理研究[J]. 楊歡. 電子技術(shù)與軟件工程. 2016(10)
[8]基于詞頻統(tǒng)計的文本關(guān)鍵詞提取方法[J]. 羅燕,趙書良,李曉超,韓玉輝,丁亞飛. 計算機應(yīng)用. 2016(03)
[9]基于深層特征和集成分類器的微博謠言檢測研究[J]. 毛二松,陳剛,劉欣,王波. 計算機應(yīng)用研究. 2016(11)
[10]基于XPath的新聞信息抽取系統(tǒng)設(shè)計與實現(xiàn)[J]. 阮娟. 智能計算機與應(yīng)用. 2015(02)
博士論文
[1]中國網(wǎng)絡(luò)新聞可信度研究[D]. 劉瓊.華中科技大學(xué) 2011
碩士論文
[1]基于K近鄰的分類算法研究[D]. 桑應(yīng)賓.重慶大學(xué) 2009
本文編號:3025485
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3025485.html
最近更新
教材專著