微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2020-12-22 05:48
微博的出現(xiàn)和發(fā)展極大的改變了傳統(tǒng)的信息傳播方式,人們無(wú)需等待傳統(tǒng)媒體的報(bào)道就可以便捷的獲取最新的資訊,從而使得信息傳播速度大大提升。然而在微博為人們生活帶來(lái)更豐富更快捷的信息獲取體驗(yàn)的同時(shí),由于微博中虛假信息的制造成本低,鑒別虛假信息往往會(huì)耗費(fèi)很大的人力和時(shí)間成本,因此可以說(shuō)虛假信息是制約微博發(fā)展的最重要的因素之一。針對(duì)上述問(wèn)題,本文設(shè)計(jì)并實(shí)現(xiàn)了微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)。該平臺(tái)既提供基于Web的圖形界面,也提供開(kāi)放接口,允許用戶將短文本提交至平臺(tái)進(jìn)行鑒別;而該平臺(tái)可以接入多種虛假信息鑒別算法,對(duì)用戶輸入的短文本進(jìn)行鑒別,給出其可能是虛假信息的概率;同時(shí)該平臺(tái)還支持算法有效性監(jiān)測(cè)功能,將平臺(tái)支持的各種算法的鑒別準(zhǔn)確率、漏報(bào)率和誤報(bào)率展示給用戶。本文首先介紹了微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)的研究背景;調(diào)研了虛假信息鑒別算法,然后分析了微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)的需求;接著提出了平臺(tái)架構(gòu)設(shè)計(jì)以及平臺(tái)中各模塊的詳細(xì)設(shè)計(jì),并予以實(shí)現(xiàn)和測(cè)試。一系列測(cè)試證明了系統(tǒng)的有效性。
【文章來(lái)源】: 李少愚 北京郵電大學(xué)
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-1微信謠言辟謠助手??因此,為使微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)能夠面向用戶的主動(dòng)檢測(cè),此鑒??別系統(tǒng)應(yīng)至少覆蓋短文本非關(guān)鍵詞輸入、可靠的算法支持與算法有效性監(jiān)測(cè)三個(gè)??
?■???????KM??圖3-1微信謠言辟謠助手??因此,為使微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)能夠面向用戶的主動(dòng)檢測(cè),此鑒??別系統(tǒng)應(yīng)至少覆蓋短文本非關(guān)鍵詞輸入、可靠的算法支持與算法有效性監(jiān)測(cè)三個(gè)??方面?傮w需求關(guān)系如圖3-2所示。??.?時(shí)'鍵祕(mì)龜錄沒(méi).??■B^llj?二二蒙,漘??圖3-2微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)需求關(guān)系圖??>信息庫(kù)資源:對(duì)于持續(xù)更新算法模型保證算法能夠提供可靠地分析結(jié)果,同??時(shí)為算法有效性監(jiān)測(cè)保留歷史信息記錄,驗(yàn)證平臺(tái)需建立信息庫(kù)資源為各模塊功??能提供底層數(shù)據(jù)支持。??>信息鑒別:對(duì)于短文本非關(guān)鍵詞輸入主要涉及對(duì)于短文本的文本特征表示模??型的有效性,使待檢測(cè)文本可以作為整體轉(zhuǎn)化成向量輸入算法模塊進(jìn)行分析,相??較于通過(guò)關(guān)鍵詞匹配相關(guān)性文本更具有說(shuō)服力。在此功能中不僅要有面向用戶交??互友好的圖形化界面,同時(shí)還支持整合平臺(tái)現(xiàn)有資源為第三方平臺(tái)開(kāi)發(fā)者/用戶??提供友好的RESTfol?API接口,包括信息庫(kù)資源調(diào)用、多算法分析文本以及對(duì)應(yīng)??算法的近期有效性監(jiān)測(cè)。??>多算法支持:可靠的算法支持主要是指在現(xiàn)有的虛假信息鑒別技術(shù)基礎(chǔ)之上
本章的最后對(duì)數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)進(jìn)行介紹。??4.1總體架構(gòu)設(shè)計(jì)??本文設(shè)計(jì)并實(shí)現(xiàn)的驗(yàn)證平臺(tái)的總體架構(gòu)設(shè)計(jì)如圖4-1所示,自底向上包括了??模型層、控制層、接口層和應(yīng)用層這四個(gè)層次。每層功能實(shí)現(xiàn)相對(duì)獨(dú)立,下層為??上層提供服務(wù),上層調(diào)用下層提供的接口。以下將對(duì)各層完成的功能做簡(jiǎn)要介紹。??應(yīng)用層??壤口層??控制層??…??圖4-1微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)總體架構(gòu)設(shè)計(jì)??(1)模型層??為整個(gè)驗(yàn)證平臺(tái)即微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)提供了謠言庫(kù)、非謠言庫(kù)??以及訓(xùn)練完畢的模型,通過(guò)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的相關(guān)技術(shù)為整個(gè)系統(tǒng)提供底層??支持。本層中的分析模型將作為系統(tǒng)的核心,因此需要保證底層代碼的高可用性,??易維護(hù)和拓展性。具體包括以下幾個(gè)模塊。??>算法接入模塊:算法接入模塊主要負(fù)責(zé)為支撐驗(yàn)證平臺(tái)系統(tǒng)核心業(yè)務(wù)的算法??模型提供良好的數(shù)據(jù)輸入。主要依據(jù)中文短文本分詞技術(shù),為用戶提供進(jìn)一步的??虛假信息鑒別服務(wù)的技術(shù)支持。??>信息庫(kù)模塊:擬從新浪社區(qū)管理中心采集已經(jīng)被官方認(rèn)定的虛假信息樣本??19??
【參考文獻(xiàn)】:
期刊論文
[1]基于分位數(shù)概要的KNN算法研究[J]. 王丹. 無(wú)線互聯(lián)科技. 2015(20)
[2]基于改進(jìn)語(yǔ)義距離的網(wǎng)絡(luò)評(píng)論聚類研究[J]. 楊震,王來(lái)濤,賴英旭. 軟件學(xué)報(bào). 2014(12)
[3]基于語(yǔ)義理解的文本相似度算法[J]. 金博,史彥軍,滕弘飛. 大連理工大學(xué)學(xué)報(bào). 2005(02)
[4]知網(wǎng)在詞語(yǔ)相似度計(jì)算方面的應(yīng)用[J]. 易麗萍,竹勇,雷小春. 信息技術(shù)與信息化. 2005(01)
博士論文
[1]文本語(yǔ)義表示及多層分類關(guān)鍵技術(shù)研究[D]. 宋勝利.西安電子科技大學(xué) 2012
碩士論文
[1]微博熱點(diǎn)新聞的真實(shí)性驗(yàn)證及傳播分析[D]. 姚思宇.大連理工大學(xué) 2016
[2]基于半監(jiān)督學(xué)習(xí)的短文本分類研究[D]. 袁媛.西北師范大學(xué) 2015
[3]基于半監(jiān)督學(xué)習(xí)的中文短文本分類研究[D]. 張倩.西安電子科技大學(xué) 2014
[4]互聯(lián)網(wǎng)短文本信息分類關(guān)鍵技術(shù)研究[D]. 柴春梅.上海交通大學(xué) 2009
[5]基于語(yǔ)義分析樹(shù)核的句子相似度計(jì)算[D]. 王利局.大連理工大學(xué) 2008
本文編號(hào):2931248
【文章來(lái)源】: 李少愚 北京郵電大學(xué)
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-1微信謠言辟謠助手??因此,為使微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)能夠面向用戶的主動(dòng)檢測(cè),此鑒??別系統(tǒng)應(yīng)至少覆蓋短文本非關(guān)鍵詞輸入、可靠的算法支持與算法有效性監(jiān)測(cè)三個(gè)??
?■???????KM??圖3-1微信謠言辟謠助手??因此,為使微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)能夠面向用戶的主動(dòng)檢測(cè),此鑒??別系統(tǒng)應(yīng)至少覆蓋短文本非關(guān)鍵詞輸入、可靠的算法支持與算法有效性監(jiān)測(cè)三個(gè)??方面?傮w需求關(guān)系如圖3-2所示。??.?時(shí)'鍵祕(mì)龜錄沒(méi).??■B^llj?二二蒙,漘??圖3-2微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)需求關(guān)系圖??>信息庫(kù)資源:對(duì)于持續(xù)更新算法模型保證算法能夠提供可靠地分析結(jié)果,同??時(shí)為算法有效性監(jiān)測(cè)保留歷史信息記錄,驗(yàn)證平臺(tái)需建立信息庫(kù)資源為各模塊功??能提供底層數(shù)據(jù)支持。??>信息鑒別:對(duì)于短文本非關(guān)鍵詞輸入主要涉及對(duì)于短文本的文本特征表示模??型的有效性,使待檢測(cè)文本可以作為整體轉(zhuǎn)化成向量輸入算法模塊進(jìn)行分析,相??較于通過(guò)關(guān)鍵詞匹配相關(guān)性文本更具有說(shuō)服力。在此功能中不僅要有面向用戶交??互友好的圖形化界面,同時(shí)還支持整合平臺(tái)現(xiàn)有資源為第三方平臺(tái)開(kāi)發(fā)者/用戶??提供友好的RESTfol?API接口,包括信息庫(kù)資源調(diào)用、多算法分析文本以及對(duì)應(yīng)??算法的近期有效性監(jiān)測(cè)。??>多算法支持:可靠的算法支持主要是指在現(xiàn)有的虛假信息鑒別技術(shù)基礎(chǔ)之上
本章的最后對(duì)數(shù)據(jù)庫(kù)表結(jié)構(gòu)設(shè)計(jì)進(jìn)行介紹。??4.1總體架構(gòu)設(shè)計(jì)??本文設(shè)計(jì)并實(shí)現(xiàn)的驗(yàn)證平臺(tái)的總體架構(gòu)設(shè)計(jì)如圖4-1所示,自底向上包括了??模型層、控制層、接口層和應(yīng)用層這四個(gè)層次。每層功能實(shí)現(xiàn)相對(duì)獨(dú)立,下層為??上層提供服務(wù),上層調(diào)用下層提供的接口。以下將對(duì)各層完成的功能做簡(jiǎn)要介紹。??應(yīng)用層??壤口層??控制層??…??圖4-1微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)總體架構(gòu)設(shè)計(jì)??(1)模型層??為整個(gè)驗(yàn)證平臺(tái)即微博虛假信息鑒別技術(shù)驗(yàn)證平臺(tái)提供了謠言庫(kù)、非謠言庫(kù)??以及訓(xùn)練完畢的模型,通過(guò)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的相關(guān)技術(shù)為整個(gè)系統(tǒng)提供底層??支持。本層中的分析模型將作為系統(tǒng)的核心,因此需要保證底層代碼的高可用性,??易維護(hù)和拓展性。具體包括以下幾個(gè)模塊。??>算法接入模塊:算法接入模塊主要負(fù)責(zé)為支撐驗(yàn)證平臺(tái)系統(tǒng)核心業(yè)務(wù)的算法??模型提供良好的數(shù)據(jù)輸入。主要依據(jù)中文短文本分詞技術(shù),為用戶提供進(jìn)一步的??虛假信息鑒別服務(wù)的技術(shù)支持。??>信息庫(kù)模塊:擬從新浪社區(qū)管理中心采集已經(jīng)被官方認(rèn)定的虛假信息樣本??19??
【參考文獻(xiàn)】:
期刊論文
[1]基于分位數(shù)概要的KNN算法研究[J]. 王丹. 無(wú)線互聯(lián)科技. 2015(20)
[2]基于改進(jìn)語(yǔ)義距離的網(wǎng)絡(luò)評(píng)論聚類研究[J]. 楊震,王來(lái)濤,賴英旭. 軟件學(xué)報(bào). 2014(12)
[3]基于語(yǔ)義理解的文本相似度算法[J]. 金博,史彥軍,滕弘飛. 大連理工大學(xué)學(xué)報(bào). 2005(02)
[4]知網(wǎng)在詞語(yǔ)相似度計(jì)算方面的應(yīng)用[J]. 易麗萍,竹勇,雷小春. 信息技術(shù)與信息化. 2005(01)
博士論文
[1]文本語(yǔ)義表示及多層分類關(guān)鍵技術(shù)研究[D]. 宋勝利.西安電子科技大學(xué) 2012
碩士論文
[1]微博熱點(diǎn)新聞的真實(shí)性驗(yàn)證及傳播分析[D]. 姚思宇.大連理工大學(xué) 2016
[2]基于半監(jiān)督學(xué)習(xí)的短文本分類研究[D]. 袁媛.西北師范大學(xué) 2015
[3]基于半監(jiān)督學(xué)習(xí)的中文短文本分類研究[D]. 張倩.西安電子科技大學(xué) 2014
[4]互聯(lián)網(wǎng)短文本信息分類關(guān)鍵技術(shù)研究[D]. 柴春梅.上海交通大學(xué) 2009
[5]基于語(yǔ)義分析樹(shù)核的句子相似度計(jì)算[D]. 王利局.大連理工大學(xué) 2008
本文編號(hào):2931248
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2931248.html
最近更新
教材專著