基于深度學(xué)習(xí)的虛假評(píng)論檢測(cè)
發(fā)布時(shí)間:2021-01-31 04:08
隨著互聯(lián)網(wǎng)的迅速發(fā)展,網(wǎng)上購(gòu)物以其方便快捷的優(yōu)勢(shì)代替了實(shí)體店購(gòu)物,已成為時(shí)下最流行的消費(fèi)方式。出于謀利的目的,電商平臺(tái)中出現(xiàn)越來越多的虛假評(píng)論,這在一定程度上誤導(dǎo)消費(fèi)者的購(gòu)買趨向,致使消費(fèi)者買到的商品與描述不符,逐漸喪失對(duì)電商平臺(tái)的信任。為了凈化電商環(huán)境,研究學(xué)者通過提取評(píng)論文本和評(píng)論者的各項(xiàng)特征并利用傳統(tǒng)分類器進(jìn)行虛假評(píng)論檢測(cè),雖然這類方法取得了一定的成果,但是提取特征的過程中依賴于專家知識(shí),而且沒有考慮相關(guān)產(chǎn)品的特征,不具有廣泛應(yīng)用性。虛假評(píng)論一般會(huì)比真實(shí)評(píng)論使用更多情感詞描述目標(biāo)產(chǎn)品的特征,針對(duì)不同的目標(biāo)產(chǎn)品,虛假評(píng)論者會(huì)對(duì)不同的特征進(jìn)行描述,為了使得檢測(cè)方法適用于不同領(lǐng)域,本文利用產(chǎn)品的相關(guān)特征,結(jié)合深度學(xué)習(xí)方法提出了兩種虛假評(píng)論檢測(cè)模型。第一種是融合產(chǎn)品相關(guān)特征的虛假評(píng)論檢測(cè)方法,該方法將產(chǎn)品相關(guān)特征與評(píng)論文本組合,以此作為輸入來訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型實(shí)現(xiàn)虛假評(píng)論檢測(cè),最后將該算法與兩個(gè)有效的傳統(tǒng)分類器組合,降低了過擬合問題,提高檢測(cè)準(zhǔn)確率。第二種是基于FastText的虛假評(píng)論檢測(cè)方法,該方法首先使用語料庫(kù)訓(xùn)練Word2Vec模型,基于該模型擴(kuò)充了產(chǎn)品特征詞匯集,并建立文本向...
【文章來源】:山東科技大學(xué)山東省
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1網(wǎng)絡(luò)爬蟲流程圖??Fig.?2.1?The?flow?chart?of?web?crawler??
的有監(jiān)督學(xué)習(xí)算法[23]。人工神經(jīng)網(wǎng)絡(luò)一般具有多個(gè)網(wǎng)絡(luò)層來處理數(shù)據(jù),每層網(wǎng)絡(luò)??又有多個(gè)節(jié)點(diǎn),層與層之間的節(jié)點(diǎn)通過權(quán)值相互連接,這些節(jié)點(diǎn)被稱為神經(jīng)元,??權(quán)值代表連接的重要程度,神經(jīng)元的基本結(jié)構(gòu)如圖2.2所示:??0??圖2.2神經(jīng)元結(jié)構(gòu)??Fig.?2.2?Neuronal?structure??圖2.2中,Xp?x2,...,表示從其他神經(jīng)兀傳入的《個(gè)輸入值,wQ,vi],…,??w?表示輸入的權(quán)重,即連接的重要程度,0表示偏置,神經(jīng)元i的輸出兄可以通過??公式2-1求得:??yrf(Yuwixj-0)?(2-i)??其中,/表示激活函數(shù),用來對(duì)數(shù)據(jù)引入非線性因素,使其可以處理更加復(fù)雜??的問題,學(xué)術(shù)研究中經(jīng)常使用的激活函數(shù)有多種,比如sigmoid函數(shù)、tanh函數(shù)等,??在實(shí)際應(yīng)用中,需要根據(jù)具體問題選擇合適的激活函數(shù)。??10??
規(guī)則相互連接。一個(gè)典型的神經(jīng)網(wǎng)絡(luò)包含輸入層、隱藏層、輸出層,分別用來負(fù)??責(zé)不同的數(shù)據(jù)操作,一般來說,輸入層用來讀取原始的數(shù)據(jù),隱藏層用來對(duì)數(shù)據(jù)??進(jìn)行計(jì)算處理,輸出層用來將處理后的結(jié)果輸出,結(jié)構(gòu)如圖2.3所7K。??輸入層?隱含層?輸出層??圖2.3典型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)??Fig.?2.3?Typical?neural?network?structure??在搭建好模型結(jié)構(gòu)之后首先需要使用標(biāo)注好的數(shù)據(jù)對(duì)模型進(jìn)行反復(fù)訓(xùn)練,使其??不斷迭代調(diào)整各項(xiàng)參數(shù),直到變得非常智能,每次訓(xùn)練需要經(jīng)過兩個(gè)過程:前向??傳播、反向傳播[24]。在前向傳播過程中,數(shù)據(jù)通過輸入層進(jìn)入網(wǎng)絡(luò),在隱藏層進(jìn)??行復(fù)雜的數(shù)據(jù)處理,網(wǎng)絡(luò)模型的計(jì)算結(jié)果被整合至輸出層并輸出。在反向傳播過??程中,模型首先根據(jù)一定的損失函數(shù)計(jì)算所有樣本的輸出值與實(shí)際標(biāo)注值的誤差??之和,然后把該值從輸出層傳播到輸入層,同時(shí)更新權(quán)值參數(shù)。在神經(jīng)網(wǎng)絡(luò)的訓(xùn)??練過程中,需要使用大量己標(biāo)注的數(shù)據(jù)集執(zhí)行多次正向傳播和反向傳播的過程,??反復(fù)調(diào)整網(wǎng)絡(luò)參數(shù)
【參考文獻(xiàn)】:
期刊論文
[1]一種基于啟發(fā)式規(guī)則的半監(jiān)督垃圾評(píng)論分類方法[J]. 張鵬,王素格,李德玉,王杰. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2017(07)
[2]大數(shù)據(jù)與深度學(xué)習(xí)綜述[J]. 馬世龍,烏尼日其其格,李小平. 智能系統(tǒng)學(xué)報(bào). 2016(06)
[3]大數(shù)據(jù)分析的神經(jīng)網(wǎng)絡(luò)方法[J]. 章毅,郭泉,王建勇. 工程科學(xué)與技術(shù). 2017(01)
[4]基于Word2vec的微博短文本分類研究[J]. 張謙,高章敏,劉嘉勇. 信息網(wǎng)絡(luò)安全. 2017(01)
[5]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計(jì)算機(jī)應(yīng)用. 2016(09)
[6]基于融合特征的虛假評(píng)論檢測(cè)方法[J]. 張考,于洪濤,崔瑞飛. 信息工程大學(xué)學(xué)報(bào). 2016(04)
[7]融合Word2vec與TextRank的關(guān)鍵詞抽取研究[J]. 寧建飛,劉降珍. 現(xiàn)代圖書情報(bào)技術(shù). 2016(06)
[8]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動(dòng)化學(xué)報(bào). 2016(09)
[9]基于情感特征和用戶關(guān)系的虛假評(píng)論者的識(shí)別[J]. 邵珠峰,姬東鴻. 計(jì)算機(jī)應(yīng)用與軟件. 2016(05)
[10]融合情感極性和邏輯回歸的虛假評(píng)論檢測(cè)方法[J]. 趙軍,王紅. 智能系統(tǒng)學(xué)報(bào). 2016(03)
碩士論文
[1]基于微博的用戶職業(yè)抽取研究[D]. 呂霞.中國(guó)科學(xué)技術(shù)大學(xué) 2017
[2]基于深度神經(jīng)網(wǎng)絡(luò)的微博短文本情感分析研究[D]. 張英.中原工學(xué)院 2017
[3]基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)算法的研究與應(yīng)用[D]. 王飛飛.南京郵電大學(xué) 2016
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類方法研究[D]. 朱蕓蕓.北京交通大學(xué) 2016
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的短文本分類方法研究[D]. 蔡慧蘋.西南大學(xué) 2016
[6]基于圖聚類的虛假評(píng)論人群組檢測(cè)算法研究[D]. 宋大為.沈陽理工大學(xué) 2016
[7]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類技術(shù)研究[D]. 楚敏南.湘潭大學(xué) 2015
[8]基于評(píng)論特征的虛假評(píng)論者檢測(cè)[D]. 李準(zhǔn).沈陽理工大學(xué) 2015
[9]基于Word2Vec主題提取的微博推薦[D]. 朱雪梅.北京理工大學(xué) 2014
[10]基于深度學(xué)習(xí)的欺騙性垃圾信息識(shí)別研究[D]. 景亞鵬.華東師范大學(xué) 2014
本文編號(hào):3010180
【文章來源】:山東科技大學(xué)山東省
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.1網(wǎng)絡(luò)爬蟲流程圖??Fig.?2.1?The?flow?chart?of?web?crawler??
的有監(jiān)督學(xué)習(xí)算法[23]。人工神經(jīng)網(wǎng)絡(luò)一般具有多個(gè)網(wǎng)絡(luò)層來處理數(shù)據(jù),每層網(wǎng)絡(luò)??又有多個(gè)節(jié)點(diǎn),層與層之間的節(jié)點(diǎn)通過權(quán)值相互連接,這些節(jié)點(diǎn)被稱為神經(jīng)元,??權(quán)值代表連接的重要程度,神經(jīng)元的基本結(jié)構(gòu)如圖2.2所示:??0??圖2.2神經(jīng)元結(jié)構(gòu)??Fig.?2.2?Neuronal?structure??圖2.2中,Xp?x2,...,表示從其他神經(jīng)兀傳入的《個(gè)輸入值,wQ,vi],…,??w?表示輸入的權(quán)重,即連接的重要程度,0表示偏置,神經(jīng)元i的輸出兄可以通過??公式2-1求得:??yrf(Yuwixj-0)?(2-i)??其中,/表示激活函數(shù),用來對(duì)數(shù)據(jù)引入非線性因素,使其可以處理更加復(fù)雜??的問題,學(xué)術(shù)研究中經(jīng)常使用的激活函數(shù)有多種,比如sigmoid函數(shù)、tanh函數(shù)等,??在實(shí)際應(yīng)用中,需要根據(jù)具體問題選擇合適的激活函數(shù)。??10??
規(guī)則相互連接。一個(gè)典型的神經(jīng)網(wǎng)絡(luò)包含輸入層、隱藏層、輸出層,分別用來負(fù)??責(zé)不同的數(shù)據(jù)操作,一般來說,輸入層用來讀取原始的數(shù)據(jù),隱藏層用來對(duì)數(shù)據(jù)??進(jìn)行計(jì)算處理,輸出層用來將處理后的結(jié)果輸出,結(jié)構(gòu)如圖2.3所7K。??輸入層?隱含層?輸出層??圖2.3典型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)??Fig.?2.3?Typical?neural?network?structure??在搭建好模型結(jié)構(gòu)之后首先需要使用標(biāo)注好的數(shù)據(jù)對(duì)模型進(jìn)行反復(fù)訓(xùn)練,使其??不斷迭代調(diào)整各項(xiàng)參數(shù),直到變得非常智能,每次訓(xùn)練需要經(jīng)過兩個(gè)過程:前向??傳播、反向傳播[24]。在前向傳播過程中,數(shù)據(jù)通過輸入層進(jìn)入網(wǎng)絡(luò),在隱藏層進(jìn)??行復(fù)雜的數(shù)據(jù)處理,網(wǎng)絡(luò)模型的計(jì)算結(jié)果被整合至輸出層并輸出。在反向傳播過??程中,模型首先根據(jù)一定的損失函數(shù)計(jì)算所有樣本的輸出值與實(shí)際標(biāo)注值的誤差??之和,然后把該值從輸出層傳播到輸入層,同時(shí)更新權(quán)值參數(shù)。在神經(jīng)網(wǎng)絡(luò)的訓(xùn)??練過程中,需要使用大量己標(biāo)注的數(shù)據(jù)集執(zhí)行多次正向傳播和反向傳播的過程,??反復(fù)調(diào)整網(wǎng)絡(luò)參數(shù)
【參考文獻(xiàn)】:
期刊論文
[1]一種基于啟發(fā)式規(guī)則的半監(jiān)督垃圾評(píng)論分類方法[J]. 張鵬,王素格,李德玉,王杰. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2017(07)
[2]大數(shù)據(jù)與深度學(xué)習(xí)綜述[J]. 馬世龍,烏尼日其其格,李小平. 智能系統(tǒng)學(xué)報(bào). 2016(06)
[3]大數(shù)據(jù)分析的神經(jīng)網(wǎng)絡(luò)方法[J]. 章毅,郭泉,王建勇. 工程科學(xué)與技術(shù). 2017(01)
[4]基于Word2vec的微博短文本分類研究[J]. 張謙,高章敏,劉嘉勇. 信息網(wǎng)絡(luò)安全. 2017(01)
[5]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計(jì)算機(jī)應(yīng)用. 2016(09)
[6]基于融合特征的虛假評(píng)論檢測(cè)方法[J]. 張考,于洪濤,崔瑞飛. 信息工程大學(xué)學(xué)報(bào). 2016(04)
[7]融合Word2vec與TextRank的關(guān)鍵詞抽取研究[J]. 寧建飛,劉降珍. 現(xiàn)代圖書情報(bào)技術(shù). 2016(06)
[8]圖像理解中的卷積神經(jīng)網(wǎng)絡(luò)[J]. 常亮,鄧小明,周明全,武仲科,袁野,楊碩,王宏安. 自動(dòng)化學(xué)報(bào). 2016(09)
[9]基于情感特征和用戶關(guān)系的虛假評(píng)論者的識(shí)別[J]. 邵珠峰,姬東鴻. 計(jì)算機(jī)應(yīng)用與軟件. 2016(05)
[10]融合情感極性和邏輯回歸的虛假評(píng)論檢測(cè)方法[J]. 趙軍,王紅. 智能系統(tǒng)學(xué)報(bào). 2016(03)
碩士論文
[1]基于微博的用戶職業(yè)抽取研究[D]. 呂霞.中國(guó)科學(xué)技術(shù)大學(xué) 2017
[2]基于深度神經(jīng)網(wǎng)絡(luò)的微博短文本情感分析研究[D]. 張英.中原工學(xué)院 2017
[3]基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)算法的研究與應(yīng)用[D]. 王飛飛.南京郵電大學(xué) 2016
[4]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類方法研究[D]. 朱蕓蕓.北京交通大學(xué) 2016
[5]基于卷積神經(jīng)網(wǎng)絡(luò)的短文本分類方法研究[D]. 蔡慧蘋.西南大學(xué) 2016
[6]基于圖聚類的虛假評(píng)論人群組檢測(cè)算法研究[D]. 宋大為.沈陽理工大學(xué) 2016
[7]基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類技術(shù)研究[D]. 楚敏南.湘潭大學(xué) 2015
[8]基于評(píng)論特征的虛假評(píng)論者檢測(cè)[D]. 李準(zhǔn).沈陽理工大學(xué) 2015
[9]基于Word2Vec主題提取的微博推薦[D]. 朱雪梅.北京理工大學(xué) 2014
[10]基于深度學(xué)習(xí)的欺騙性垃圾信息識(shí)別研究[D]. 景亞鵬.華東師范大學(xué) 2014
本文編號(hào):3010180
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/3010180.html
最近更新
教材專著