基于主題情感聯(lián)合概率模型的虛假評論檢測研究
發(fā)布時間:2021-11-19 17:23
隨著智能終端設備的普及,消費者傾向于通過網(wǎng)上購買商品,這催生了電子商務的繁榮。由于電子商務虛擬環(huán)境普遍存在著信息不對稱性,消費者無法準確獲得商品質(zhì)量信息,因此更多地借助歷史評論衡量商品的好壞。然而,有些不法商家抓住機制的漏洞,雇傭網(wǎng)絡水軍撰寫不實的言論以提高自身聲譽,吸引消費者購買。評論大數(shù)據(jù)的產(chǎn)生使得人們很難用肉眼辨別出哪些是虛假評論。傳統(tǒng)的虛假評論檢測模型取得了一定的研究成果。但是,由于這些模型僅使用語言特征和語法結構特征,不能很好地挖掘文本的語義和情感信息,準確率的提升受到限制。深度神經(jīng)網(wǎng)絡模型雖然能夠?qū)W習到文本的抽象特征,但是結果缺乏可解釋性。為了提高虛假評論檢測的準確性,本文以語義和情感為視角,提出無監(jiān)督的主題情感聯(lián)合概率模型UTSJ(Unsupervised Topic-sentiment Joint Probabilistic Model)。論文主要完成了以下幾個方面的工作:(1)結合主題模型方法進行虛假評論檢測。從語義和情感的角度,選取傳統(tǒng)的主題模型LDA和融合情感的主題模型JST,研究該模型在虛假評論檢測領域應用的效果。在傳統(tǒng)LDA模型的基礎上,增加情感層,提出無監(jiān)督...
【文章來源】:山東科技大學山東省
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【部分圖文】:
圖2.1虛假評論檢測框架??Fig.2.1?A?framework?for?detecting?deceptive?review??本節(jié)將按照圖2.1中的虛假評論檢測框架圖展開,分別介紹在虛假評論檢測??
基于這種人們撰寫評論的行為習慣,本文提出了如下假設:??假設1:在評論文本中,表達的情感是依賴于特定的主題(方面)。??圖3.3給出了一條yelp評論文本。文本內(nèi)容主要有兩個特點:一是評論文??本的內(nèi)容往往是對于某個特定商品或服務的方面進行評價;二是評論文本方面??的時候同時表達出相應的情感傾向信息,這與本文提出的假設1是相符的。??P.?□□□□□2/2/2018??San?Jose,?CA??奪?326?friencls?0?Seated?vsa?Yelp?Reservatbns??〇?53?reviews????7?pnotos?Abso。酰簦澹?WGnde療ul-?were?F〇od?議35??ingenious.?Really?romantic?and?organic?ambience.??We?had?two?cocktails
圖3.4?UTSJ的概率圖模型??Fig.3.4?Probabilistic?graph?model?for?UTSJ??圖3.4給出了?UTSJ模型的概率圖模型,紅色方框圈出來的部分代表了擴展??LDA的情感層部分。對比圖3.4與圖3.1,可以看到是UTSJ模型是情感依賴主??題的(即而JST模型是主題依賴情感的(SP/ ̄z)。對比圖3.4與圖3.2,??可以看到UTSJ模型的每個詞都來源于不同的語言結構(方框)。??28??
【參考文獻】:
期刊論文
[1]基于決策樹分類算法的研究與應用[J]. 路翀,徐輝,楊永春. 電子設計工程. 2016(18)
[2]基于PU學習算法的虛假評論識別研究[J]. 任亞峰,姬東鴻,張紅斌,尹蘭. 計算機研究與發(fā)展. 2015(03)
[3]基于語言結構和情感極性的虛假評論識別[J]. 任亞峰,尹蘭,姬東鴻. 計算機科學與探索. 2014(03)
[4]基于LDA主題模型的文本相似度計算[J]. 王振振,何明,杜永萍. 計算機科學. 2013(12)
[5]文本分類中TF-IDF方法的改進研究[J]. 覃世安,李法運. 現(xiàn)代圖書情報技術. 2013(10)
[6]基于自適應聚類的虛假評論檢測[J]. 宋海霞,嚴馨,余正濤,石林賓,蘇斐. 南京大學學報(自然科學版). 2013(04)
[7]基于LDA的中文文本相似度計算[J]. 孫昌年,鄭誠,夏青松. 計算機技術與發(fā)展. 2013(01)
[8]基于隨機森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟. 吉林大學學報(工學版). 2014(01)
[9]基于鑒別能力分析和LDA-LPP算法的人臉識別[J]. 曹潔,吳迪,李偉. 吉林大學學報(工學版). 2012(06)
[10]基于互信息的無監(jiān)督特征選擇[J]. 徐峻嶺,周毓明,陳林,徐寶文. 計算機研究與發(fā)展. 2012(02)
本文編號:3505507
【文章來源】:山東科技大學山東省
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【部分圖文】:
圖2.1虛假評論檢測框架??Fig.2.1?A?framework?for?detecting?deceptive?review??本節(jié)將按照圖2.1中的虛假評論檢測框架圖展開,分別介紹在虛假評論檢測??
基于這種人們撰寫評論的行為習慣,本文提出了如下假設:??假設1:在評論文本中,表達的情感是依賴于特定的主題(方面)。??圖3.3給出了一條yelp評論文本。文本內(nèi)容主要有兩個特點:一是評論文??本的內(nèi)容往往是對于某個特定商品或服務的方面進行評價;二是評論文本方面??的時候同時表達出相應的情感傾向信息,這與本文提出的假設1是相符的。??P.?□□□□□2/2/2018??San?Jose,?CA??奪?326?friencls?0?Seated?vsa?Yelp?Reservatbns??〇?53?reviews????7?pnotos?Abso。酰簦澹?WGnde療ul-?were?F〇od?議35??ingenious.?Really?romantic?and?organic?ambience.??We?had?two?cocktails
圖3.4?UTSJ的概率圖模型??Fig.3.4?Probabilistic?graph?model?for?UTSJ??圖3.4給出了?UTSJ模型的概率圖模型,紅色方框圈出來的部分代表了擴展??LDA的情感層部分。對比圖3.4與圖3.1,可以看到是UTSJ模型是情感依賴主??題的(即而JST模型是主題依賴情感的(SP/ ̄z)。對比圖3.4與圖3.2,??可以看到UTSJ模型的每個詞都來源于不同的語言結構(方框)。??28??
【參考文獻】:
期刊論文
[1]基于決策樹分類算法的研究與應用[J]. 路翀,徐輝,楊永春. 電子設計工程. 2016(18)
[2]基于PU學習算法的虛假評論識別研究[J]. 任亞峰,姬東鴻,張紅斌,尹蘭. 計算機研究與發(fā)展. 2015(03)
[3]基于語言結構和情感極性的虛假評論識別[J]. 任亞峰,尹蘭,姬東鴻. 計算機科學與探索. 2014(03)
[4]基于LDA主題模型的文本相似度計算[J]. 王振振,何明,杜永萍. 計算機科學. 2013(12)
[5]文本分類中TF-IDF方法的改進研究[J]. 覃世安,李法運. 現(xiàn)代圖書情報技術. 2013(10)
[6]基于自適應聚類的虛假評論檢測[J]. 宋海霞,嚴馨,余正濤,石林賓,蘇斐. 南京大學學報(自然科學版). 2013(04)
[7]基于LDA的中文文本相似度計算[J]. 孫昌年,鄭誠,夏青松. 計算機技術與發(fā)展. 2013(01)
[8]基于隨機森林的特征選擇算法[J]. 姚登舉,楊靜,詹曉娟. 吉林大學學報(工學版). 2014(01)
[9]基于鑒別能力分析和LDA-LPP算法的人臉識別[J]. 曹潔,吳迪,李偉. 吉林大學學報(工學版). 2012(06)
[10]基于互信息的無監(jiān)督特征選擇[J]. 徐峻嶺,周毓明,陳林,徐寶文. 計算機研究與發(fā)展. 2012(02)
本文編號:3505507
本文鏈接:http://sikaile.net/jingjilunwen/xmjj/3505507.html