垃圾評論檢測算法的研究
發(fā)布時間:2017-05-20 09:09
本文關(guān)鍵詞:垃圾評論檢測算法的研究,由筆耕文化傳播整理發(fā)布。
【摘要】:在電子商務(wù)平臺上垃圾評論已經(jīng)嚴(yán)重影響到消費者的用戶體驗和切身利益,如何檢測垃圾評論成為當(dāng)前研究的熱點。垃圾評論可以分為內(nèi)容型垃圾評論和欺詐型評論,內(nèi)容型垃圾評論通常為了達(dá)到消息傳播的目的,欺詐型評論的目的在于改變潛在消費者對商品的印象。本文通過分析垃圾評論的表現(xiàn)形式,分別針對內(nèi)容型垃圾評論和欺詐型評論進(jìn)行分析和檢測。內(nèi)容型垃圾評論通常在評論內(nèi)容中添加廣告鏈接、垃圾網(wǎng)頁鏈接和黃賭毒等,其目的在于信息的推送和病毒的傳播等。本文通過研究內(nèi)容型垃圾評論的表現(xiàn)形式,分析內(nèi)容型垃圾評論的特征,設(shè)計BP神經(jīng)網(wǎng)絡(luò)模型和自編碼神經(jīng)網(wǎng)絡(luò)與樸素貝葉斯的結(jié)合模型對內(nèi)容型垃圾評論進(jìn)行檢測。欺詐型垃圾評論是指評論發(fā)布者通過虛假的發(fā)貨和虛假的訂單獲取大量的評論權(quán)限,蓄意吹捧和詆毀特定對象的形象,達(dá)到改變潛在消費者購買行為的虛假評論。欺詐型評論直接影響到消費者的購買決定,損害消費者對商品的知情權(quán)。本文通過分析欺詐型評論發(fā)布者表現(xiàn)形式,設(shè)計了基于多元特征的欺詐型評論檢測模型。其中多元特征包含用戶行為特征、商品特征、用戶自身屬性特征和評論內(nèi)容特征。根據(jù)研究表明評論發(fā)布者行為特征對欺詐型評論檢測貢獻(xiàn)較大,然而當(dāng)前在用戶行為特征提取中摻雜過多的人工參與,本文使用棧式自編碼神經(jīng)網(wǎng)絡(luò)對用戶行為特征進(jìn)行自動學(xué)習(xí),減少特征提取中的人工參與,致力于學(xué)習(xí)更全面的用戶行為特征,然后本文使用多元特征對欺詐型評論進(jìn)行檢測。
【關(guān)鍵詞】:垃圾評論檢測 自編碼神經(jīng)網(wǎng)絡(luò) 棧式自編碼神經(jīng)網(wǎng)絡(luò) 特征學(xué)習(xí)
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.1
【目錄】:
- 摘要6-7
- Abstract7-11
- 第1章 緒論11-15
- 1.1 課題研究背景及意義11
- 1.2 國內(nèi)外研究現(xiàn)狀11-13
- 1.3 研究內(nèi)容和目標(biāo)13
- 1.4 論文結(jié)構(gòu)安排13-15
- 第2章 垃圾評論檢測相關(guān)技術(shù)和算法15-27
- 2.1 垃圾評論檢測技術(shù)15-18
- 2.1.1 內(nèi)容型垃圾評論檢測技術(shù)15-17
- 2.1.2 欺詐型垃圾評論檢測技術(shù)17-18
- 2.2 垃圾評論檢測算法優(yōu)缺點18-19
- 2.3 人工神經(jīng)網(wǎng)絡(luò)19-24
- 2.3.1 感知器模型19-21
- 2.3.2 BP神經(jīng)網(wǎng)絡(luò)21-22
- 2.3.3 梯度下降算法22-24
- 2.4 棧式自編碼神經(jīng)網(wǎng)絡(luò)24-26
- 2.4.1 自編碼神經(jīng)網(wǎng)絡(luò)25
- 2.4.2 自編碼神經(jīng)網(wǎng)絡(luò)的PCA應(yīng)用25-26
- 2.4.3 稀疏自編碼神經(jīng)網(wǎng)絡(luò)26
- 2.5 本章小結(jié)26-27
- 第3章 垃圾評論檢測框架設(shè)計與數(shù)據(jù)預(yù)處理27-34
- 3.1 垃圾評論檢測總體框架27-28
- 3.2 垃圾評論數(shù)據(jù)集28-29
- 3.2.1 其他數(shù)據(jù)集29
- 3.3 數(shù)據(jù)集的準(zhǔn)備29-33
- 3.3.1 數(shù)據(jù)預(yù)處理30-32
- 3.3.2 垃圾評論檢測數(shù)據(jù)集32-33
- 3.4 本章小結(jié)33-34
- 第4章 內(nèi)容型垃圾評論檢測34-48
- 4.1 內(nèi)容型垃圾評論的表現(xiàn)手段34-35
- 4.2 特征選擇與分析35-38
- 4.2.1 評論元數(shù)據(jù)相關(guān)的特征35
- 4.2.2 評論內(nèi)容相關(guān)的特征35-38
- 4.2.3 評論發(fā)布者相關(guān)的特征38
- 4.3 內(nèi)容型垃圾評論檢測算法分析與設(shè)計38-42
- 4.3.1 基于BP神經(jīng)網(wǎng)絡(luò)內(nèi)容垃圾評論檢測模型38-39
- 4.3.2 自編碼神經(jīng)網(wǎng)絡(luò)與樸素貝葉斯結(jié)合模型39-42
- 4.4 實驗結(jié)果與分析42-47
- 4.4.1 數(shù)據(jù)歸一化42-43
- 4.4.2 基于BP神經(jīng)網(wǎng)絡(luò)的檢測模型實驗結(jié)果43
- 4.4.3 自編碼神經(jīng)網(wǎng)絡(luò)與樸素貝葉斯結(jié)合模型實驗結(jié)果43-46
- 4.4.4 實驗對比分析46-47
- 4.5 本章小結(jié)47-48
- 第5章 欺詐型評論檢測48-61
- 5.1 欺詐型評論的作弊手段48-49
- 5.2 欺詐型評論的檢測原理分析49
- 5.3 基于多元特征的欺詐型評論檢測模型49-56
- 5.3.1 欺詐型評論檢測框架50
- 5.3.2 評論內(nèi)容、用戶和商品的特征選擇50-52
- 5.3.3 用戶行為特征的學(xué)習(xí)模型52-56
- 5.4 欺詐評論檢測實驗對比與分析56-60
- 5.4.1 數(shù)據(jù)歸一化56
- 5.4.2 實驗結(jié)果分析56-59
- 5.4.3 實驗對比59-60
- 5.5 本章小結(jié)60-61
- 第6章 總結(jié)與展望61-63
- 6.1 總結(jié)61
- 6.2 不足與展望61-63
- 致謝63-64
- 參考文獻(xiàn)64-68
- 攻讀碩士學(xué)位期間發(fā)表的論文68
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 楊銘;祁巍;閆相斌;李一軍;;在線商品評論的效用分析研究[J];管理科學(xué)學(xué)報;2012年05期
本文關(guān)鍵詞:垃圾評論檢測算法的研究,由筆耕文化傳播整理發(fā)布。
,本文編號:381172
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/381172.html