基于半監(jiān)督學(xué)習(xí)的虛假評論識別研究
發(fā)布時間:2021-04-08 16:18
近年來,隨著網(wǎng)絡(luò)購物的發(fā)展,消費者逐漸由傳統(tǒng)的線下購物轉(zhuǎn)向更便捷的線上購物,且養(yǎng)成了對已購買商品發(fā)布評論的習(xí)慣。電子商務(wù)平臺上逐漸積累了大量的在線商品評論,這些評論信息為商家,潛在消費者和研究者們提供了珍貴的數(shù)據(jù)資源。由于在線評論信息可以在某種程度上影響消費者的購物決策,進(jìn)而影響產(chǎn)品銷量,因此在商品評論中逐漸出現(xiàn)了一些不真實的內(nèi)容。這些虛假評論迷惑了消費者,降低了在線評論的參考價值,擾亂了正常的電商秩序,因此識別虛假評論顯得尤為重要。在線商品評論是最具有代表意義的評論信息,是虛假評論識別問題的理想數(shù)據(jù)源,也是本文使用的數(shù)據(jù)集。本文對虛假評論識別技術(shù)和半監(jiān)督學(xué)習(xí)方法進(jìn)行了研究與分析,首先介紹了虛假評論識別問題的研究現(xiàn)狀和發(fā)展趨勢,然后介紹了半監(jiān)督學(xué)習(xí)原理及其分類方法,最后將基于分歧的半監(jiān)督學(xué)習(xí)領(lǐng)域的三個主流算法:協(xié)同訓(xùn)練(Co-Training)算法,三體訓(xùn)練法(Tri-Training)算法和協(xié)同隨機森林(Co-Forest)算法應(yīng)用到了虛假評論識別任務(wù)中,提出了基于半監(jiān)督學(xué)習(xí)的虛假評論識別模型。本文圍繞在線商品評論數(shù)據(jù),基于分歧的半監(jiān)督學(xué)習(xí),虛假評論識別問題等關(guān)鍵問題展開研究,主要的...
【文章來源】:南京財經(jīng)大學(xué)江蘇省
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 虛假評論識別研究現(xiàn)狀
1.2.2 半監(jiān)督學(xué)習(xí)研究現(xiàn)狀
1.2.3 小結(jié)
1.3 研究內(nèi)容和創(chuàng)新點
1.3.1 研究內(nèi)容
1.3.2 技術(shù)路線和創(chuàng)新點
第二章 虛假評論識別和半監(jiān)督學(xué)習(xí)相關(guān)理論
2.1 虛假評論識別相關(guān)理論
2.1.1 虛假評論介紹
2.1.2 虛假評論識別方法
2.2 半監(jiān)督學(xué)習(xí)相關(guān)理論
2.2.1 半監(jiān)督學(xué)習(xí)原理
2.2.2 半監(jiān)督學(xué)習(xí)分類
2.3 本章小結(jié)
第三章 數(shù)據(jù)預(yù)處理和特征構(gòu)建
3.1 數(shù)據(jù)描述
3.1.1 獲取源數(shù)據(jù)
3.1.2 分布分析
3.2 訓(xùn)練集構(gòu)建
3.2.1 重復(fù)評論
3.2.2 數(shù)據(jù)標(biāo)注
3.3 特征構(gòu)建
3.3.1 特征概述
3.3.2 特征集合
3.4 本章小結(jié)
第四章 基于半監(jiān)督學(xué)習(xí)的虛假評論識別方法
4.1 基于CO-TRAINING算法的虛假評論識別模型
4.1.1 CO-TRAINING算法
4.1.2 基于CO-TRAINING算法的虛假評論識別算法
4.2 基于TRI-TRAINING算法的虛假評論識別模型
4.2.1 TRI-TRAINING算法
4.2.2 基于TRI-TRAINING算法的虛假評論識別算法
4.3 基于CO-FOREST算法的虛假評論識別模型
4.3.1 CO-FOREST算法
4.3.2 基于CO-FOREST算法的虛假評論識別模型
4.4 本章小結(jié)
第五章 實驗結(jié)果與分析
5.1 實驗平臺與評價指標(biāo)
5.2 基于全監(jiān)督框架的最優(yōu)特征選擇
5.2.1 全監(jiān)督框架
5.2.2 特征實驗結(jié)果
5.3 基于半監(jiān)督學(xué)習(xí)的虛假評論識別模型實驗結(jié)果分析
5.3.1 基于不同半監(jiān)督學(xué)習(xí)算法的實驗設(shè)計與結(jié)果分析
5.3.2 標(biāo)注數(shù)據(jù)比例和參數(shù)敏感性的實驗結(jié)果分析
5.4 本章小結(jié)
第六章 結(jié)論與展望
6.1 研究結(jié)論
6.2 研究展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文
后記
【參考文獻(xiàn)】:
期刊論文
[1]基于DDAG-SVM的在線商品評論可信度分類模型[J]. 陳燕方. 情報理論與實踐. 2017(07)
[2]一種基于啟發(fā)式規(guī)則的半監(jiān)督垃圾評論分類方法[J]. 張鵬,王素格,李德玉,王杰. 山東大學(xué)學(xué)報(理學(xué)版). 2017(07)
[3]在線商品虛假評論關(guān)鍵問題研究綜述[J]. 朱娟. 現(xiàn)代情報. 2017(05)
[4]基于SVM分類模型的垃圾文本識別研究[J]. 黃正偉,唐芳艷. 數(shù)學(xué)的實踐與認(rèn)識. 2016(07)
[5]一種用于微博謠言檢測的半監(jiān)督學(xué)習(xí)算法[J]. 路同強,石冰,閆中敏,周珮. 計算機應(yīng)用研究. 2016(03)
[6]基于特征表現(xiàn)的虛假評論人預(yù)測研究[J]. 聶卉,吳毅駿. 圖書情報工作. 2015(10)
[7]基于隨機森林的產(chǎn)品垃圾評論識別[J]. 何瓏. 中文信息學(xué)報. 2015(03)
[8]基于PU學(xué)習(xí)算法的虛假評論識別研究[J]. 任亞峰,姬東鴻,張紅斌,尹蘭. 計算機研究與發(fā)展. 2015(03)
[9]在線商品虛假評論形成路徑研究[J]. 陳燕方,婁策群. 現(xiàn)代情報. 2015(01)
[10]電子商務(wù)中垃圾評論檢測的特征提取方法[J]. 游貴榮,吳為,錢沄濤. 現(xiàn)代圖書情報技術(shù). 2014(10)
本文編號:3125861
【文章來源】:南京財經(jīng)大學(xué)江蘇省
【文章頁數(shù)】:68 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 虛假評論識別研究現(xiàn)狀
1.2.2 半監(jiān)督學(xué)習(xí)研究現(xiàn)狀
1.2.3 小結(jié)
1.3 研究內(nèi)容和創(chuàng)新點
1.3.1 研究內(nèi)容
1.3.2 技術(shù)路線和創(chuàng)新點
第二章 虛假評論識別和半監(jiān)督學(xué)習(xí)相關(guān)理論
2.1 虛假評論識別相關(guān)理論
2.1.1 虛假評論介紹
2.1.2 虛假評論識別方法
2.2 半監(jiān)督學(xué)習(xí)相關(guān)理論
2.2.1 半監(jiān)督學(xué)習(xí)原理
2.2.2 半監(jiān)督學(xué)習(xí)分類
2.3 本章小結(jié)
第三章 數(shù)據(jù)預(yù)處理和特征構(gòu)建
3.1 數(shù)據(jù)描述
3.1.1 獲取源數(shù)據(jù)
3.1.2 分布分析
3.2 訓(xùn)練集構(gòu)建
3.2.1 重復(fù)評論
3.2.2 數(shù)據(jù)標(biāo)注
3.3 特征構(gòu)建
3.3.1 特征概述
3.3.2 特征集合
3.4 本章小結(jié)
第四章 基于半監(jiān)督學(xué)習(xí)的虛假評論識別方法
4.1 基于CO-TRAINING算法的虛假評論識別模型
4.1.1 CO-TRAINING算法
4.1.2 基于CO-TRAINING算法的虛假評論識別算法
4.2 基于TRI-TRAINING算法的虛假評論識別模型
4.2.1 TRI-TRAINING算法
4.2.2 基于TRI-TRAINING算法的虛假評論識別算法
4.3 基于CO-FOREST算法的虛假評論識別模型
4.3.1 CO-FOREST算法
4.3.2 基于CO-FOREST算法的虛假評論識別模型
4.4 本章小結(jié)
第五章 實驗結(jié)果與分析
5.1 實驗平臺與評價指標(biāo)
5.2 基于全監(jiān)督框架的最優(yōu)特征選擇
5.2.1 全監(jiān)督框架
5.2.2 特征實驗結(jié)果
5.3 基于半監(jiān)督學(xué)習(xí)的虛假評論識別模型實驗結(jié)果分析
5.3.1 基于不同半監(jiān)督學(xué)習(xí)算法的實驗設(shè)計與結(jié)果分析
5.3.2 標(biāo)注數(shù)據(jù)比例和參數(shù)敏感性的實驗結(jié)果分析
5.4 本章小結(jié)
第六章 結(jié)論與展望
6.1 研究結(jié)論
6.2 研究展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文
后記
【參考文獻(xiàn)】:
期刊論文
[1]基于DDAG-SVM的在線商品評論可信度分類模型[J]. 陳燕方. 情報理論與實踐. 2017(07)
[2]一種基于啟發(fā)式規(guī)則的半監(jiān)督垃圾評論分類方法[J]. 張鵬,王素格,李德玉,王杰. 山東大學(xué)學(xué)報(理學(xué)版). 2017(07)
[3]在線商品虛假評論關(guān)鍵問題研究綜述[J]. 朱娟. 現(xiàn)代情報. 2017(05)
[4]基于SVM分類模型的垃圾文本識別研究[J]. 黃正偉,唐芳艷. 數(shù)學(xué)的實踐與認(rèn)識. 2016(07)
[5]一種用于微博謠言檢測的半監(jiān)督學(xué)習(xí)算法[J]. 路同強,石冰,閆中敏,周珮. 計算機應(yīng)用研究. 2016(03)
[6]基于特征表現(xiàn)的虛假評論人預(yù)測研究[J]. 聶卉,吳毅駿. 圖書情報工作. 2015(10)
[7]基于隨機森林的產(chǎn)品垃圾評論識別[J]. 何瓏. 中文信息學(xué)報. 2015(03)
[8]基于PU學(xué)習(xí)算法的虛假評論識別研究[J]. 任亞峰,姬東鴻,張紅斌,尹蘭. 計算機研究與發(fā)展. 2015(03)
[9]在線商品虛假評論形成路徑研究[J]. 陳燕方,婁策群. 現(xiàn)代情報. 2015(01)
[10]電子商務(wù)中垃圾評論檢測的特征提取方法[J]. 游貴榮,吳為,錢沄濤. 現(xiàn)代圖書情報技術(shù). 2014(10)
本文編號:3125861
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/3125861.html
最近更新
教材專著