天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于不平衡數(shù)據(jù)處理的電子商務垃圾評論識別研究

發(fā)布時間:2021-01-09 10:08
  隨著互聯(lián)網(wǎng)的快速發(fā)展,垃圾評論不斷產(chǎn)生,垃圾評論對消費者參考購物產(chǎn)生了極大的干擾,同時擾亂了網(wǎng)絡環(huán)境的正常秩序。有效識別電子商務垃圾評論對于消費者和商家來說都是一項迫切的需求。近年來,隨著電商模式和電商法律的不斷完善,商品評論數(shù)據(jù)的內(nèi)容也在發(fā)生著變化,為了有效識別垃圾評論,在電子商務垃圾評論指標選取方面應當有所改善。同時受電商法的制約,垃圾評論數(shù)據(jù)數(shù)量較之前會大大減少,數(shù)據(jù)的不平衡也是本文需要解決的影響電子商務垃圾評論識別效果的一個問題。本文就電子商務垃圾評論識別研究做了如下四方面的工作:第一,確定了合理的垃圾評論識別指標。在充分研究國內(nèi)外關于電子商務垃圾評論識別指標選取的基礎上,總結最具權威的現(xiàn)有學者所選取的指標后,結合電子商務法律和法規(guī)出臺政策,提出了產(chǎn)品名稱、產(chǎn)品屬性、評論文本的長度、評論文本中的正(負)情感詞、評論內(nèi)容的投票數(shù)、評論用戶的信譽經(jīng)驗或信用等7項最能識別電子商務垃圾評論的可信度指標,將本文所選取的指標與現(xiàn)有學者所選指標分別在不同分類器下進行對比驗證,得到了較好的驗證結果。第二,對電子商務垃圾評論數(shù)據(jù)進行預處理。本文垃圾評論數(shù)據(jù)來源于聚數(shù)力大數(shù)據(jù)平臺下的公開數(shù)據(jù)集,A... 

【文章來源】:山西財經(jīng)大學山西省

【文章頁數(shù)】:82 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 電子商務垃圾評論識別國內(nèi)外研究現(xiàn)狀
        1.2.2 不平衡數(shù)據(jù)處理國內(nèi)外研究現(xiàn)狀
        1.2.3 研究述評
    1.3 本文的研究內(nèi)容和研究思路
        1.3.1 研究內(nèi)容
        1.3.2 研究思路及方法
    1.4 主要工作和創(chuàng)新
    1.5 論文結構
第2章 電子商務垃圾評論識別相關理論與技術
    2.1 文本處理相關技術
    2.2 文本相似性度量方法
    2.3 不平衡數(shù)據(jù)抽樣技術
        2.3.1 不平衡數(shù)據(jù)特點
        2.3.2 不平衡數(shù)據(jù)抽樣技術
    2.4 文本分類算法
    2.5 本章小結
第3章 電子商務垃圾評論指標的選取及數(shù)據(jù)預處理
    3.1 電子商務垃圾評論的特點
    3.2 電子商務垃圾評論指標選擇的依據(jù)
    3.3 基于可信度的電子商務垃圾評論指標選取
    3.4 電子商務垃圾評論數(shù)據(jù)預處理
        3.4.1 數(shù)據(jù)的獲取
        3.4.2 垃圾評論內(nèi)容中情感詞的提取
    3.5 指標選取有效性的檢驗
        3.5.1 實驗設置
        3.5.2 結果分析
    3.6 本章小結
第4章 基于改進混合采樣的垃圾評論不平衡數(shù)據(jù)處理方法
    4.1 電子商務垃圾評論數(shù)據(jù)的不平衡性
    4.2 改進混合采樣算法的設計依據(jù)
    4.3 改進混合采樣算法的基本思想
        4.3.1 改進的K-means聚類欠采樣算法
        4.3.2 改進的Borderline-SMOTE過采樣算法
    4.4 改進混合采樣算法在電子商務垃圾評論識別中的應用
        4.4.1 改進算法的有效性度量
        4.4.2 垃圾評論識別參數(shù)設置與結果分析
    4.5 本章小結
第5章 基于異構個體組合分類器的垃圾評論識別
    5.1 異構個體組合分類器的設計依據(jù)
    5.2 異構個體組合分類器的基本思想
    5.3 異構個體組合分類器在電子商務垃圾評論識別中的應用
    5.4 綜合改進算法在其他電子商務垃圾評論數(shù)據(jù)上的應用
        5.4.1 實驗數(shù)據(jù)集
        5.4.2 有效性驗證
    5.5 本章小結
第6章 總結與展望
    6.1 總結
    6.2 展望
附錄
參考文獻
致謝
攻讀碩士學位期間發(fā)表的論文和其它科研情況


【參考文獻】:
期刊論文
[1]一種基于質(zhì)心空間的不均衡數(shù)據(jù)欠采樣方法[J]. 金旭,王磊,孫國梓,李華康.  計算機科學. 2019(02)
[2]基于混合采樣的不平衡數(shù)據(jù)集算法研究[J]. 張明,胡曉輝,吳嘉昕.  計算機工程與應用. 2019(17)
[3]一種改進過采樣的不平衡數(shù)據(jù)集成分類算法[J]. 張菲菲,王黎明,柴玉梅.  小型微型計算機系統(tǒng). 2018(10)
[4]一種基于卡方檢驗的不平衡數(shù)據(jù)分類方法[J]. 浮盼盼,潘正高,王勝,高亞蘭.  宿州學院學報. 2018(07)
[5]《2017-2018年中國電子商務法律報告》發(fā)布[J]. 姚建芳.  計算機與網(wǎng)絡. 2018(11)
[6]面向不平衡數(shù)據(jù)集分類模型的優(yōu)化研究[J]. 溫雪巖,陳家男,景維鵬,徐克生.  計算機工程. 2018(04)
[7]改進Smote算法在不平衡數(shù)據(jù)集上的分類研究[J]. 易未,毛力,孫俊,吳林海.  計算機與現(xiàn)代化. 2018(03)
[8]基于卷積神經(jīng)網(wǎng)絡的虛假評論識別模型[J]. 韓俁談.  科學技術創(chuàng)新. 2018(06)
[9]面向產(chǎn)品評論識別的研究[J]. 武雅萱,王悅欣,李洋,王博晨.  科教文匯(中旬刊). 2017(06)
[10]基于樣本權重的不平衡數(shù)據(jù)欠抽樣方法[J]. 熊冰妍,王國胤,鄧維斌.  計算機研究與發(fā)展. 2016(11)

碩士論文
[1]產(chǎn)品評論挖掘的觀點抽取和分類技術研究[D]. 李培.重慶大學 2009



本文編號:2966444

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/2966444.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶98459***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com