天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于隱性特征提取的產(chǎn)品評論挖掘

發(fā)布時間:2021-05-10 23:48
  隨著互聯(lián)網(wǎng)技術的發(fā)展,網(wǎng)絡不可避免地成為了一個巨大的信息集合場所,儲存著大量有價值的信息,其中就包含了海量的非結構化信息。信息資源的充分利用過程中,不可缺少的一部分就是將非結構化信息轉化為結構化信息,產(chǎn)品評論挖掘就是其中一種。然而目前的產(chǎn)品評論挖掘大部分是基于顯性特征的分析,對于隱性特征的分析還不是很成熟。因此本文在考慮隱性特征提取的基礎上完成產(chǎn)品評論挖掘任務,從電商網(wǎng)絡平臺中爬取茶葉評論數(shù)據(jù),發(fā)掘其中隱藏的有價值的信息。本文首先通過對堆疊降噪自編碼器進行無監(jiān)督的逐層預訓練與有監(jiān)督的微調過程,構建顯性特征提取模型,完成產(chǎn)品特征集合的構建;隨后通過建立評論語料庫的CBOW模型,構建隱性特征提取模型,將未包含顯性特征的評論充分利用;其次,在基于現(xiàn)有詞典的基礎上,利用雙向傳播法,對現(xiàn)有的情感詞典進行擴充;然后,以點互信息作為量化指標,完成對各特征-情感詞關聯(lián)對的量化,以及對產(chǎn)品特征的整體評價;最后對計算的得分進行分析,展現(xiàn)產(chǎn)品評論挖掘的實際價值。 

【文章來源】:西南財經(jīng)大學四川省 211工程院校 教育部直屬院校

【文章頁數(shù)】:54 頁

【學位級別】:碩士

【文章目錄】:
摘要
abstract
1 緒論
    1.1 研究背景及意義
    1.2 國內外研究現(xiàn)狀
        1.2.1 產(chǎn)品特征提取
        1.2.2 特征-情感詞關聯(lián)對提取
        1.2.3 情感分析
        1.2.4 深度學習在產(chǎn)品評論挖掘中的應用
    1.3 本文主要研究內容
    1.4 論文組織結構以及創(chuàng)新點
    1.5 本章小結
2 相關技術與理論
    2.1 相關概念定義
    2.2 文本表示方法
        2.2.1 One-Hot編碼
        2.2.2 向量空間模型
        2.2.3 Word2vec語言模型
    2.3 堆疊降噪自編碼器
        2.3.1 自動編碼器
        2.3.2 堆疊自動編碼器
        2.3.3 堆疊降噪自編碼器
    2.4 點互信息
    2.5 本章小結
3 模型構建
    3.1 特征提取
        3.1.1 基于SdA構建的顯性特征提取模型
        3.1.2 基于CBOW構建的隱性特征提取模型
    3.2 情感詞典構造
        3.2.1 構建基礎詞典
        3.2.2 基于雙向循環(huán)的詞典更新
    3.3 情感分析
        3.3.1 特征-情感詞關聯(lián)對提取
        3.3.2 情感得分計算
    3.4 本章小結
4 實驗及分析
    4.1 實驗準備
        4.1.1 數(shù)據(jù)來源及預處理
        4.1.2 評價指標
    4.2 特征提取
        4.2.1 人工特征提取
        4.2.2 顯性特征提取
        4.2.3 隱性特征提取
    4.3 情感分析
        4.3.1 情感詞典構建
        4.3.2 情感得分計算
    4.4 本章小結
5 總結與展望
    5.1 總結
    5.2 展望
參考文獻
致謝



本文編號:3180289

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3180289.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶8836b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com