天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于標簽傳播的網絡評論情感分析

發(fā)布時間:2021-04-03 01:51
  隨著“web3.0”時代以及新媒體時代的到來,以社交平臺為載體獲取最新資訊、傳遞個人觀點、表達群體訴求成為社會發(fā)展的重要趨勢。而情感分析的目的是為了找出表達群體在某些話題上或者針對一個文本觀點的態(tài)度以挖掘出有價值的信息,這些有價值的信息可以服務方方面面。因此,情感分析起著舉足輕重的作用。然而數據量的暴增,導致了情感分析過程中人力物力的大量損耗。在此基礎上,計算機自動完成情感分析的技術應運而生。情感詞典作為情感分析任務中極為重要的工具,其構建問題也逐步成為自然語言處理領域的熱門研究方向。但現有的情感詞典存在覆蓋率有限、領域適應能力較差等問題。因此,構建覆蓋率較廣,領域適應能力較強的情感詞典成為了此領域的核心挑戰(zhàn)。本文將半監(jiān)督學習方法-標簽傳播運用到情感詞典的構建中,通過構建覆蓋率廣,領域適應能力較強的情感詞典來提升對網絡評論進行情感分析的準確率。基于上述的研究背景,本文針對網絡評論情感分析所做的工作如下:1.為了處理情感詞典覆蓋率有限、領域適應能力較差等問題,本文提出了一種新的種子詞選取方法。先基于通用詞典人工選取種子詞,再利用人工選取的種子詞在語料上進行詞向量訓練,進一步選擇從而得到擴... 

【文章來源】:重慶郵電大學重慶市

【文章頁數】:65 頁

【學位級別】:碩士

【文章目錄】:
摘要
abstract
第1章 緒論
    1.1 研究背景及意義
    1.2 國內外研究現狀
        1.2.1 情感詞典的適應領域
        1.2.2 情感詞典的構建方式
    1.3 論文主要工作
    1.4 論文組織結構
第2章 理論基礎及相關工作
    2.1 半監(jiān)督學習
        2.1.1 標簽傳播算法
    2.2 詞向量介紹
        2.2.1 CBOW模型
        2.2.2 Skip-Gram模型
    2.3 相似度度量
        2.3.1 基于距離的相似性度量
        2.3.2 基于相似性系數的度量
        2.3.3 相關性度量-互信息
    2.4 情感詞典
        2.4.1 常見情感詞典資源
        2.4.2 情感詞典的擴充
    2.5 中文分詞技術
        2.5.1 基于字符串匹配的分詞方法
        2.5.2 基于理解的分詞方法
        2.5.3 基于統計以及機器學習的分詞方法
    2.6 本章小結
第3章 基于標簽傳播的情感詞典構建
    3.1 引言
    3.2 算法描述
        3.2.1 種子詞的選擇
        3.2.2 通過Word2Vec工具提取候選情感詞
        3.2.3 通過標簽傳播構建情感詞典
        3.2.4 算法描述
    3.3 本章小結
第4章 基于Word2Vec和改進互信息的多分類情感分析
    4.1 引言
    4.2 算法描述
        4.2.1 融合Word2Vec和改進互信息模型
    4.3 情感詞典的擴充
    4.4 本章總結
第5章 實驗與分析
    5.1 數據介紹及預處理
        5.1.1 數據介紹
        5.1.2 數據預處理
    5.2 評價指標
    5.3 基線方法
    5.4 實驗分析
        5.4.1 SS&W2V-LPA算法在真實數據集的結果與分析
        5.4.2 WP-LPA算法在真實數據集的結果與分析
    5.6 本章總結
第6章 總結與展望
    6.1 全文總結
    6.2 工作展望
參考文獻
致謝
攻讀碩士學位期間從事的科研工作及取得的成果



本文編號:3116377

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3116377.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶c32df***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com