天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于詞向量概率模型的聯(lián)合話題情感分析研究

發(fā)布時間:2019-10-24 01:46
【摘要】:互聯(lián)網(wǎng)的迅速發(fā)展與普及給用戶提供了很多便利。用戶可以很方便地瀏覽和評論在線商品、服務(wù)以及新聞數(shù)據(jù)等網(wǎng)絡(luò)信息。用戶的評論信息一定程度上反映了用戶對某一評論話題的情感態(tài)度,因此有效地分析和挖掘出用戶的評論信息是非常有價值的。然而,目前針對在線評論信息的聯(lián)合話題情感分析方法大都基于數(shù)據(jù)自身的屬性,以單個詞語為基本的處理單元,把每個詞語看作一個單一的語義實體,基于詞的共現(xiàn)統(tǒng)計規(guī)律進行相應的概率計算,忽略了文本中詞語與詞語之間的依賴關(guān)系,并且采用固定的情感詞典,語義信息并不充分,很難有效表達復雜的語義關(guān)系,不能夠滿足實際的應用需求。針對這些問題,本文以用戶的在線評論文本數(shù)據(jù)為研究對象,結(jié)合概率主題模型與詞向量以及神經(jīng)網(wǎng)絡(luò),提出了新的聯(lián)合話題情感分析模型,可以同時地對文本進行話題識別和情感分析,主要工作包括以下兩個部分:(1)提出弱監(jiān)督的詞向量聯(lián)合話題情感分析模型(簡稱WS-TSWE)。大部分現(xiàn)有的聯(lián)合話題情感分析模型主要根據(jù)詞頻統(tǒng)計進行相關(guān)概率的計算,當語料數(shù)較少或文本篇幅較短時,文本特征相對稀疏并且特征維度較高,這種單純依靠詞頻統(tǒng)計進行話題和情感分配的方法往往會因為語義信息不足而造成情感分布和話題分布的結(jié)果不夠理想;并且依賴特有領(lǐng)域的情感知識先驗信息來識別語料中的正向和負向詞,導致情感先驗的影響受到限制,最終造成話題情感方面的情感分布結(jié)果不準確。針對這些問題,本文基于概率主題模型latent Dirichlet allocation(LDA),通過加入情感層,從外部擴展語料獲取詞語的外部詞向量表示,利用伯努利分布將詞頻統(tǒng)計生成的情感話題-詞分布與通過softmax函數(shù)得出的情感話題-詞分布結(jié)合計算聯(lián)合概率分布函數(shù),進而訓練得出情感話題-詞的生成。在此基礎(chǔ)上,模型進一步利用HowNet詞典計算語料中每一個詞的情感傾向,首先利用HowNet計算詞的情感值,然后結(jié)合語料的上下文信息和模型訓練不斷更新情感值,提高了聯(lián)合話題情感分析模型的準確性。(2)提出詞向量依賴的聯(lián)合話題情感分析模型(簡稱RTSWE)。弱監(jiān)督的詞向量聯(lián)合話題情感分析模型(WS-TSWE)盡管擴展了詞的語義信息,但是模型在生成詞的過程中并沒有充分考慮文本中詞語與詞語之間的依賴關(guān)系,使得每個詞匯之間的語義信息相對獨立。本文在(1)的基礎(chǔ)上,利用(1)得出的情感-話題向量的結(jié)果,同時利用深度神經(jīng)網(wǎng)絡(luò)LSTM(Long short term)和GRU(Gated Recurrent Unit)的計算詞語之間的長距離的依賴關(guān)系,最后計算在給定情感話題以及詞序列依賴關(guān)系下生成詞的概率,充分利用LSTM和GRU的特點,融入詞語間的序列信息,擴展了詞語與詞語之間的依賴信息,進而豐富了詞的語義信息,重新定義情感話題-詞的分布,從而使得話題識別和情感分析的結(jié)果更加準確。
【學位授予單位】:深圳大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.1

【相似文獻】

相關(guān)期刊論文 前10條

1 楊潔;鄭寧;徐海濤;劉董;徐明;;支持向量預選取的域著色Voronoi圖方法[J];計算機應用與軟件;2008年12期

2 李慶;胡捍英;;支持向量預選取的K邊界近鄰法[J];電路與系統(tǒng)學報;2013年02期

3 鄭逢德;張鴻賓;;在線Lagrangian支撐向量回歸[J];北京工業(yè)大學學報;2013年07期

4 趙春暉;張q,

本文編號:2552332


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2552332.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c00a9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com