天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于域?qū)咕W(wǎng)絡的跨領域文本情感分析

發(fā)布時間:2020-07-10 08:15
【摘要】:隨著web2.0的發(fā)展,互聯(lián)網(wǎng)深入人們生活的方方面面,同時為人們提供了更加方便和寬廣的信息交流平臺。越來越多的用戶在社交平臺上表達自己的想法,在購物平臺上闡述自己對產(chǎn)品的使用看法,在新聞平臺上發(fā)表個人觀點,由此產(chǎn)生了大量包含用戶觀點信息的文本數(shù)據(jù),因此分析這些文本數(shù)據(jù)的情感極性也就有了很重要的價值。情感分析又稱意見挖掘,是對網(wǎng)上各種新聞資源、社會媒體評論和其他用戶生成內(nèi)容的進行分析、處理、歸納和推理的過程。文本情感分析是情感分析算法的一個分支,典型的監(jiān)督分類算法都適用于文本的情感極性分析。然而,當訓練數(shù)據(jù)與測試數(shù)據(jù)不屬于同一個領域的時候,傳統(tǒng)的分類方法的預測效果就變得很差。通常是因為源領域有強烈情感性的特征在目標領域可能不再具有這些特征或是呈現(xiàn)其他情感極性,為了將源領域的特征泛化到目標領域特征中,并對目標領域進行情感分析,跨領域情感分析成為了解決方案之一?珙I域情感分析方法當前主要關注用特征提取器提取多個領域之間的共享情感特征。其中利用深度學習中特征提取網(wǎng)絡優(yōu)秀的特征提取能力提取不同領域之間的共享情感特征,再利用共享情感特征進行情感分析是當前跨領域文本情感分析的主要研究方向。目前深度學習方案中主要利用自編碼器和域?qū)箤崿F(xiàn)共享情感特征的提取,因此本文主要優(yōu)化改進域?qū)鼓芰σ约袄蒙疃葘W習中的各種不同的網(wǎng)絡結(jié)構(gòu)提取句子中的語義信息,最后將提取出來的不同領域文本中的共享情感特征用于文本情感分析。本文的主要研究內(nèi)容,及創(chuàng)新點如下:(1)由于不同領域之間的特征不同,使用以往的域?qū)狗绞饺菀壮霈F(xiàn)梯度消失和梯度爆炸,并且提取的特征泛化能力差的問題。本文通過提出基于Wasserstein距離的域?qū)狗绞?然后結(jié)合正交約束來更好地提取領域深層共享特征,同時在整體網(wǎng)絡結(jié)構(gòu)上使用降噪自編碼器,使得特征提取器能夠提取出魯棒性更強的領域共享情感特征。(2)針對以往特征提取方式提取的共享情感特征中缺少句子語義信息等問題,本文使用BERT模型獲取句子中的語義信息,再借助卷積神經(jīng)網(wǎng)絡對提取的特征進一步的特征選擇以及特征降維。然后借助域?qū)箼C制混淆源領域和目標領域的特征,同時利用源領域含標簽的數(shù)據(jù)訓練情感分類器。最后在亞馬遜公開數(shù)據(jù)集上的對目標領域情感極性進行預測,并且取得了較好的預測結(jié)果。
【學位授予單位】:桂林電子科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.1;TP183
【圖文】:

情感分析,文本


圖 2-2 文本情感分析方法的一般過程針對圖 2-2 中的(b)中的特征提,是指原始特征中經(jīng)過某種設定的形式轉(zhuǎn)化成具有代表性的特征,通常會在文本預處理時利用人工選擇的停用詞將一些字詞去除,或者是從原始特征中經(jīng)過某種特征選擇的方法來挑選出若干最有效特征,這些提取出來的特征都是底層特征,詞與詞之間的關系都不能從特征之中體現(xiàn)出來。在具體的實施中,較常用的特征提取方法有句法分析(ParserAnalysis)、N-grams、BOW、TF-IDF等。針對圖 2-2 中(c)的深度特征提取,針對不同的文本表示方式將選用不同的深度網(wǎng)絡結(jié)構(gòu)搭建深度特征提取模型。一般來說,使用 BOW 等表示特征時,會選用全連接網(wǎng)絡,當文本使用詞向量表示時,可以利用目前主流的 CNN、RNN 和 RNN 的變形網(wǎng)絡 LSTM,GRU[103](Gate Recurrent Unit)等一些不同形式的網(wǎng)絡組成的混合深度網(wǎng)絡模型等來構(gòu)建特征提取網(wǎng)絡,其中 LSTM 在文本情感分析領域中較常見。這是因為 LSTM 很容易就能獲取文本的時序性信息,因此 LSTM 能夠在一定程度上體現(xiàn)出詞與詞之間的關系,從而得到句子的語義信息。BERT 通過自注意力機制建立詞與詞之間的關系,由于沒有遺忘門的參與,特征得以完整保留,并且訓練時間較 LSTM

情感分析,文本,領域


實例的跨領域文本情感分析或是基于共享情感特征的跨領域情領域之間在實例或是在特征上的差異性。域文本情感分析的與 2.2.1 節(jié)中的文本預處理方式一致,但是在中不同,研究者們會通過不同的領域適應方式實現(xiàn)領域之間的混分析一般流程如圖 2-3 所示。

全連接,神經(jīng)網(wǎng)絡,易于理解,神經(jīng)網(wǎng)絡模型


基于域?qū)咕W(wǎng)絡的跨領域文本情感分析§3.2 全連接神經(jīng)網(wǎng)絡網(wǎng)絡(FullyConnectedNeuralNetwork)也被稱作稠密Multilayer Perceptron)改進形成,其特點是網(wǎng)絡中的參數(shù)很多。全連接神經(jīng)網(wǎng)絡的核心是矩陣運算,( )fy f W x輸出結(jié)果,f表示函數(shù)的激活,fW表示權(quán)重,x在復雜的網(wǎng)絡中通常用作網(wǎng)絡最后的輸出值,對網(wǎng) 3-1 所示,全連接神經(jīng)網(wǎng)絡主要有輸入層,隱藏層多個全連接網(wǎng)絡構(gòu)成。

【參考文獻】

相關期刊論文 前8條

1 張博;史忠植;趙曉非;張建華;;一種基于跨領域典型相關性分析的遷移學習方法[J];計算機學報;2015年07期

2 趙傳君;王素格;李德玉;李欣;;基于分組提升集成的跨領域文本情感分類[J];計算機研究與發(fā)展;2015年03期

3 魏現(xiàn)輝;張紹武;楊亮;林鴻飛;;基于加權(quán)SimRank的跨領域文本情感傾向性分析[J];模式識別與人工智能;2013年11期

4 楊立公;朱儉;湯世平;;文本情感分析綜述[J];計算機應用;2013年06期

5 黃賢立;;基于典型相關分析的多視圖跨領域情感分類[J];計算機工程;2010年24期

6 吳瓊;譚松波;許洪波;段m#毅;程學旗;;基于隨機游走模型的跨領域傾向性分析研究[J];計算機研究與發(fā)展;2010年12期

7 趙妍妍;秦兵;劉挺;;文本情感分析[J];軟件學報;2010年08期

8 吳瓊;譚松波;張剛;段m#毅;程學旗;;跨領域傾向性分析相關技術研究[J];中文信息學報;2010年01期



本文編號:2748664

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2748664.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bcedc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com