天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于雙層卷積神經(jīng)網(wǎng)絡(luò)和擴(kuò)展特征矩陣的中文微博情感分析研究

發(fā)布時(shí)間:2021-07-15 18:58
  隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,微博逐漸成為中國(guó)網(wǎng)民日常溝通交流的重要平臺(tái)之一。作為中文社交網(wǎng)絡(luò)的重要組成部分,微博平臺(tái)所同時(shí)具備的社交及媒體屬性,使得用戶可以實(shí)時(shí)了解社會(huì)熱點(diǎn)事件,并發(fā)表自己的觀點(diǎn)和看法。無(wú)論是對(duì)于社會(huì)事件,還是商品評(píng)論,微博的輿論往往可以影響甚至改變事件走向。因此,如何快速地挖掘出單個(gè)微博話題下微博用戶的輿論傾向,為政府和企業(yè)提供決策參考,有效的引導(dǎo)社會(huì)輿論,成為目前自然語(yǔ)言處理領(lǐng)域的研究熱點(diǎn)之一,具有較強(qiáng)的現(xiàn)實(shí)和經(jīng)濟(jì)意義。傳統(tǒng)的情感分析模型,主要方法是基于語(yǔ)言學(xué)建立情感詞典。但是,語(yǔ)言詞典的建立和維護(hù)往往需要耗費(fèi)大量的時(shí)間。為了適應(yīng)中文微博情感分析任務(wù)中存在的數(shù)據(jù)稀疏、忽略微博文本中的表情和詞語(yǔ)特征等特點(diǎn),近年來(lái),關(guān)于基于機(jī)器學(xué)習(xí)方法的文本分析算法的研究越來(lái)越深入。在微博文本情感的二元分析任務(wù)上,本文首先對(duì)比了不同的淺層學(xué)習(xí)模型。然后在卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)基礎(chǔ)上,采用了一種融合雙層卷積神經(jīng)網(wǎng)絡(luò)和擴(kuò)展特征矩陣的微博情感分析算法Extended-Dual-CNN,嘗試在深度學(xué)習(xí)領(lǐng)域解決微博情感分析問(wèn)題。本文分別對(duì)淺層... 

【文章來(lái)源】:昆明理工大學(xué)云南省

【文章頁(yè)數(shù)】:75 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于雙層卷積神經(jīng)網(wǎng)絡(luò)和擴(kuò)展特征矩陣的中文微博情感分析研究


#重慶公交車(chē)墜江原因#話題評(píng)論

示意圖,函數(shù),情感,文本


第三章基于淺層學(xué)習(xí)的微博文本情感分析比較研究21=11+exp((10))=11+exp()···············(3.5)W取-1時(shí),得到Sigmoid函數(shù)示意圖,如圖3.1所示:圖3.1Sigmoid函數(shù)具體到本文的微博文本情感分析問(wèn)題上,本節(jié)引入了邏輯回歸模型(LogisticRegression,LR)。邏輯回歸模型基于最大熵原理,實(shí)質(zhì)上是最大熵模型在類(lèi)別為二類(lèi)時(shí)的特殊情況,即邏輯回歸模型的本質(zhì)是一個(gè)二分類(lèi)的線性回歸模型;谶壿嫽貧w模型的微博文本情感分析算法定義如下:首先,通過(guò)公式3.5的Sigmoid函數(shù),將線性求和后的特征映射到(0,1)區(qū)間上。在本節(jié)邏輯回歸模型上,規(guī)定=0時(shí),代表負(fù)向微博情感,=1時(shí)代表正向微博情感。將微博文本生成的詞向量設(shè)為,則對(duì)應(yīng)的正向微博情感上的條件概率為(=1|,),負(fù)向微博情感上的條件概率為(=0|,)。其中w為權(quán)重。則對(duì)應(yīng)的二分類(lèi)條件概率分布P(Y|X)為:(|)={(=1|,)=11+exp()(=0|,)=exp()1+exp()·················(3.6)然后,對(duì)于公式3.6的求解問(wèn)題,使用隨機(jī)梯度下降(StochasticGradientDescent,SGD),具體步驟為:。1.首先,令為微博文本的真實(shí)情感極性,y為預(yù)測(cè)微博文本情感極性。嘗試定義平方損失函數(shù):(,)=12(y)2·······················(3.7)

流程圖,流程,支持向量機(jī),向量


第三章基于淺層學(xué)習(xí)的微博文本情感分析比較研究33Recall_p與Recall_n的分布也更加均衡,差距更校相比于樸素貝葉斯模型在Word2Vec構(gòu)建的詞向量上取得的最佳分類(lèi)準(zhǔn)確率51.85%,邏輯回歸模型的分類(lèi)準(zhǔn)確率有了明顯的提升。主要原因是邏輯回歸模型在訓(xùn)練時(shí),無(wú)論特征之間是否存在相關(guān)性,都可以通過(guò)隨機(jī)梯度下降獲得最佳參數(shù),在數(shù)據(jù)量較大的情況下可以學(xué)習(xí)到更多的語(yǔ)義特征,對(duì)大規(guī)模微博文本數(shù)據(jù)的支持更好。3.6.3基于支持向量機(jī)的情感分析實(shí)驗(yàn)及討論本節(jié)使用臺(tái)灣大學(xué)Chih.JenLin教授提出的Lib-SVM[49]。Lib-SVM可以解決各類(lèi)基于支持向量機(jī)的問(wèn)題,例如C-SVM分類(lèi)、NU-SUM分類(lèi),以及支持向量機(jī)回歸等。Lib-SVM在Windows操作系統(tǒng)下可以直接被運(yùn)行,且大部分參數(shù)都提供了默認(rèn)值。對(duì)于懲罰參數(shù)c和核函數(shù)的gamma值g,Lib-SVM會(huì)通過(guò)交叉驗(yàn)證(CrossValidation)方法確定c和g的最佳取值。圖3.4展示的是Lib-SVM的主要使用步驟。其中第一步是導(dǎo)入詞向量,然后使用Lib-SVM對(duì)特征向量作數(shù)據(jù)標(biāo)準(zhǔn)化處理。Lib-SVM會(huì)通過(guò)交叉驗(yàn)證選擇和。最后利用與的最佳參數(shù),對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,并在測(cè)試集上進(jìn)行測(cè)試。圖3.4Lib-SVM訓(xùn)練流程與前兩節(jié)模型的實(shí)驗(yàn)設(shè)置相同,本節(jié)包含兩部分的內(nèi)容,即分別將One-HotEncoding和Word2Vec模型生成的詞向量導(dǎo)入到支持向量機(jī)模型中。所使用的訓(xùn)練和測(cè)試微博原始數(shù)據(jù)集和預(yù)處理過(guò)程與前述相同。實(shí)驗(yàn)過(guò)程和結(jié)果如下:1.使用One-HotEncoding構(gòu)造詞向量,作為支持向量機(jī)模型的輸入:(1)引入前述訓(xùn)練數(shù)據(jù)集,并使用Jieba進(jìn)行文本預(yù)處理,并使用One-HotEncoding構(gòu)造詞級(jí)別的詞向量;

【參考文獻(xiàn)】:
期刊論文
[1]結(jié)合詞性特征與卷積神經(jīng)網(wǎng)絡(luò)的文本情感分析[J]. 何鴻業(yè),鄭瑾,張祖平.  計(jì)算機(jī)工程. 2018(11)
[2]基于BTM和K-means的微博話題檢測(cè)[J]. 李衛(wèi)疆,王真真,余正濤.  計(jì)算機(jī)科學(xué). 2017(02)
[3]面向健康問(wèn)答社區(qū)的語(yǔ)義檢索技術(shù)研究與分析[J]. 范橋青,方鈺.  電子技術(shù)與軟件工程. 2017(02)
[4]基于領(lǐng)域情感詞典的中文微博情感分析[J]. 肖江,丁星,何榮杰.  電子設(shè)計(jì)工程. 2015(12)
[5]深度學(xué)習(xí)研究綜述[J]. 尹寶才,王文通,王立春.  北京工業(yè)大學(xué)學(xué)報(bào). 2015(01)
[6]針對(duì)產(chǎn)品命名實(shí)體識(shí)別的半監(jiān)督學(xué)習(xí)方法[J]. 黃詩(shī)琳,鄭小林,陳德人.  北京郵電大學(xué)學(xué)報(bào). 2013(02)
[7]基于最大熵模型的漢語(yǔ)句子分析[J]. 徐延勇,周獻(xiàn)中,井祥鶴,郭忠偉.  電子學(xué)報(bào). 2003(11)
[8]Web文本情感分類(lèi)研究綜述[J]. 王洪偉,劉勰,尹裴,廖雅國(guó).  情報(bào)學(xué)報(bào). 2010 (05)

碩士論文
[1]基于SVM和半監(jiān)督學(xué)習(xí)的短文本分類(lèi)算法研究[D]. 向俊.南京信息工程大學(xué) 2017
[2]基于卷積神經(jīng)網(wǎng)絡(luò)的在線商品評(píng)論情感傾向性研究[D]. 劉龍飛.大連理工大學(xué) 2016



本文編號(hào):3286278

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3286278.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f13aa***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com