基于深度學(xué)習(xí)的微博短文本情感分析技術(shù)研究
發(fā)布時(shí)間:2022-11-04 22:06
隨著網(wǎng)絡(luò)技術(shù)的普及、網(wǎng)絡(luò)文化的多元化發(fā)展以及我國(guó)網(wǎng)民的日益增多,社交媒體工具成為人們?nèi)粘I畋夭豢缮俚慕涣髅浇?社交媒體文本的情感分析也逐漸成為自然語(yǔ)言處理領(lǐng)域的一個(gè)活躍的研究方向。微博由于其簡(jiǎn)單易用,傳播迅速等特點(diǎn),成為大眾發(fā)表言論、表達(dá)情感的重要平臺(tái)之一,因此產(chǎn)生了大量帶有情感的文本數(shù)據(jù),對(duì)這些帶有情感的微博文本進(jìn)行情感分析將為政府、企業(yè)以及個(gè)人的決策提供有效地幫助。然而,在現(xiàn)在的網(wǎng)絡(luò)大環(huán)境下,人們表達(dá)自己觀點(diǎn)和情緒的詞語(yǔ)越來(lái)越多,為了提高處理情感分析任務(wù)的水平,針對(duì)微博短文本網(wǎng)絡(luò)新詞多、文本特征密度低等特點(diǎn),本文對(duì)微博新詞發(fā)現(xiàn)方法、微博短文本向量表示模型以及微博短文本情感分類(lèi)模型進(jìn)行了研究。主要研究工作包括:(1)針對(duì)基于N-Gram的新詞發(fā)現(xiàn)方法產(chǎn)生很多垃圾詞串的問(wèn)題,本文結(jié)合互信息、左右鄰接熵等統(tǒng)計(jì)量以及停用詞典和常用詞典對(duì)微博新詞發(fā)現(xiàn)方法進(jìn)行了研究。對(duì)N-Gram切詞產(chǎn)生的二元和三元組,分別使用互信息和鄰接熵對(duì)詞語(yǔ)的內(nèi)部凝固度和邊界自由度進(jìn)行了度量,得到候選詞集后,再使用停用詞典和常用詞典加以過(guò)濾,得到最終新詞集。實(shí)驗(yàn)結(jié)果表明,所提新詞發(fā)現(xiàn)方法在NLPCC2014微博語(yǔ)料數(shù)...
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀
1.2.1 新詞發(fā)現(xiàn)研究現(xiàn)狀
1.2.2 向量表示模型研究現(xiàn)狀
1.2.3 微博情感分析研究現(xiàn)狀
1.3 研究?jī)?nèi)容
1.4 組織結(jié)構(gòu)
1.5 本章小結(jié)
2 相關(guān)理論
2.1 新詞發(fā)現(xiàn)相關(guān)理論
2.1.1 N-Gram語(yǔ)言模型
2.1.2 統(tǒng)計(jì)量介紹
2.2 詞向量表示模型
2.2.1 Word2Vec模型
2.2.2 BERT模型
2.3 注意力機(jī)制
2.4 深度學(xué)習(xí)相關(guān)理論
2.4.1 卷積神經(jīng)網(wǎng)絡(luò)
2.4.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.3 長(zhǎng)短期記憶網(wǎng)絡(luò)
2.4.4 門(mén)控循環(huán)單元
2.5 本章小結(jié)
3 微博新詞發(fā)現(xiàn)方法
3.1 基于N-Gram和統(tǒng)計(jì)相結(jié)合的新詞發(fā)現(xiàn)方法
3.2 數(shù)據(jù)預(yù)處理
3.2.1 數(shù)據(jù)集介紹
3.2.2 數(shù)據(jù)清洗
3.2.3 N-Gram切詞
3.3 新詞候選集選取
3.4 垃圾詞串過(guò)濾
3.5 新詞詞典構(gòu)建
3.6 實(shí)驗(yàn)及結(jié)果分析
3.6.1 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
3.6.2 閾值設(shè)定
3.6.3 結(jié)果與分析
3.7 本章小結(jié)
4 短文本向量表示模型
4.1 向量表示模型的構(gòu)建過(guò)程
4.2 基于BERT的短文本向量表示模型
4.3 實(shí)驗(yàn)及結(jié)果分析
4.3.1 數(shù)據(jù)預(yù)處理
4.3.2 評(píng)價(jià)指標(biāo)
4.3.3 實(shí)驗(yàn)參數(shù)設(shè)置
4.3.4 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
5 基于BiGRU-Att的情感分類(lèi)模型
5.1 BiGRU網(wǎng)絡(luò)模型
5.2 注意力機(jī)制
5.3 基于BiGRU-Att的情感分類(lèi)模型結(jié)構(gòu)
5.3.1 輸入層
5.3.2 BiGRU層
5.3.3 注意力層
5.3.4 分類(lèi)輸出層
5.4 實(shí)驗(yàn)及結(jié)果分析
5.4.1 模型超參數(shù)設(shè)置
5.4.2 對(duì)比實(shí)驗(yàn)
5.4.3 實(shí)驗(yàn)結(jié)果分析
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于領(lǐng)域詞典的民宿評(píng)論情感分析[J]. 楊鑫,楊云帆,焦維,朱東霖,鄭紹陽(yáng),袁中玉,楊秀璋,羅子江. 科學(xué)技術(shù)與工程. 2020(07)
[2]基于注意力機(jī)制Bi-LSTM算法的雙語(yǔ)文本情感分析[J]. 翟社平,楊媛媛,邱程,李婧,毋志云. 計(jì)算機(jī)應(yīng)用與軟件. 2019(12)
[3]網(wǎng)絡(luò)時(shí)代大學(xué)生思想政治教育的挑戰(zhàn)與對(duì)策[J]. 蘭明尚,郭叢斌. 中國(guó)高等教育. 2019(23)
[4]基于CNN-BIGRU的中文文本情感分類(lèi)模型[J]. 宋祖康,閻瑞霞. 計(jì)算機(jī)技術(shù)與發(fā)展. 2020(02)
[5]基于神經(jīng)網(wǎng)絡(luò)模型的文本分類(lèi)研究綜述[J]. 孫嘉琪,王曉曄,周曉雯. 天津理工大學(xué)學(xué)報(bào). 2019(05)
[6]融合多粒度信息的文本向量表示模型[J]. 聶維民,陳永洲,馬靜. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(09)
[7]基于多部情感詞典和規(guī)則集的中文微博情感分析研究[J]. 吳杰勝,陸奎. 計(jì)算機(jī)應(yīng)用與軟件. 2019(09)
[8]基于互信息和邏輯回歸的新詞發(fā)現(xiàn)[J]. 陳先來(lái),韓超鵬,安瑩,劉莉,李忠民,楊榮. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(08)
[9]結(jié)合信息量和深度學(xué)習(xí)的領(lǐng)域新詞發(fā)現(xiàn)[J]. 黃文明,楊柳青青,任沖. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(07)
[10]基于句法分析與詞向量的領(lǐng)域新詞發(fā)現(xiàn)方法[J]. 趙志濱,石玉鑫,李斌陽(yáng). 計(jì)算機(jī)科學(xué). 2019(06)
碩士論文
[1]基于深度學(xué)習(xí)的微博情感分析研究[D]. 趙希明.北方工業(yè)大學(xué) 2019
[2]使用深度學(xué)習(xí)技術(shù)的中文微博情感分析研究[D]. 鄧洋.西南交通大學(xué) 2018
[3]基于深度學(xué)習(xí)的微博評(píng)論情感傾向性分析[D]. 胡西祥.哈爾濱工業(yè)大學(xué) 2017
[4]基于深度神經(jīng)網(wǎng)絡(luò)的微博短文本情感分析研究[D]. 張英.中原工學(xué)院 2017
[5]中文新詞檢測(cè)與分析[D]. 崔世起.中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2006
本文編號(hào):3701415
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀
1.2.1 新詞發(fā)現(xiàn)研究現(xiàn)狀
1.2.2 向量表示模型研究現(xiàn)狀
1.2.3 微博情感分析研究現(xiàn)狀
1.3 研究?jī)?nèi)容
1.4 組織結(jié)構(gòu)
1.5 本章小結(jié)
2 相關(guān)理論
2.1 新詞發(fā)現(xiàn)相關(guān)理論
2.1.1 N-Gram語(yǔ)言模型
2.1.2 統(tǒng)計(jì)量介紹
2.2 詞向量表示模型
2.2.1 Word2Vec模型
2.2.2 BERT模型
2.3 注意力機(jī)制
2.4 深度學(xué)習(xí)相關(guān)理論
2.4.1 卷積神經(jīng)網(wǎng)絡(luò)
2.4.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.3 長(zhǎng)短期記憶網(wǎng)絡(luò)
2.4.4 門(mén)控循環(huán)單元
2.5 本章小結(jié)
3 微博新詞發(fā)現(xiàn)方法
3.1 基于N-Gram和統(tǒng)計(jì)相結(jié)合的新詞發(fā)現(xiàn)方法
3.2 數(shù)據(jù)預(yù)處理
3.2.1 數(shù)據(jù)集介紹
3.2.2 數(shù)據(jù)清洗
3.2.3 N-Gram切詞
3.3 新詞候選集選取
3.4 垃圾詞串過(guò)濾
3.5 新詞詞典構(gòu)建
3.6 實(shí)驗(yàn)及結(jié)果分析
3.6.1 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
3.6.2 閾值設(shè)定
3.6.3 結(jié)果與分析
3.7 本章小結(jié)
4 短文本向量表示模型
4.1 向量表示模型的構(gòu)建過(guò)程
4.2 基于BERT的短文本向量表示模型
4.3 實(shí)驗(yàn)及結(jié)果分析
4.3.1 數(shù)據(jù)預(yù)處理
4.3.2 評(píng)價(jià)指標(biāo)
4.3.3 實(shí)驗(yàn)參數(shù)設(shè)置
4.3.4 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
5 基于BiGRU-Att的情感分類(lèi)模型
5.1 BiGRU網(wǎng)絡(luò)模型
5.2 注意力機(jī)制
5.3 基于BiGRU-Att的情感分類(lèi)模型結(jié)構(gòu)
5.3.1 輸入層
5.3.2 BiGRU層
5.3.3 注意力層
5.3.4 分類(lèi)輸出層
5.4 實(shí)驗(yàn)及結(jié)果分析
5.4.1 模型超參數(shù)設(shè)置
5.4.2 對(duì)比實(shí)驗(yàn)
5.4.3 實(shí)驗(yàn)結(jié)果分析
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間取得的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于領(lǐng)域詞典的民宿評(píng)論情感分析[J]. 楊鑫,楊云帆,焦維,朱東霖,鄭紹陽(yáng),袁中玉,楊秀璋,羅子江. 科學(xué)技術(shù)與工程. 2020(07)
[2]基于注意力機(jī)制Bi-LSTM算法的雙語(yǔ)文本情感分析[J]. 翟社平,楊媛媛,邱程,李婧,毋志云. 計(jì)算機(jī)應(yīng)用與軟件. 2019(12)
[3]網(wǎng)絡(luò)時(shí)代大學(xué)生思想政治教育的挑戰(zhàn)與對(duì)策[J]. 蘭明尚,郭叢斌. 中國(guó)高等教育. 2019(23)
[4]基于CNN-BIGRU的中文文本情感分類(lèi)模型[J]. 宋祖康,閻瑞霞. 計(jì)算機(jī)技術(shù)與發(fā)展. 2020(02)
[5]基于神經(jīng)網(wǎng)絡(luò)模型的文本分類(lèi)研究綜述[J]. 孫嘉琪,王曉曄,周曉雯. 天津理工大學(xué)學(xué)報(bào). 2019(05)
[6]融合多粒度信息的文本向量表示模型[J]. 聶維民,陳永洲,馬靜. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(09)
[7]基于多部情感詞典和規(guī)則集的中文微博情感分析研究[J]. 吳杰勝,陸奎. 計(jì)算機(jī)應(yīng)用與軟件. 2019(09)
[8]基于互信息和邏輯回歸的新詞發(fā)現(xiàn)[J]. 陳先來(lái),韓超鵬,安瑩,劉莉,李忠民,楊榮. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2019(08)
[9]結(jié)合信息量和深度學(xué)習(xí)的領(lǐng)域新詞發(fā)現(xiàn)[J]. 黃文明,楊柳青青,任沖. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(07)
[10]基于句法分析與詞向量的領(lǐng)域新詞發(fā)現(xiàn)方法[J]. 趙志濱,石玉鑫,李斌陽(yáng). 計(jì)算機(jī)科學(xué). 2019(06)
碩士論文
[1]基于深度學(xué)習(xí)的微博情感分析研究[D]. 趙希明.北方工業(yè)大學(xué) 2019
[2]使用深度學(xué)習(xí)技術(shù)的中文微博情感分析研究[D]. 鄧洋.西南交通大學(xué) 2018
[3]基于深度學(xué)習(xí)的微博評(píng)論情感傾向性分析[D]. 胡西祥.哈爾濱工業(yè)大學(xué) 2017
[4]基于深度神經(jīng)網(wǎng)絡(luò)的微博短文本情感分析研究[D]. 張英.中原工學(xué)院 2017
[5]中文新詞檢測(cè)與分析[D]. 崔世起.中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所) 2006
本文編號(hào):3701415
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3701415.html
最近更新
教材專(zhuān)著