文本的分層表示及情感分類方法研究
發(fā)布時間:2022-10-21 10:02
隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)上的信息也在短時間內(nèi)發(fā)生了爆炸性的增長。其中,文本作為一種非結(jié)構(gòu)化或半結(jié)構(gòu)化的信息載體,成為了互聯(lián)網(wǎng)內(nèi)容的重要組成部分。如何更有效地挖掘和發(fā)現(xiàn)其中的有價值信息并加以合理利用一直是當(dāng)前信息科技領(lǐng)域面臨的一大挑戰(zhàn)。本文主要關(guān)注文本的情感分類任務(wù),其目的是按照文本整體情感傾向?qū)ξ臋n進(jìn)行分類,或?qū)⒃u論站點(diǎn)上的評論進(jìn)行1-5星的評價。而分類的關(guān)鍵在于對文本進(jìn)行良好的表示,并且識別文檔中的積極、消極、中立情感以及它們的表達(dá)強(qiáng)度。然而,現(xiàn)有的模型通常忽略了文檔的組成結(jié)構(gòu),且在文本表示的質(zhì)量以及對情感內(nèi)容的關(guān)注上存在不足。對此,本文從文本的通用表示和情感內(nèi)容的關(guān)注兩方面入手,探討如何提高情感分類性能,主要工作和貢獻(xiàn)如下:(1)本文提出了一種中心限制的分層文本表示方法以改進(jìn)文本的通用表示。本文提出的中心限制分層注意力模型(Central Constraint Hierarchical Attention Network,CCHAN)利用雙向GRU首先對單詞進(jìn)行編碼并通過注意力機(jī)制加權(quán)獲得句向量,再通過對句向量進(jìn)行編碼和加權(quán)獲得文檔表示。其中,我們設(shè)計使用的中心限制損失函數(shù)使得生成...
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本的通用表示方法
1.2.2 文本的情感表示方法
1.2.3 文本的情感分類方法
1.3 面臨的問題和挑戰(zhàn)
1.4 本文研究內(nèi)容與貢獻(xiàn)
1.5 論文結(jié)構(gòu)安排
第2章 中心限制的分層文本表示研究
2.1 引言
2.2 相關(guān)工作
2.2.1 詞向量
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)編碼器
2.2.3 注意力機(jī)制
2.2.4 研究進(jìn)展
2.3 中心限制的分層注意力文本表示模型
2.3.1 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的單詞表示層
2.3.2 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的句子表示層
2.3.3 中心限制損失函數(shù)
2.3.4 循環(huán)率學(xué)習(xí)優(yōu)化器
2.4 實驗結(jié)果與分析
2.4.1 數(shù)據(jù)集介紹
2.4.2 文本預(yù)處理和詞向量訓(xùn)練
2.4.3 訓(xùn)練方式及參數(shù)設(shè)置
2.4.4 對比模型介紹
2.4.5 實驗數(shù)據(jù)分析
2.5 本章小結(jié)
第3章 基于情感內(nèi)容關(guān)注的情感分類方法研究
3.1 引言
3.2 相關(guān)工作
3.2.1 詞語情感信息獲取
3.2.2 詞語情感信息利用
3.3 基于情感內(nèi)容關(guān)注的分層注意力機(jī)制模型
3.3.1 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的單詞表示層
3.3.2 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的文檔表示層
3.3.3 注意力機(jī)制模塊
3.3.4 情感分析模塊
3.3.5 分段訓(xùn)練損失函數(shù)設(shè)計
3.4 實驗結(jié)果與分析
3.4.1 數(shù)據(jù)集介紹
3.4.2 文本預(yù)處理和詞向量訓(xùn)練
3.4.3 訓(xùn)練方式及參數(shù)設(shè)置
3.4.4 對比模型介紹
3.4.5 實驗數(shù)據(jù)分析
3.5 本章小結(jié)
第4章 總結(jié)與展望
4.1 本文工作與創(chuàng)新點(diǎn)
4.2 未來工作展望
參考文獻(xiàn)
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]結(jié)合表示學(xué)習(xí)和遷移學(xué)習(xí)的跨領(lǐng)域情感分類[J]. 廖祥文,吳曉靜,桂林,黃錦輝,陳國龍. 北京大學(xué)學(xué)報(自然科學(xué)版). 2019(01)
[2]基于HowNet和PMI的詞語情感極性計算[J]. 王振宇,吳澤衡,胡方濤. 計算機(jī)工程. 2012(15)
[3]基于HowNet的詞匯語義傾向計算[J]. 朱嫣嵐,閔錦,周雅倩,黃萱菁,吳立德. 中文信息學(xué)報. 2006(01)
碩士論文
[1]基于深度學(xué)習(xí)的微博文本情感分析研究[D]. 宋夢姣.南京大學(xué) 2018
[2]融合Bi-LSTM和文本信息的對象級情感分析[D]. 鮑豪.北京交通大學(xué) 2018
[3]基于情感詞典的中文微博情感傾向分析研究[D]. 陳曉東.華中科技大學(xué) 2012
本文編號:3695427
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 文本的通用表示方法
1.2.2 文本的情感表示方法
1.2.3 文本的情感分類方法
1.3 面臨的問題和挑戰(zhàn)
1.4 本文研究內(nèi)容與貢獻(xiàn)
1.5 論文結(jié)構(gòu)安排
第2章 中心限制的分層文本表示研究
2.1 引言
2.2 相關(guān)工作
2.2.1 詞向量
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)編碼器
2.2.3 注意力機(jī)制
2.2.4 研究進(jìn)展
2.3 中心限制的分層注意力文本表示模型
2.3.1 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的單詞表示層
2.3.2 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的句子表示層
2.3.3 中心限制損失函數(shù)
2.3.4 循環(huán)率學(xué)習(xí)優(yōu)化器
2.4 實驗結(jié)果與分析
2.4.1 數(shù)據(jù)集介紹
2.4.2 文本預(yù)處理和詞向量訓(xùn)練
2.4.3 訓(xùn)練方式及參數(shù)設(shè)置
2.4.4 對比模型介紹
2.4.5 實驗數(shù)據(jù)分析
2.5 本章小結(jié)
第3章 基于情感內(nèi)容關(guān)注的情感分類方法研究
3.1 引言
3.2 相關(guān)工作
3.2.1 詞語情感信息獲取
3.2.2 詞語情感信息利用
3.3 基于情感內(nèi)容關(guān)注的分層注意力機(jī)制模型
3.3.1 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的單詞表示層
3.3.2 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的文檔表示層
3.3.3 注意力機(jī)制模塊
3.3.4 情感分析模塊
3.3.5 分段訓(xùn)練損失函數(shù)設(shè)計
3.4 實驗結(jié)果與分析
3.4.1 數(shù)據(jù)集介紹
3.4.2 文本預(yù)處理和詞向量訓(xùn)練
3.4.3 訓(xùn)練方式及參數(shù)設(shè)置
3.4.4 對比模型介紹
3.4.5 實驗數(shù)據(jù)分析
3.5 本章小結(jié)
第4章 總結(jié)與展望
4.1 本文工作與創(chuàng)新點(diǎn)
4.2 未來工作展望
參考文獻(xiàn)
致謝
在讀期間發(fā)表的學(xué)術(shù)論文與取得的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]結(jié)合表示學(xué)習(xí)和遷移學(xué)習(xí)的跨領(lǐng)域情感分類[J]. 廖祥文,吳曉靜,桂林,黃錦輝,陳國龍. 北京大學(xué)學(xué)報(自然科學(xué)版). 2019(01)
[2]基于HowNet和PMI的詞語情感極性計算[J]. 王振宇,吳澤衡,胡方濤. 計算機(jī)工程. 2012(15)
[3]基于HowNet的詞匯語義傾向計算[J]. 朱嫣嵐,閔錦,周雅倩,黃萱菁,吳立德. 中文信息學(xué)報. 2006(01)
碩士論文
[1]基于深度學(xué)習(xí)的微博文本情感分析研究[D]. 宋夢姣.南京大學(xué) 2018
[2]融合Bi-LSTM和文本信息的對象級情感分析[D]. 鮑豪.北京交通大學(xué) 2018
[3]基于情感詞典的中文微博情感傾向分析研究[D]. 陳曉東.華中科技大學(xué) 2012
本文編號:3695427
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3695427.html
最近更新
教材專著