基于監(jiān)督學(xué)習(xí)的文本情感分析研究
發(fā)布時(shí)間:2018-02-28 03:19
本文關(guān)鍵詞: 文本情感分析 監(jiān)督學(xué)習(xí) 依存句法 條件隨機(jī)場(chǎng) 半馬爾科夫 主動(dòng)學(xué)習(xí) 深度特征 詞語(yǔ)語(yǔ)義分布式模型 組合語(yǔ)義 出處:《中國(guó)科學(xué)技術(shù)大學(xué)》2017年博士論文 論文類(lèi)型:學(xué)位論文
【摘要】:近年來(lái),微博、社交網(wǎng)、論壇、維基、網(wǎng)絡(luò)購(gòu)物平臺(tái)等社會(huì)網(wǎng)絡(luò)聚集了大量的用戶(hù)。這些用戶(hù)不僅是網(wǎng)上信息資源的瀏覽和接受者,也是所述資源的提供和傳送者。這些信息中既有對(duì)人、物、事的客觀(guān)報(bào)道,也不乏對(duì)人、物、事的主觀(guān)表達(dá)。如何對(duì)來(lái)自不同社會(huì)網(wǎng)絡(luò)的主觀(guān)情感表達(dá)進(jìn)行自動(dòng)分析和處理已成為亟待解決的難題。其中,文本情感分類(lèi)問(wèn)題受到愈來(lái)愈多的關(guān)注,成為當(dāng)下的研究熱點(diǎn)。在眾多的文本情感分析方法中基于監(jiān)督學(xué)習(xí)的方法是目前最具代表性也是最成功的一種方法。然而,它們?cè)谔幚砬楦械钠缌x性、組合性和隱含性等方面卻存在或多或少的不足。隨著大數(shù)據(jù)和深度神經(jīng)網(wǎng)絡(luò)技術(shù)的興起和蓬勃發(fā)展,深度特征在自然語(yǔ)言信息處理領(lǐng)域得到了越來(lái)越多的關(guān)注。相比于人工設(shè)置的底層特征,深度特征可以更全面、更準(zhǔn)確地描述蘊(yùn)含在文本中的情感信息。在上述研究背景下,本文對(duì)文本情感分類(lèi)問(wèn)題進(jìn)行了深入研究。針對(duì)文本表達(dá)中存在的情感歧義性、組合性和隱含性等問(wèn)題,在監(jiān)督學(xué)習(xí)的框架下開(kāi)展了文本情感分析改進(jìn)研究,提出了一些新穎的情感分類(lèi)方法,期望通過(guò)挖掘蘊(yùn)含于文本中的情感特征來(lái)提高文本情感分析的準(zhǔn)確性以促進(jìn)文本情感分析的實(shí)用化進(jìn)程。本文的主要貢獻(xiàn)與創(chuàng)新點(diǎn)如下:1.構(gòu)建了一種多層級(jí)情感語(yǔ)料庫(kù)。針對(duì)研究用文本情感語(yǔ)料不足的問(wèn)題,提出了以詞語(yǔ)、短語(yǔ)和句子為標(biāo)注基本單位的多層級(jí)情感語(yǔ)料庫(kù)構(gòu)建方案。在詞語(yǔ)和短語(yǔ)情感資源構(gòu)建過(guò)程中,使用了如下方法:詞典翻譯方法和情感詞匯擴(kuò)充方法。前者利用已標(biāo)注的英文情感詞典,將源語(yǔ)言的英文情感詞匯翻譯成目標(biāo)語(yǔ)言的漢語(yǔ)情感詞匯,從而實(shí)現(xiàn)漢語(yǔ)情感詞典的構(gòu)建;后者則是根據(jù)已構(gòu)建的小規(guī)模種子情感詞匯集合,利用Bootstrapping方法,對(duì)其進(jìn)行適當(dāng)?shù)臄U(kuò)充以構(gòu)建更大規(guī)模的情感詞匯集。在句子級(jí)情感語(yǔ)料構(gòu)建過(guò)程中,使用了如下方法:人工標(biāo)注和基于句子對(duì)齊的方法。前者由人工標(biāo)注完成;后者則根據(jù)對(duì)齊的英漢雙語(yǔ)語(yǔ)料,將源語(yǔ)言的英文情感句子映射為目標(biāo)語(yǔ)言的漢語(yǔ)情感句子,從而實(shí)現(xiàn)漢語(yǔ)情感語(yǔ)料的構(gòu)建。實(shí)驗(yàn)結(jié)果表明,所構(gòu)建的情感語(yǔ)料庫(kù)可以滿(mǎn)足本研究的實(shí)際需求。2.提出了一種基于短語(yǔ)的文本情感分析方法。針對(duì)文本情感分析中實(shí)際存在的情感歧義性和組合性問(wèn)題,以監(jiān)督學(xué)習(xí)為基本框架,從短語(yǔ)層面入手,提出了基于短語(yǔ)的監(jiān)督學(xué)習(xí)的文本情感分析方法。該方法首先對(duì)輸入文本進(jìn)行短語(yǔ)切分;然后對(duì)短語(yǔ)的情感類(lèi)別進(jìn)行標(biāo)注;最后通過(guò)對(duì)這些情感類(lèi)別信息進(jìn)行組合以最終確定整個(gè)文本(句子或短文本)的情感類(lèi)別。在短語(yǔ)切分的研究中,本文以依存句法為切分依據(jù)實(shí)現(xiàn)了對(duì)句子的短語(yǔ)切分。在短語(yǔ)情感類(lèi)別標(biāo)注研究中,提出了基于擴(kuò)展式條件隨機(jī)場(chǎng)和基于半馬爾科夫條件隨機(jī)場(chǎng)的兩種模型,有機(jī)地結(jié)合了詞語(yǔ)與詞語(yǔ)、詞語(yǔ)與短語(yǔ)、短語(yǔ)與短語(yǔ)之間的相互關(guān)系。在句子的情感類(lèi)別生成過(guò)程中,本文設(shè)置了幾條情感傳遞規(guī)則來(lái)實(shí)現(xiàn)短語(yǔ)情感類(lèi)別信息的整合,并據(jù)此完成對(duì)句子情感類(lèi)別的判別。在文本情感傾向性和文本情緒分析的實(shí)驗(yàn)中,取得明顯優(yōu)于傳統(tǒng)方法的結(jié)果。3.提出了一種基于主動(dòng)學(xué)習(xí)的情感分析方法。在已標(biāo)注語(yǔ)料缺乏的情況下,研究了如何在監(jiān)督學(xué)習(xí)的框架下利用大規(guī)模未標(biāo)注語(yǔ)料以提升所構(gòu)建情感分析模型性能的問(wèn)題,提出了一種基于主動(dòng)學(xué)習(xí)的文本情感分析方法。該方法以基于短語(yǔ)的半馬爾科夫條件隨機(jī)場(chǎng)為基本分類(lèi)模型,以基于池的主動(dòng)學(xué)習(xí)為基本框架來(lái)完成對(duì)語(yǔ)料的標(biāo)注。在樣例篩選時(shí)首先選擇最不確定的訓(xùn)練實(shí)例,然后利用聚類(lèi)差法進(jìn)行進(jìn)一步篩選,最后由專(zhuān)家對(duì)查詢(xún)結(jié)果進(jìn)行情感信息的標(biāo)注。該方法充分利用了概率圖模型和自然語(yǔ)言本身的特點(diǎn),可在訓(xùn)練樣本不足的情況下取得較好的標(biāo)注性能。4.提出了一種基于組合語(yǔ)義特征的情感分析方法。針對(duì)基于表面詞形的底層特征無(wú)法挖掘文本內(nèi)涵語(yǔ)義信息的問(wèn)題,提出了基于組合語(yǔ)義特征的文本情感分析方法。組合語(yǔ)義特征是以詞語(yǔ)分布式語(yǔ)義模型為基礎(chǔ),針對(duì)依存短語(yǔ)模型而構(gòu)建的能表達(dá)語(yǔ)義信息的特征。本文首先提出了組合語(yǔ)義特征的生成算法。然后提出了兩種將組合語(yǔ)義特征應(yīng)用于情感分析的算法:基于組合語(yǔ)義特征的監(jiān)督學(xué)習(xí)模型和基于組合語(yǔ)義特征的神經(jīng)網(wǎng)絡(luò)方法。上述方法充分挖掘了存在于文本中的語(yǔ)義信息,為隱含情感問(wèn)題的解決提供了有效途徑。
[Abstract]:In this paper , the author makes a deep research on the classification of text emotion . In the context of the research background , the author makes a thorough research on the classification of text emotion . This paper puts forward a kind of affective analysis method based on combination semantic features .
【學(xué)位授予單位】:中國(guó)科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 杜偉夫;譚松波;云曉春;程學(xué)旗;;一種新的情感詞匯語(yǔ)義傾向計(jì)算方法[J];計(jì)算機(jī)研究與發(fā)展;2009年10期
2 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語(yǔ)義傾向計(jì)算[J];中文信息學(xué)報(bào);2006年01期
3 傅愛(ài)平;;機(jī)器翻譯中漢語(yǔ)動(dòng)結(jié)式生成的過(guò)程和困難[J];中國(guó)語(yǔ)文;2003年01期
4 穗志方,俞士汶;面向EBMT的漢語(yǔ)單句謂語(yǔ)中心詞識(shí)別研究[J];中文信息學(xué)報(bào);1998年04期
,本文編號(hào):1545529
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1545529.html
最近更新
教材專(zhuān)著