基于半監(jiān)督遞歸自編碼的情感分類研究
本文關(guān)鍵詞:基于半監(jiān)督遞歸自編碼的情感分類研究
更多相關(guān)文章: 情感分類 SVM方法 深層學(xué)習(xí) 半監(jiān)督RAE方法
【摘要】:文本情感分析在數(shù)據(jù)挖掘領(lǐng)域有著十分重要的地位,文本情感分類又是文本情感分析中的一項重要研究內(nèi)容。文本情感分類是指利用自然語言處理方式,對文本的主觀情感傾向性進(jìn)行分析,包括抽取文本中與情感傾向性判斷有關(guān)的各個要素,判斷文本的情感傾向性等。文本的情感傾向性可以分為正面、負(fù)面、中立等不同情況。針對互聯(lián)網(wǎng)上的海量評論文本,如何對其進(jìn)行快速有效的分析與利用引起了越來越多學(xué)者的重視。目前關(guān)于情感分類問題的研究,主要分為基于情感詞典的情感分類和基于機器學(xué)習(xí)的情感分類兩大類,且都取得了不錯的成果。但由于基于情感詞典的分類方法中情感詞典的好壞將直接影響最終分類的準(zhǔn)確率,而情感詞典的構(gòu)建又完全依賴于人的主觀經(jīng)驗,因而很多學(xué)者著力于構(gòu)建更好更完整的情感詞典。在基于傳統(tǒng)機器學(xué)習(xí)的方法中,建模的過程中通常使用較簡單的函數(shù),計算也往往使用諸如統(tǒng)計等一些簡單的運算方法,所以通常被認(rèn)為是淺層學(xué)習(xí)。本文引入基于深層學(xué)習(xí)的半監(jiān)督遞歸自編碼(RAE, Recursive Auto Encoders)方法來解決中文文本的情感分類問題,它通過學(xué)習(xí)非線性的深層網(wǎng)絡(luò)結(jié)構(gòu),利用分布式向量來表達(dá)文本的特征,從而彌補了淺層學(xué)習(xí)在表達(dá)能力和泛化能力方面的約束。為了證明半監(jiān)督RAE方法的有效性,文中首先建立傳統(tǒng)的支持向量機(SVM, Support Vector Machine)情感分類模型進(jìn)行文本情感分類,得到的最優(yōu)情感分類結(jié)果是87%。然后利用基于深層學(xué)習(xí)的半監(jiān)督RAE方法,得到的最優(yōu)文本情感分類結(jié)果為88.3%,在文本預(yù)處理、特征選擇等處理過程與基于傳統(tǒng)SVM方法完全相同的情況下,準(zhǔn)確率提高了1.3個百分點。
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:B842.6
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前7條
1 張倩;楊耀權(quán);;基于支持向量機核函數(shù)的研究[J];電力科學(xué)與工程;2012年05期
2 劉梅彥;張仰森;張濤;;基于語義分析的不良傾向文本的識別算法研究[J];北京信息科技大學(xué)學(xué)報(自然科學(xué)版);2014年04期
3 劉志明;劉魯;;基于機器學(xué)習(xí)的中文微博情感分類實證研究[J];計算機工程與應(yīng)用;2012年01期
4 周竹榮;邱玉輝;夏磊;;基于互信息和本體的協(xié)同檢索模型的研究[J];計算機科學(xué);2008年04期
5 聞彬;何婷婷;羅樂;宋樂;王倩;;基于語義理解的文本情感分類方法研究[J];計算機科學(xué);2010年06期
6 柳位平;朱艷輝;栗春亮;向華政;文志強;;中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J];計算機應(yīng)用;2009年10期
7 代大明;王中卿;李壽山;李培峰;朱巧明;;基于情緒詞的非監(jiān)督中文情感分類方法研究[J];中文信息學(xué)報;2012年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 宋勝利;文本語義表示及多層分類關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2012年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 郭明;基于文本分類技術(shù)的文本情感傾向性研究[D];鄭州大學(xué);2010年
2 張磊;基于最大熵模型的漢語詞性標(biāo)注研究[D];大連理工大學(xué);2008年
3 李兆福;基于K最短路徑的中文分詞算法研究與實現(xiàn)[D];哈爾濱工程大學(xué);2009年
4 史南勝;基于句法樹模式的產(chǎn)品評論意見挖掘研究[D];東華大學(xué);2013年
5 李耀林;面向評價對象的商品評論情感傾向性分析研究[D];浙江工商大學(xué);2013年
6 徐薇;中文微影評文本情感傾向性識別技術(shù)研究[D];華中師范大學(xué);2013年
,本文編號:1149852
本文鏈接:http://sikaile.net/shekelunwen/xinlixingwei/1149852.html