基于半監(jiān)督遞歸自編碼的情感分類研究
本文關(guān)鍵詞:基于半監(jiān)督遞歸自編碼的情感分類研究
更多相關(guān)文章: 情感分類 SVM方法 深層學(xué)習(xí) 半監(jiān)督RAE方法
【摘要】:文本情感分析在數(shù)據(jù)挖掘領(lǐng)域有著十分重要的地位,文本情感分類又是文本情感分析中的一項(xiàng)重要研究?jī)?nèi)容。文本情感分類是指利用自然語(yǔ)言處理方式,對(duì)文本的主觀情感傾向性進(jìn)行分析,包括抽取文本中與情感傾向性判斷有關(guān)的各個(gè)要素,判斷文本的情感傾向性等。文本的情感傾向性可以分為正面、負(fù)面、中立等不同情況。針對(duì)互聯(lián)網(wǎng)上的海量評(píng)論文本,如何對(duì)其進(jìn)行快速有效的分析與利用引起了越來(lái)越多學(xué)者的重視。目前關(guān)于情感分類問(wèn)題的研究,主要分為基于情感詞典的情感分類和基于機(jī)器學(xué)習(xí)的情感分類兩大類,且都取得了不錯(cuò)的成果。但由于基于情感詞典的分類方法中情感詞典的好壞將直接影響最終分類的準(zhǔn)確率,而情感詞典的構(gòu)建又完全依賴于人的主觀經(jīng)驗(yàn),因而很多學(xué)者著力于構(gòu)建更好更完整的情感詞典。在基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法中,建模的過(guò)程中通常使用較簡(jiǎn)單的函數(shù),計(jì)算也往往使用諸如統(tǒng)計(jì)等一些簡(jiǎn)單的運(yùn)算方法,所以通常被認(rèn)為是淺層學(xué)習(xí)。本文引入基于深層學(xué)習(xí)的半監(jiān)督遞歸自編碼(RAE, Recursive Auto Encoders)方法來(lái)解決中文文本的情感分類問(wèn)題,它通過(guò)學(xué)習(xí)非線性的深層網(wǎng)絡(luò)結(jié)構(gòu),利用分布式向量來(lái)表達(dá)文本的特征,從而彌補(bǔ)了淺層學(xué)習(xí)在表達(dá)能力和泛化能力方面的約束。為了證明半監(jiān)督RAE方法的有效性,文中首先建立傳統(tǒng)的支持向量機(jī)(SVM, Support Vector Machine)情感分類模型進(jìn)行文本情感分類,得到的最優(yōu)情感分類結(jié)果是87%。然后利用基于深層學(xué)習(xí)的半監(jiān)督RAE方法,得到的最優(yōu)文本情感分類結(jié)果為88.3%,在文本預(yù)處理、特征選擇等處理過(guò)程與基于傳統(tǒng)SVM方法完全相同的情況下,準(zhǔn)確率提高了1.3個(gè)百分點(diǎn)。
【學(xué)位授予單位】:內(nèi)蒙古大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:B842.6
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條
1 張倩;楊耀權(quán);;基于支持向量機(jī)核函數(shù)的研究[J];電力科學(xué)與工程;2012年05期
2 劉梅彥;張仰森;張濤;;基于語(yǔ)義分析的不良傾向文本的識(shí)別算法研究[J];北京信息科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年04期
3 劉志明;劉魯;;基于機(jī)器學(xué)習(xí)的中文微博情感分類實(shí)證研究[J];計(jì)算機(jī)工程與應(yīng)用;2012年01期
4 周竹榮;邱玉輝;夏磊;;基于互信息和本體的協(xié)同檢索模型的研究[J];計(jì)算機(jī)科學(xué);2008年04期
5 聞彬;何婷婷;羅樂(lè);宋樂(lè);王倩;;基于語(yǔ)義理解的文本情感分類方法研究[J];計(jì)算機(jī)科學(xué);2010年06期
6 柳位平;朱艷輝;栗春亮;向華政;文志強(qiáng);;中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J];計(jì)算機(jī)應(yīng)用;2009年10期
7 代大明;王中卿;李壽山;李培峰;朱巧明;;基于情緒詞的非監(jiān)督中文情感分類方法研究[J];中文信息學(xué)報(bào);2012年04期
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條
1 宋勝利;文本語(yǔ)義表示及多層分類關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2012年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 郭明;基于文本分類技術(shù)的文本情感傾向性研究[D];鄭州大學(xué);2010年
2 張磊;基于最大熵模型的漢語(yǔ)詞性標(biāo)注研究[D];大連理工大學(xué);2008年
3 李兆福;基于K最短路徑的中文分詞算法研究與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2009年
4 史南勝;基于句法樹(shù)模式的產(chǎn)品評(píng)論意見(jiàn)挖掘研究[D];東華大學(xué);2013年
5 李耀林;面向評(píng)價(jià)對(duì)象的商品評(píng)論情感傾向性分析研究[D];浙江工商大學(xué);2013年
6 徐薇;中文微影評(píng)文本情感傾向性識(shí)別技術(shù)研究[D];華中師范大學(xué);2013年
,本文編號(hào):1149852
本文鏈接:http://sikaile.net/shekelunwen/xinlixingwei/1149852.html