天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

中文微博細(xì)粒度情緒識(shí)別研究

發(fā)布時(shí)間:2019-08-08 07:31
【摘要】:從本世紀(jì)初,文本情感研究逐漸成為信息抽取領(lǐng)域中的研究熱點(diǎn),獲得了越來越多的關(guān)注。特別是Web2.0技術(shù)的逐漸普及,微博因?yàn)橄⒑喍、發(fā)布便捷、實(shí)時(shí)交互等特點(diǎn)獲得了網(wǎng)民極高的喜愛度,廣大網(wǎng)民已經(jīng)從過去單純的信息獲取者變成網(wǎng)絡(luò)內(nèi)容的主要制造者。同時(shí),隨著自然語言處理和機(jī)器學(xué)習(xí)技術(shù)的不斷進(jìn)步和成熟,對(duì)微博這種主觀性短文本進(jìn)行情感分析也成為可能,并逐漸得到廣泛應(yīng)用。 針對(duì)中文微博的情感分析研究,國內(nèi)目前主要集中在微博的情感極性判斷上,如分析微博表達(dá)是積極還是消極,此類研究已經(jīng)取得了一定成績并開始廣泛應(yīng)用,然而,隨著應(yīng)用的深入,用戶希望能夠獲取到微博表達(dá)的更細(xì)致的情感以便了解用戶對(duì)某些事物的態(tài)度,此時(shí)傳統(tǒng)的微博情感分析研究方法已很難完全滿足需求,雖然目前國內(nèi)近年來對(duì)中文微博細(xì)粒度情緒識(shí)別正在做一些嘗試與努力,但效果并不大理想。因此,本文研究了基于中文微博的細(xì)粒度情緒分析方法,通過探索新的研究思路和方法,進(jìn)一步提高情感分析的準(zhǔn)確性和實(shí)用性。 文本主要針對(duì)中文微博的細(xì)粒度情緒識(shí)別中的關(guān)鍵技術(shù)展開研究。分析了中文微博研究難點(diǎn)和微博情感表達(dá)特征,提出了一種基于情感詞匯本體的多策略集成分析法。首先在對(duì)微博的有無情緒分類中,在有大量測(cè)試集合的前提下,我們提出了基于迭代的樸素貝葉斯分類算法,對(duì)該算法分類為有情緒的微博文本,我們進(jìn)一步的分析它所表達(dá)的細(xì)膩情緒(anger憤怒、disgust厭惡、fear恐懼、happiness高興、like喜好、sadness悲傷、surprise驚訝),,使用新穎的文本特征向量表示和權(quán)重計(jì)算方法量化有情緒微博文本,然后基于支持向量基SVM和K 最近鄰KNN算法分別進(jìn)行7類細(xì)粒度情緒分類,實(shí)現(xiàn)對(duì)中文微博的細(xì)粒度情緒分析。 最后我們以新浪微博為實(shí)驗(yàn)數(shù)據(jù),在大連理工情感詞匯本體基礎(chǔ)之上,構(gòu)建多策略融合分類算法與單一分類算法對(duì)比實(shí)驗(yàn),最終實(shí)驗(yàn)結(jié)果表明,多策略分類算法融合方案在細(xì)粒度情緒分析研究中效果更好。且在兩類多策略融合分析方法中,“NBKNN”方案比“NBSVM”方案稍顯優(yōu)勢(shì)。 論文的主要貢獻(xiàn)在于: 1)提出了基于迭代的樸素貝葉斯分類算法,該算法在先驗(yàn)知識(shí)不足的情況下能很好的提升分類性能。 2)擴(kuò)展豐富了大連理工情感本體庫,這將對(duì)細(xì)粒度情緒識(shí)別準(zhǔn)確度的提升有很大幫助。 3)研究出中文微博文本新穎的特征向量表示法和權(quán)重量化方法。該方法能有效降低數(shù)據(jù)維數(shù)災(zāi)難,減小算法計(jì)算復(fù)雜度并最終提高算法性能。 4)實(shí)現(xiàn)了多策略分類算法融合的細(xì)粒度情緒分析方法。該多分類算法融合方案比直接使用單一的算法效果有顯著提高,為今后的更深入細(xì)粒度情緒分析工作提供了思路和理論依據(jù)。 通過對(duì)中文微博進(jìn)行細(xì)粒度情緒識(shí)別分析研究,將為推動(dòng)電子商務(wù)發(fā)展,組織機(jī)關(guān)民意調(diào)查,網(wǎng)絡(luò)輿情監(jiān)控等提供重要的決策依據(jù)。但細(xì)粒度情緒分析的準(zhǔn)確度依然有很大的改進(jìn)空間。
【學(xué)位授予單位】:南華大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP393.092

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 郭飛飛;王小華;諶志群;王榮波;;基于回應(yīng)消息的中文微博情感分類方法[J];杭州電子科技大學(xué)學(xué)報(bào);2013年06期

2 李赫元;俞曉明;劉悅;程學(xué)旗;程工;;中文微博客的垃圾用戶檢測(cè)[J];中文信息學(xué)報(bào);2014年03期

3 文坤梅;徐帥;李瑞軒;辜希武;李玉華;;微博及中文微博信息處理研究綜述[J];中文信息學(xué)報(bào);2012年06期

4 王銀;吳新玲;;中文微博情感分析方法研究[J];廣東技術(shù)師范學(xué)院學(xué)報(bào);2014年03期

5 肖s

本文編號(hào):2524232


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2524232.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶55798***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com