中文微博評(píng)論的情感傾向分析
本文關(guān)鍵詞:中文微博評(píng)論的情感傾向分析,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的飛速發(fā)展和普及,使用微博的用戶越來(lái)越多,人們?cè)絹?lái)越熱衷于在微博上發(fā)表自己的觀點(diǎn)和對(duì)某事的評(píng)論,于是微博成為了人們溝通的橋梁,也是人們獲取信息最為重要的一個(gè)社交平臺(tái)。然而,相比于Twitter、Facebook等外文社交平臺(tái),中文微博的情感分析研究的相對(duì)較少。用戶發(fā)表的評(píng)論觀點(diǎn),,一定程度上表達(dá)出了用戶對(duì)某產(chǎn)品或者是信息資源的態(tài)度,同時(shí)也表現(xiàn)出強(qiáng)烈的情感傾向,因此情感傾向分析便逐漸成為自然語(yǔ)言處理研究的熱點(diǎn)。按文本研究粒度來(lái)分,情感分析通常分為詞匯情感傾向分析、句子情感分析和篇章情感分析,其中詞匯情感分析又是文本情感分析的基礎(chǔ)和前提。本文的主要研究工作如下: (1)介紹情感分析目前的研究現(xiàn)狀、研究背景以及研究意義。 (2)詳細(xì)介紹情感傾向分析要用到的相關(guān)基礎(chǔ)知識(shí)。針對(duì)現(xiàn)有漢語(yǔ)詞匯極性分析對(duì)詞匯的義原考慮的不夠全面,使得極性分析存在不準(zhǔn)確的問(wèn)題,本文基于HowNet提出了一種更有效的詞匯語(yǔ)義傾向性計(jì)算方法。本方法的主要思想是:先找準(zhǔn)一組褒貶中性詞庫(kù),然后提取出待測(cè)詞與詞庫(kù)中基準(zhǔn)詞詞匯的極性義原、詞性、其它義原,計(jì)算相應(yīng)的相似度,并分別給出合適的權(quán)重值,由此計(jì)算出待測(cè)詞與基準(zhǔn)詞的相似度,最后判斷待測(cè)詞的情感傾向。實(shí)驗(yàn)結(jié)果表明,該方法可以進(jìn)一步的提高語(yǔ)義極性傾向判別準(zhǔn)確率。 (3)對(duì)現(xiàn)有的文本情感分類方法進(jìn)行了研究,分析比較了這些方法各自存在的特點(diǎn)及問(wèn)題。針對(duì)存在的問(wèn)題,對(duì)比于傳統(tǒng)的Bayes算法及SVM算法,本文提出了一種基于Hopfield的句子情感傾向分析算法,通過(guò)實(shí)驗(yàn)分析發(fā)現(xiàn),本文算法雖然相比于Bayes算法在準(zhǔn)確率上有一定的提高,但還是稍遜于SVM算法,該方法有待于進(jìn)一步的研究。
【關(guān)鍵詞】:情感分析 語(yǔ)義傾向 極性相似度 極性義原
【學(xué)位授予單位】:華東交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1;TP393.092
【目錄】:
- 摘要3-4
- ABSTRACT4-5
- 目錄5-7
- 第一章 緒論7-13
- 1.1 研究背景及意義7-9
- 1.1.1 研究背景7-8
- 1.1.2 研究意義8-9
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀9-11
- 1.2.1 詞匯極性分析研究現(xiàn)狀9-10
- 1.2.2 句子極性分析研究現(xiàn)狀10-11
- 1.2.3 篇章級(jí)極性分析研究現(xiàn)狀11
- 1.3 本文的組織結(jié)構(gòu)11-13
- 第二章 相關(guān)理論與技術(shù)基礎(chǔ)13-23
- 2.1 情感分析13-14
- 2.2 關(guān)于 HowNet14-16
- 2.3 自然語(yǔ)言處理介紹16-17
- 2.4 文本預(yù)處理17-23
- 2.4.1 中文分詞17-19
- 2.4.2 詞性標(biāo)注19-21
- 2.4.3 停用詞處理21-23
- 第三章 文本情感分類方法23-33
- 3.1 機(jī)器學(xué)習(xí)方法分類23-30
- 3.1.1 有監(jiān)督學(xué)習(xí)方法23
- 3.1.2 半監(jiān)督學(xué)習(xí)方法23
- 3.1.3 無(wú)監(jiān)督學(xué)習(xí)方法23-30
- 3.2 研究問(wèn)題分類30-31
- 3.2.1 領(lǐng)域相關(guān)性研究30
- 3.2.2 數(shù)據(jù)不平衡問(wèn)題研究30-31
- 3.3 基于情感詞典的分類方法31-33
- 第四章 一種改進(jìn)的詞匯語(yǔ)義極性分析算法33-42
- 4.1 傳統(tǒng)算法33-34
- 4.1.1 詞語(yǔ)相似度計(jì)算33
- 4.1.2 義原相似度計(jì)算33-34
- 4.1.3 實(shí)詞相似度計(jì)算34
- 4.2 改進(jìn)算法34-37
- 4.3 實(shí)驗(yàn)與分析37-42
- 4.3.1 詞匯相似度測(cè)試37-38
- 4.3.2 詞匯極性分析測(cè)試38-39
- 4.3.3 實(shí)驗(yàn)評(píng)價(jià)39-42
- 第五章 基于 Hopfield 網(wǎng)絡(luò)的句子情感傾向分析42-47
- 5.1 Hopfield 網(wǎng)絡(luò)的基本概念42-43
- 5.2 Hopfield 網(wǎng)絡(luò)的學(xué)習(xí)算法43-44
- 5.3 基于 Hopfield 網(wǎng)絡(luò)的句子極性判斷算法44-45
- 5.4 實(shí)驗(yàn)分析與評(píng)價(jià)45-47
- 5.4.1 評(píng)價(jià)指標(biāo)45
- 5.4.2 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析45-47
- 第六章 總結(jié)47-49
- 6.1 全文總結(jié)47
- 6.2 今后工作展望47-49
- 參考文獻(xiàn)49-52
- 個(gè)人簡(jiǎn)歷 在讀期間發(fā)表的學(xué)術(shù)論文52-53
- 致謝53
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 呂國(guó)防;;注意新聞表述中的情感傾向[J];新聞實(shí)踐;2011年06期
2 傅向華;劉國(guó);郭巖巖;郭武彪;;中文博客多方面話題情感分析研究[J];中文信息學(xué)報(bào);2013年01期
3 魏晶晶;吳曉吟;;電子商務(wù)產(chǎn)品評(píng)論多級(jí)情感分析的研究與實(shí)現(xiàn)[J];軟件;2013年09期
4 于瀟;萬(wàn)軍;何翔;左尾歡;;校園微博情感分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];河北工業(yè)大學(xué)學(xué)報(bào);2013年06期
5 封二英;龐靈;;基于弱監(jiān)督迭代法的情感傾向分析[J];無(wú)線互聯(lián)科技;2014年03期
6 龐磊;李壽山;張慧;周國(guó)棟;;基于微博的股票投資者未來(lái)情感傾向識(shí)別研究[J];計(jì)算機(jī)科學(xué);2012年S1期
7 徐鵬;;基于直覺(jué)模糊推理的網(wǎng)頁(yè)在線評(píng)論情感傾向分類[J];計(jì)算機(jī)應(yīng)用與軟件;2013年06期
8 楊偉杰;馬博淵;劉雯;;基于意見(jiàn)目標(biāo)句抽取的中文股評(píng)情感分析方法[J];計(jì)算機(jī)仿真;2014年03期
9 楊江;彭石玉;侯敏;;基于主題情感句的漢語(yǔ)評(píng)論文傾向性分析[J];計(jì)算機(jī)應(yīng)用研究;2011年02期
10 張素智;樊得強(qiáng);李寶燕;;基于網(wǎng)絡(luò)評(píng)論語(yǔ)言學(xué)結(jié)構(gòu)的情感傾向識(shí)別模型[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2011年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前4條
1 楊江;侯敏;王寧;;基于主題情感句的漢語(yǔ)評(píng)論文傾向性分析[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
2 林慧恩;林世平;;中文情感傾向分析中主觀句子抽取方法的研究[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
3 王素格;楊安娜;;一種混合語(yǔ)言信息的詞語(yǔ)搭配傾向判別方法[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
4 宋曉雷;王素格;李紅霞;;基于概率潛在語(yǔ)義分析的詞匯情感傾向判別[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前3條
1 唐楠;新聞應(yīng)避免情感傾向[N];中國(guó)新聞出版報(bào);2005年
2 魯東;不盡鄉(xiāng)情入畫(huà)來(lái)[N];中國(guó)文化報(bào);2001年
3 楊勇濤;讓攝影喚起心靈的本真[N];中國(guó)攝影報(bào);2005年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 張奇;細(xì)顆粒度情感傾向分析若干關(guān)鍵問(wèn)題研究[D];復(fù)旦大學(xué);2008年
2 王素格;基于Web的評(píng)論文本情感分類問(wèn)題研究[D];上海大學(xué);2008年
3 楊卉;Web文本觀點(diǎn)挖掘及隱含情感傾向的研究[D];吉林大學(xué);2011年
4 李思;WEB觀點(diǎn)挖掘中關(guān)鍵問(wèn)題的研究[D];北京郵電大學(xué);2012年
5 李方濤;基于產(chǎn)品評(píng)論的情感分析研究[D];清華大學(xué);2011年
本文關(guān)鍵詞:中文微博評(píng)論的情感傾向分析,由筆耕文化傳播整理發(fā)布。
本文編號(hào):299100
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/299100.html