基于電子商務(wù)的評(píng)論文本情感極性等級(jí)分析
發(fā)布時(shí)間:2017-03-28 16:05
本文關(guān)鍵詞:基于電子商務(wù)的評(píng)論文本情感極性等級(jí)分析,由筆耕文化傳播整理發(fā)布。
【摘要】:文本情感分析指研究分析人們對(duì)產(chǎn)品、服務(wù)、組織機(jī)構(gòu)、事件和話題等進(jìn)行評(píng)價(jià)時(shí)表達(dá)的意見、情感、評(píng)價(jià)、態(tài)度和情緒的特殊自然語(yǔ)言處理研究領(lǐng)域。涉及到多項(xiàng)具有挑戰(zhàn)性研究任務(wù),根據(jù)研究任務(wù)的不同,文本情感分析可以分為情感分類、情感信息抽取、情感信息檢索和歸納。研究的過(guò)程包括預(yù)處理、情感信息抽取、分類器選擇、結(jié)果歸納展示。 隨著web2.0的發(fā)展,人們可以通過(guò)互聯(lián)網(wǎng)隨時(shí)隨地發(fā)表自己的觀點(diǎn),如博客、論壇、門戶網(wǎng)站、電子商務(wù)平臺(tái)等,這些文本能直接或間接反映人的行為和思想,所以研究分析這些文本的情感有許多的用處。關(guān)注分析電子商務(wù)領(lǐng)域的評(píng)論文本情感,無(wú)論對(duì)消費(fèi)者還是商家都有重要的意義。目前文本情感分析雖然取得了較大發(fā)展,但對(duì)情感極性等級(jí)分析研究還不足。文本情感存在固有模糊特性,由此可以利用模糊理論的隸屬度函數(shù),進(jìn)行情感極性等級(jí)計(jì)算。 情感分析主要判斷評(píng)論文本的情感極性和極性等級(jí),即屬于褒義、貶義的強(qiáng)度。根據(jù)電子商務(wù)領(lǐng)域評(píng)論文本的特點(diǎn),,在已有傳統(tǒng)情感分析的基礎(chǔ)上,開展對(duì)評(píng)論句子的情感極性等級(jí)分析。首先,通過(guò)STEP算法標(biāo)注WordNet詞典中的形容詞情感,再用NOS隸屬度函數(shù)計(jì)算詞語(yǔ)情感極性等級(jí),構(gòu)建NOS情感詞典。其次,利用整數(shù)線性規(guī)劃(ILP)改造NOS情感詞典,得到領(lǐng)域情感詞典,使詞典最大化適應(yīng)電子商務(wù)領(lǐng)域文本分析。然后,改進(jìn)傳統(tǒng)的加權(quán)統(tǒng)計(jì)算法,即預(yù)先使用投票選舉法判斷句子極性,再計(jì)算情感極性等級(jí),通過(guò)與未選舉法的極性等級(jí)求平均值,作為最終的句子極性值。最后,使用領(lǐng)域情感詞典抽取文本中的情感信息,包括情感詞典、否定詞、程度副詞,實(shí)現(xiàn)了一個(gè)面向電子商務(wù)領(lǐng)域的情感分類系統(tǒng)。 實(shí)驗(yàn)語(yǔ)料庫(kù)為12000條評(píng)論句子,分別來(lái)自家電、酒店、圖書類電商網(wǎng)站,通過(guò)手工標(biāo)注語(yǔ)料的褒貶極性作為檢驗(yàn)實(shí)驗(yàn)結(jié)果的金標(biāo)準(zhǔn)。實(shí)驗(yàn)結(jié)果顯示:領(lǐng)域情感詞典比NOS詞典平均準(zhǔn)確率提高了2.7%~6.1%;改進(jìn)算法比加權(quán)統(tǒng)計(jì)算法提高了5.7%~9.1%,這說(shuō)明對(duì)情感分析進(jìn)行的初步嘗試有較好效果。
【關(guān)鍵詞】:文本情感分析 領(lǐng)域情感詞典 模糊理論 整數(shù)規(guī)劃 極性等級(jí)計(jì)算
【學(xué)位授予單位】:重慶交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.1
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 緒論9-18
- 1.1 研究背景9-11
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀11-13
- 1.3 研究的目的和意義13-14
- 1.4 研究中的困難與不足14-16
- 1.4.1 研究中的困難14-15
- 1.4.2 發(fā)展中的不足15-16
- 1.5 研究?jī)?nèi)容及組織結(jié)構(gòu)16-18
- 1.5.1 主要研究?jī)?nèi)容16-17
- 1.5.2 論文組織結(jié)構(gòu)17-18
- 第二章 情感分析的研究方法及相關(guān)算法18-23
- 2.1 基于機(jī)器學(xué)習(xí)方法18-20
- 2.1.1 樸素貝葉斯算法(NB)18-19
- 2.1.2 最大熵算法(ME)19
- 2.1.3 支持向量機(jī)(SVMs)19-20
- 2.2 基于詞頻的方法20-21
- 2.2.1 語(yǔ)義相關(guān)場(chǎng)20
- 2.2.2 語(yǔ)義相似度20-21
- 2.3 基于規(guī)則的方法21
- 2.4 性能評(píng)估方法21-23
- 第三章 文本情感分析的流程及應(yīng)用23-31
- 3.1 文本預(yù)處理23-25
- 3.1.1 向量空間模型(VSM)23-24
- 3.1.2 降維操作24-25
- 3.2 情感信息抽取25-28
- 3.2.1 特征提取法25-26
- 3.2.2 情感詞典26-28
- 3.3 選擇分類器28
- 3.4 情感歸納28
- 3.5 情感分析的應(yīng)用28-31
- 3.5.1 機(jī)器人的情感計(jì)算29
- 3.5.2 提供決策支持29
- 3.5.3 網(wǎng)絡(luò)輿情與風(fēng)險(xiǎn)分析29-30
- 3.5.4 信息預(yù)測(cè)30
- 3.5.5 產(chǎn)品推薦30-31
- 第四章 基于模糊理論的情感詞典建立方法31-43
- 4.1 模糊理論31-34
- 4.1.1 模糊理論的概述31-32
- 4.1.2 模糊理論使用注意事項(xiàng)32-33
- 4.1.3 模糊理論與文本情感分析的結(jié)合33-34
- 4.2 STEP 算法34-38
- 4.2.1 STEP 算法的提出35-36
- 4.2.2 算法的步驟36-37
- 4.2.3 STEP 算法標(biāo)注結(jié)果及分析37-38
- 4.3 詞語(yǔ)情感程度度量38-42
- 4.3.1 詞語(yǔ)的中心度38-39
- 4.3.2 度量方法39
- 4.3.3 實(shí)驗(yàn)及結(jié)果分析39-41
- 4.3.4 NOS拓展41-42
- 4.4 本章小結(jié)42-43
- 第五章 電商網(wǎng)站評(píng)論文本的情感計(jì)算系統(tǒng)43-67
- 5.1 系統(tǒng)目標(biāo)43
- 5.2 系統(tǒng)架構(gòu)43-44
- 5.3 評(píng)價(jià)語(yǔ)料庫(kù)準(zhǔn)備44-46
- 5.4 語(yǔ)料預(yù)處理46-51
- 5.4.1 語(yǔ)料分詞46-47
- 5.4.2 詞性標(biāo)注47-50
- 5.4.3 去除停用詞50-51
- 5.5 領(lǐng)域情感詞典與情感信息抽取51-57
- 5.5.1 領(lǐng)域情感詞典51
- 5.5.2 適用電商領(lǐng)域的情感詞典改造51-55
- 5.5.3 情感信息抽取55-57
- 5.6 評(píng)論文本情感極性分類算法57-60
- 5.6.1 情感極性加權(quán)統(tǒng)計(jì)算法57-58
- 5.6.2 對(duì)加權(quán)統(tǒng)計(jì)算法的改進(jìn)58-60
- 5.7 實(shí)驗(yàn)及分析60-66
- 5.7.1 實(shí)驗(yàn)環(huán)境60-61
- 5.7.2 數(shù)據(jù)庫(kù)設(shè)計(jì)61-63
- 5.7.3 實(shí)驗(yàn)準(zhǔn)備63-64
- 5.7.4 對(duì)比實(shí)驗(yàn)結(jié)果及分析64-66
- 5.8 本章小結(jié)66-67
- 第六章 總結(jié)和展望67-68
- 6.1 全文總結(jié)67
- 6.2 展望67-68
- 致謝68-69
- 參考文獻(xiàn)69-73
- 在學(xué)期間取得的學(xué)術(shù)成果73
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前4條
1 婁德成;姚天f ;;漢語(yǔ)句子語(yǔ)義極性分析和觀點(diǎn)抽取方法的研究[J];計(jì)算機(jī)應(yīng)用;2006年11期
2 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語(yǔ)義傾向計(jì)算[J];中文信息學(xué)報(bào);2006年01期
3 姚天f ;程希文;徐飛玉;漢思·烏思克爾特;王睿;;文本意見挖掘綜述[J];中文信息學(xué)報(bào);2008年03期
4 趙妍妍;秦兵;劉挺;;文本情感分析[J];軟件學(xué)報(bào);2010年08期
本文關(guān)鍵詞:基于電子商務(wù)的評(píng)論文本情感極性等級(jí)分析,由筆耕文化傳播整理發(fā)布。
本文編號(hào):272566
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/272566.html
最近更新
教材專著