基于改良SO-PMI算法的在線評論情感傾向性分析研究
發(fā)布時間:2020-06-16 01:58
【摘要】:情感是人類所具有的一種特殊的屬性。本文研究的內(nèi)容就是電子商務(wù)環(huán)境下用戶評論文本中的情感分析。評論可以反映出用戶使用商品的感受,用戶可以表達(dá)贊賞也可以宣泄不滿。因此,評論是其他用戶購買同產(chǎn)品的一種主要參考。但是由于購物者數(shù)量眾多且文化水平各異,難以對大量的在線評論準(zhǔn)確分類,給用戶的瀏覽造成不便。因此引入情感分析方法從情感傾向性入手,對評論進(jìn)行分類優(yōu)化,提高用戶通過評論判斷產(chǎn)品好壞的效率,以便用戶高效準(zhǔn)確的確定所需商品。本文以用戶購買手機(jī)的評論作為研究范例,使用情感分析方法判斷評論的情感傾向。第一步構(gòu)造面向手機(jī)領(lǐng)域準(zhǔn)確全面的情感詞典,使用改良后的SO-PMI算法擴(kuò)充情感詞典,進(jìn)一步,基于情感詞典,對情感詞及其他類別的詞進(jìn)行相應(yīng)的計算,判斷出評論的情感傾向性,并對其進(jìn)行分類。主要研究內(nèi)容總結(jié)如下:(1)基礎(chǔ)情感詞典合并以及修飾性詞典整理。在基于情感詞典的情感分析中,由于傳統(tǒng)單個情感詞典在詞匯量、版本等方面的限制,對特定領(lǐng)域評論的情感分析效果較差,因此通過搜集整理,選擇了知網(wǎng)情感詞典、臺灣大學(xué)情感詞典和清華大學(xué)李軍中文褒貶義詞典進(jìn)行合并,這樣就得到了通用基礎(chǔ)情感詞典,由于本文的特定對象為手機(jī),還添加了手機(jī)相關(guān)情感詞典。并且搜集整理了修飾性詞典,具體包括否定詞詞典、程度副詞詞典和關(guān)聯(lián)詞詞典。(2)情感詞典擴(kuò)充。手機(jī)評論中還包含著基礎(chǔ)情感詞典中未添加的詞,影響情感分析的效果,要對含有新詞的手機(jī)評論進(jìn)行情感傾向性判斷,還需要對情感詞典進(jìn)行擴(kuò)充。為此,本文使用了改良的SO-PMI算法對情感詞典進(jìn)行了擴(kuò)充。主要改良工作包括:1.使用TF-IDF算法對基準(zhǔn)詞的選擇進(jìn)行了優(yōu)化。2.基于多項式貝葉斯(MultinomiaNB)分類器確定出最佳分類維度,然后使用卡方統(tǒng)計量進(jìn)行候選情感詞的提取。(3)手機(jī)在線評論情感分類實驗。在綜合考慮購物平臺數(shù)據(jù)量、口碑、產(chǎn)品的質(zhì)量后,選擇爬取京東網(wǎng)上商城手機(jī)版塊的評論數(shù)據(jù)。在對評論進(jìn)行去重、格式轉(zhuǎn)換等處理后,就得到了帶有標(biāo)注的評論,然后基于情感詞典對其進(jìn)行分類測試,結(jié)果顯示情感分類方法能夠有效的對手機(jī)在線評論進(jìn)行傾向性分類。用實驗證明了基于改良SO-PMI算法的詞典擴(kuò)充方法的有效性,為情感詞典的擴(kuò)充提供了一種新的思路,經(jīng)過驗證分類的查準(zhǔn)率、召回率以及F1值達(dá)到了較高水平。最后,根據(jù)改良SO-PMI算法的評論分類結(jié)果,設(shè)計了情感傾向程度對比實驗進(jìn)行二次分類,進(jìn)一步對正向評論和負(fù)向評論進(jìn)行細(xì)分,其中情感傾向性最高的正向評論和負(fù)向評論分類準(zhǔn)確度最高。
【學(xué)位授予單位】:東北財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:F713.36;TP391.1
【圖文】:
邐電子商務(wù)在線評論的情感傾向性分析逡逑類,成功的篩選出了情感傾向性最強(qiáng)且所包含信息相對較多的評論,將來可以將這些逡逑評論展示給用戶或廠商。逡逑第五章總結(jié)和展望。從手機(jī)評論數(shù)據(jù)的獲取,到SO-PMI算法的改進(jìn)工作,三個逡逑個分類對比實驗,相關(guān)詞典的整合等多個方面,對全文進(jìn)行了總結(jié)。逡逑圖1為情感分析流程圖。逡逑f邐邐邐邐;邐r邐邐-逡逑
3.1手機(jī)領(lǐng)域情感詞典的構(gòu)建逡逑基于情感詞典的情感傾向性分析的核心就是情感詞典的構(gòu)建,情感詞典構(gòu)建的壞將直接決定分類性能。無論是在國內(nèi)還是國外,通用的基礎(chǔ)詞典并不能覆蓋大多的專門行業(yè)的詞匯,基礎(chǔ)性詞匯對于專業(yè)領(lǐng)域的評論文本來說,其分類效果不是很好而且基礎(chǔ)性詞典的規(guī)模和側(cè)重點(diǎn)往往有所區(qū)別。目前還沒有適用于具體領(lǐng)域的情感典,本章將以手機(jī)為研究范例,通過改良SO-PMI算法構(gòu)建一個適用于手機(jī)領(lǐng)域的感詞典。逡逑目前常用的中文情感詞典有知網(wǎng)情感詞典(HowNet),臺灣大學(xué)情感詞(NTUSD),清華大學(xué)李軍中文褒貶義詞典等,構(gòu)建手機(jī)領(lǐng)域的情感詞典,需要這些情感詞典進(jìn)行整理、合并、去重、刪除等操作,然后合并成基礎(chǔ)情感詞典,還要添加一些手機(jī)領(lǐng)域的情感詞,以及網(wǎng)絡(luò)流行的情感詞。另外,山于程度副詞會起放大評論情感傾向的作用,否定詞會產(chǎn)生逆轉(zhuǎn)在線評論情感傾向的作用,因此還需建其他用以輔助判斷情感傾向的詞典。最后,鑒于網(wǎng)絡(luò)評論中存在新詞影響情感分效果,提出了一種基于改良S0-PM1算法的詞典擴(kuò)展方法構(gòu)造擴(kuò)展情感詞詞典。如3-1所示,下面將進(jìn)行具體的介紹。逡逑
【學(xué)位授予單位】:東北財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:F713.36;TP391.1
【圖文】:
邐電子商務(wù)在線評論的情感傾向性分析逡逑類,成功的篩選出了情感傾向性最強(qiáng)且所包含信息相對較多的評論,將來可以將這些逡逑評論展示給用戶或廠商。逡逑第五章總結(jié)和展望。從手機(jī)評論數(shù)據(jù)的獲取,到SO-PMI算法的改進(jìn)工作,三個逡逑個分類對比實驗,相關(guān)詞典的整合等多個方面,對全文進(jìn)行了總結(jié)。逡逑圖1為情感分析流程圖。逡逑f邐邐邐邐;邐r邐邐-逡逑
3.1手機(jī)領(lǐng)域情感詞典的構(gòu)建逡逑基于情感詞典的情感傾向性分析的核心就是情感詞典的構(gòu)建,情感詞典構(gòu)建的壞將直接決定分類性能。無論是在國內(nèi)還是國外,通用的基礎(chǔ)詞典并不能覆蓋大多的專門行業(yè)的詞匯,基礎(chǔ)性詞匯對于專業(yè)領(lǐng)域的評論文本來說,其分類效果不是很好而且基礎(chǔ)性詞典的規(guī)模和側(cè)重點(diǎn)往往有所區(qū)別。目前還沒有適用于具體領(lǐng)域的情感典,本章將以手機(jī)為研究范例,通過改良SO-PMI算法構(gòu)建一個適用于手機(jī)領(lǐng)域的感詞典。逡逑目前常用的中文情感詞典有知網(wǎng)情感詞典(HowNet),臺灣大學(xué)情感詞(NTUSD),清華大學(xué)李軍中文褒貶義詞典等,構(gòu)建手機(jī)領(lǐng)域的情感詞典,需要這些情感詞典進(jìn)行整理、合并、去重、刪除等操作,然后合并成基礎(chǔ)情感詞典,還要添加一些手機(jī)領(lǐng)域的情感詞,以及網(wǎng)絡(luò)流行的情感詞。另外,山于程度副詞會起放大評論情感傾向的作用,否定詞會產(chǎn)生逆轉(zhuǎn)在線評論情感傾向的作用,因此還需建其他用以輔助判斷情感傾向的詞典。最后,鑒于網(wǎng)絡(luò)評論中存在新詞影響情感分效果,提出了一種基于改良S0-PM1算法的詞典擴(kuò)展方法構(gòu)造擴(kuò)展情感詞詞典。如3-1所示,下面將進(jìn)行具體的介紹。逡逑
【相似文獻(xiàn)】
相關(guān)期刊論文 前2條
1 杜銳;朱艷輝;田海龍;劉t
本文編號:2715346
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2715346.html
最近更新
教材專著