基于詞典與詞向量融合的文本情感分析研究
發(fā)布時(shí)間:2021-11-14 17:40
近年來,隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,各種社交平臺(tái)以及電商平臺(tái)的數(shù)量急劇增加,用戶在互聯(lián)網(wǎng)上發(fā)表意見、表達(dá)自己的情感已經(jīng)成為了人們生活中的經(jīng)常性行為。利用自然語言技術(shù)對(duì)互聯(lián)網(wǎng)中用戶發(fā)表的各種文本進(jìn)行分析并從中挖掘出所包含的情感傾向是掌握社會(huì)現(xiàn)狀及事件動(dòng)態(tài)和獲取商家售后信息的重要途徑。因此研究文本情感分析方法具有重要的商業(yè)價(jià)值和社會(huì)意義。目前已有的傳統(tǒng)的文本情感分析研究方法還存在許多不足:現(xiàn)存的情感詞典完備度較低,每個(gè)領(lǐng)域所擁有的情感詞不同,通用情感詞典難以達(dá)到理想的效果;傳統(tǒng)的詞向量技術(shù)根據(jù)上下文學(xué)習(xí)獲得,包含了語義語法信息,但是缺乏了情感信息,不能很好的解決情感分析任務(wù)。針對(duì)以上問題,本文利用構(gòu)建的領(lǐng)域情感詞典將情感信息融入到詞向量中結(jié)合卷積神經(jīng)網(wǎng)絡(luò)思想對(duì)在線評(píng)論文本情感分析進(jìn)行研究。本文涉及的主要工作有以下幾個(gè)方面:(1)針對(duì)現(xiàn)有的情感詞典完備性以及領(lǐng)域適應(yīng)性較差的問題,整合現(xiàn)有情感詞典,同時(shí)利用改進(jìn)的SO-PMI算法以及手機(jī)評(píng)論語料庫構(gòu)建一個(gè)手機(jī)評(píng)論領(lǐng)域的領(lǐng)域情感詞典。(2)針對(duì)傳統(tǒng)詞向量的學(xué)習(xí)是通過訓(xùn)練學(xué)習(xí)語言模型而得到的產(chǎn)物,詞的分布式表達(dá)中僅包含了語義和語法信息,缺乏了情感信息...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
部分手機(jī)用戶正面評(píng)論
圖 4.6 部分手機(jī)用戶負(fù)面評(píng)論本文使用 Python 語言來進(jìn)行實(shí)驗(yàn),其中運(yùn)用到 Numpy、jieba、gensim、sklearn等類庫。Numpy 支持大量的維度數(shù)組與矩陣運(yùn)算。Jieba 是一款很好用的中文文本分詞工具。gensim 用于從文檔中自動(dòng)提取語義主題,sklearn 對(duì)常用的機(jī)器學(xué)習(xí)方法進(jìn)行了封裝。
【參考文獻(xiàn)】:
期刊論文
[1]基于情感詞典方法的情感傾向性分析[J]. 楊奎,段瓊瑾. 計(jì)算機(jī)時(shí)代. 2017(03)
[2]基于SVM多特征融合的微博情感多級(jí)分類研究[J]. 楊爽,陳芬. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2017(02)
[3]分段卷積神經(jīng)網(wǎng)絡(luò)在文本情感分析中的應(yīng)用[J]. 杜昌順,黃磊. 計(jì)算機(jī)工程與科學(xué). 2017(01)
[4]詞匯語義表示研究綜述[J]. 袁書寒,向陽. 中文信息學(xué)報(bào). 2016(05)
[5]基于word2vec的互聯(lián)網(wǎng)商品評(píng)論情感傾向研究[J]. 黃仁,張衛(wèi). 計(jì)算機(jī)科學(xué). 2016(S1)
[6]基于HNC語境框架和情感詞典的文本情感傾向分析[J]. 張克亮,黃金柱,曹蓉,李峰. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2016(07)
[7]基于情感詞典與語義規(guī)則的微博情感分析[J]. 陳國蘭. 情報(bào)探索. 2016(02)
[8]情感詞典自動(dòng)構(gòu)建方法綜述[J]. 王科,夏睿. 自動(dòng)化學(xué)報(bào). 2016(04)
[9]基于極性轉(zhuǎn)移和LSTM遞歸網(wǎng)絡(luò)的情感分析[J]. 梁軍,柴玉梅,原慧斌,高明磊,昝紅英. 中文信息學(xué)報(bào). 2015(05)
[10]一種新聞評(píng)論情感詞典的構(gòu)建方法[J]. 周詠梅,陽愛民,楊佳能. 計(jì)算機(jī)科學(xué). 2014(08)
碩士論文
[1]網(wǎng)絡(luò)評(píng)論文本的細(xì)粒度情感分析研究[D]. 蔡肖紅.山東師范大學(xué) 2017
[2]微博數(shù)據(jù)挖掘可視化系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 王婧雅.吉林大學(xué) 2017
[3]文本傾向性分析中的評(píng)價(jià)對(duì)象抽取與消歧研究[D]. 王沛.哈爾濱工業(yè)大學(xué) 2013
本文編號(hào):3495067
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
部分手機(jī)用戶正面評(píng)論
圖 4.6 部分手機(jī)用戶負(fù)面評(píng)論本文使用 Python 語言來進(jìn)行實(shí)驗(yàn),其中運(yùn)用到 Numpy、jieba、gensim、sklearn等類庫。Numpy 支持大量的維度數(shù)組與矩陣運(yùn)算。Jieba 是一款很好用的中文文本分詞工具。gensim 用于從文檔中自動(dòng)提取語義主題,sklearn 對(duì)常用的機(jī)器學(xué)習(xí)方法進(jìn)行了封裝。
【參考文獻(xiàn)】:
期刊論文
[1]基于情感詞典方法的情感傾向性分析[J]. 楊奎,段瓊瑾. 計(jì)算機(jī)時(shí)代. 2017(03)
[2]基于SVM多特征融合的微博情感多級(jí)分類研究[J]. 楊爽,陳芬. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2017(02)
[3]分段卷積神經(jīng)網(wǎng)絡(luò)在文本情感分析中的應(yīng)用[J]. 杜昌順,黃磊. 計(jì)算機(jī)工程與科學(xué). 2017(01)
[4]詞匯語義表示研究綜述[J]. 袁書寒,向陽. 中文信息學(xué)報(bào). 2016(05)
[5]基于word2vec的互聯(lián)網(wǎng)商品評(píng)論情感傾向研究[J]. 黃仁,張衛(wèi). 計(jì)算機(jī)科學(xué). 2016(S1)
[6]基于HNC語境框架和情感詞典的文本情感傾向分析[J]. 張克亮,黃金柱,曹蓉,李峰. 山東大學(xué)學(xué)報(bào)(理學(xué)版). 2016(07)
[7]基于情感詞典與語義規(guī)則的微博情感分析[J]. 陳國蘭. 情報(bào)探索. 2016(02)
[8]情感詞典自動(dòng)構(gòu)建方法綜述[J]. 王科,夏睿. 自動(dòng)化學(xué)報(bào). 2016(04)
[9]基于極性轉(zhuǎn)移和LSTM遞歸網(wǎng)絡(luò)的情感分析[J]. 梁軍,柴玉梅,原慧斌,高明磊,昝紅英. 中文信息學(xué)報(bào). 2015(05)
[10]一種新聞評(píng)論情感詞典的構(gòu)建方法[J]. 周詠梅,陽愛民,楊佳能. 計(jì)算機(jī)科學(xué). 2014(08)
碩士論文
[1]網(wǎng)絡(luò)評(píng)論文本的細(xì)粒度情感分析研究[D]. 蔡肖紅.山東師范大學(xué) 2017
[2]微博數(shù)據(jù)挖掘可視化系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 王婧雅.吉林大學(xué) 2017
[3]文本傾向性分析中的評(píng)價(jià)對(duì)象抽取與消歧研究[D]. 王沛.哈爾濱工業(yè)大學(xué) 2013
本文編號(hào):3495067
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3495067.html
最近更新
教材專著