基于擴展情感詞典的短文本情感分析技術(shù)研究
發(fā)布時間:2021-01-31 10:35
近年來,著網(wǎng)絡的普及和人們生活水平的提,網(wǎng)絡購物越來越受到人們的喜愛,天貓商城等網(wǎng)絡購物平臺也迅速發(fā)展壯大,大規(guī)模的網(wǎng)絡購物行為帶來了海量的評論文本數(shù)據(jù),這些評論文本的情感傾向性,對于買家的購買決策和賣家的銷售策略調(diào)整、宣傳重點優(yōu)化以及產(chǎn)品市場定位等有著重要的參考價值。然而,評論文本是一種典型的短文本,傳統(tǒng)的文本情感分析方法并不能很好地適用于短文本情感分析,目前短文本情感分析的研究還處于起步段。為了進一步提升對于短文本的情感分析效果,本文以天貓評論短文本為研究數(shù)據(jù),提出了一種基于擴展情感詞典的短文本情感分析方案。文章主要包括研究數(shù)據(jù)的獲取與處理、擴展情感詞典的構(gòu)建、評論短文本的情感分析以及應用系統(tǒng)的設計與開發(fā)等。在數(shù)據(jù)的獲取與處理方,首先,基于python編寫程序,獲取研究要的數(shù)據(jù),并進行數(shù)據(jù)清洗,保留有意義的數(shù)據(jù),按照規(guī)定的格式進行存儲;然后,合并初次評論和追加評論的評論文本,并人工標注評論文本的情感極性,去掉情感傾向不明顯的中性評論;最后,對帶有情感極性的評論文本進行文本處理,包括去標點符號、中文分詞、去停用詞等。在擴展情感詞典的構(gòu)建方,為了增加情感詞典的準確率和覆蓋率,本文提出了...
【文章來源】:青島理工大學山東省
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
實僂數(shù)據(jù)
島理工大學工學士學位文24然后把把Ti的值賦給該條評論短文本中的所有情感詞,記為Tij,其中i代表第i條評論,j代表第j個情感詞。要注意的是,當一條評論短文本中情感詞的人工判定極性和該詞所在評論的整體情感傾向性矛盾時,以人工判定的極性結(jié)果為準;當同一個情感詞同時出現(xiàn)在多條評論短文本中時,對所有包含該詞語的評論短文本的snowNLP分值計算平均值,并把該平均值用作情感詞的基礎(chǔ)情感分值。程序結(jié)果如圖3.4所示。圖3.4基于snowNLP的文本情感分析結(jié)果為了更直觀的展現(xiàn)基于snowNLP方法的應用效果,本文使用python語言編程,根據(jù)基礎(chǔ)情感分值的大小,選取了排名前的200個詞,進行圖3.5所示的詞云展示。圖3.5云結(jié)果3.2.2.2基于TF-IDF情感權(quán)分值取TF-IDF算法可以計算出一個語料庫中所有詞語的重要程度分值,如果去掉無意義詞語和不帶情感傾向性的詞語,只保留帶有情感傾向性的詞語,即基礎(chǔ)情感詞,那么該詞語對于所在語料庫的重要程度分值,就可以被認為是該詞語相對
云結(jié)果
【參考文獻】:
期刊論文
[1]領(lǐng)域情感詞典構(gòu)建方法研究[J]. 李楓林,范雅嫻. 圖書館理論與實踐. 2019(12)
[2]基于多部情感詞典和規(guī)則集的中文微博情感分析研究[J]. 吳杰勝,陸奎. 計算機應用與軟件. 2019(09)
[3]基于文本情感分析的電商在線評論數(shù)據(jù)挖掘[J]. 張昊. 現(xiàn)代經(jīng)濟信息. 2019(17)
[4]基于Python的改進關(guān)鍵詞提取算法的實現(xiàn)[J]. 牛永潔. 電子設計工程. 2019(13)
[5]基于共詞分析的國內(nèi)文本情感分析研究[J]. 陳紅琳,魏瑞斌,張瑋,張宇航. 現(xiàn)代情報. 2019(06)
[6]基于表情符號的文本情感分析研究[J]. 陽慶玲,鄭志偉,邱佳玲,郭山清,賈忠偉,宋超,顧菁,李菁華,郝元濤,郝春. 現(xiàn)代預防醫(yī)學. 2019(09)
[7]基于PMI的豆瓣電影評論文本情感分析[J]. 張琰,黃霽風. 現(xiàn)代計算機. 2019(12)
[8]基于主題模型的短文本情感分析的研究[J]. 花樹雯,張云華. 電工技術(shù). 2019(04)
[9]大數(shù)據(jù)環(huán)境下文本情感分析算法的規(guī)模適配研究:以Twitter為數(shù)據(jù)源[J]. 余傳明,原賽,王峰,安璐. 圖書情報工作. 2019(04)
[10]基于文本情感分析的電商在線評論數(shù)據(jù)挖掘[J]. 劉玉林,菅利榮. 統(tǒng)計與信息論壇. 2018(12)
博士論文
[1]情感詞典構(gòu)建方法及其應用研究[D]. 鄧東.北京交通大學 2019
[2]基于句法和語義挖掘的Web金融評論情感分析[D]. 江騰蛟.江西財經(jīng)大學 2015
[3]基于語義統(tǒng)計分析的網(wǎng)絡輿情挖掘技術(shù)研究[D]. 萬源.武漢理工大學 2012
碩士論文
[1]微博文本情感分析研究[D]. 袁婷婷.新疆大學 2019
[2]基于情感分析的旅游景點推薦[D]. 何雪琴.新疆大學 2019
[3]中文微博情感分析關(guān)鍵技術(shù)研究[D]. 林江豪.廣東外語外貿(mào)大學 2013
[4]文本傾向性分析在輿情監(jiān)控系統(tǒng)中的應用研究[D]. 張超.北京郵電大學 2008
本文編號:3010698
【文章來源】:青島理工大學山東省
【文章頁數(shù)】:71 頁
【學位級別】:碩士
【部分圖文】:
實僂數(shù)據(jù)
島理工大學工學士學位文24然后把把Ti的值賦給該條評論短文本中的所有情感詞,記為Tij,其中i代表第i條評論,j代表第j個情感詞。要注意的是,當一條評論短文本中情感詞的人工判定極性和該詞所在評論的整體情感傾向性矛盾時,以人工判定的極性結(jié)果為準;當同一個情感詞同時出現(xiàn)在多條評論短文本中時,對所有包含該詞語的評論短文本的snowNLP分值計算平均值,并把該平均值用作情感詞的基礎(chǔ)情感分值。程序結(jié)果如圖3.4所示。圖3.4基于snowNLP的文本情感分析結(jié)果為了更直觀的展現(xiàn)基于snowNLP方法的應用效果,本文使用python語言編程,根據(jù)基礎(chǔ)情感分值的大小,選取了排名前的200個詞,進行圖3.5所示的詞云展示。圖3.5云結(jié)果3.2.2.2基于TF-IDF情感權(quán)分值取TF-IDF算法可以計算出一個語料庫中所有詞語的重要程度分值,如果去掉無意義詞語和不帶情感傾向性的詞語,只保留帶有情感傾向性的詞語,即基礎(chǔ)情感詞,那么該詞語對于所在語料庫的重要程度分值,就可以被認為是該詞語相對
云結(jié)果
【參考文獻】:
期刊論文
[1]領(lǐng)域情感詞典構(gòu)建方法研究[J]. 李楓林,范雅嫻. 圖書館理論與實踐. 2019(12)
[2]基于多部情感詞典和規(guī)則集的中文微博情感分析研究[J]. 吳杰勝,陸奎. 計算機應用與軟件. 2019(09)
[3]基于文本情感分析的電商在線評論數(shù)據(jù)挖掘[J]. 張昊. 現(xiàn)代經(jīng)濟信息. 2019(17)
[4]基于Python的改進關(guān)鍵詞提取算法的實現(xiàn)[J]. 牛永潔. 電子設計工程. 2019(13)
[5]基于共詞分析的國內(nèi)文本情感分析研究[J]. 陳紅琳,魏瑞斌,張瑋,張宇航. 現(xiàn)代情報. 2019(06)
[6]基于表情符號的文本情感分析研究[J]. 陽慶玲,鄭志偉,邱佳玲,郭山清,賈忠偉,宋超,顧菁,李菁華,郝元濤,郝春. 現(xiàn)代預防醫(yī)學. 2019(09)
[7]基于PMI的豆瓣電影評論文本情感分析[J]. 張琰,黃霽風. 現(xiàn)代計算機. 2019(12)
[8]基于主題模型的短文本情感分析的研究[J]. 花樹雯,張云華. 電工技術(shù). 2019(04)
[9]大數(shù)據(jù)環(huán)境下文本情感分析算法的規(guī)模適配研究:以Twitter為數(shù)據(jù)源[J]. 余傳明,原賽,王峰,安璐. 圖書情報工作. 2019(04)
[10]基于文本情感分析的電商在線評論數(shù)據(jù)挖掘[J]. 劉玉林,菅利榮. 統(tǒng)計與信息論壇. 2018(12)
博士論文
[1]情感詞典構(gòu)建方法及其應用研究[D]. 鄧東.北京交通大學 2019
[2]基于句法和語義挖掘的Web金融評論情感分析[D]. 江騰蛟.江西財經(jīng)大學 2015
[3]基于語義統(tǒng)計分析的網(wǎng)絡輿情挖掘技術(shù)研究[D]. 萬源.武漢理工大學 2012
碩士論文
[1]微博文本情感分析研究[D]. 袁婷婷.新疆大學 2019
[2]基于情感分析的旅游景點推薦[D]. 何雪琴.新疆大學 2019
[3]中文微博情感分析關(guān)鍵技術(shù)研究[D]. 林江豪.廣東外語外貿(mào)大學 2013
[4]文本傾向性分析在輿情監(jiān)控系統(tǒng)中的應用研究[D]. 張超.北京郵電大學 2008
本文編號:3010698
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3010698.html
最近更新
教材專著