基于擴(kuò)展情感詞典的短文本情感分析技術(shù)研究
發(fā)布時(shí)間:2021-01-31 10:35
近年來(lái),著網(wǎng)絡(luò)的普及和人們生活水平的提,網(wǎng)絡(luò)購(gòu)物越來(lái)越受到人們的喜愛,天貓商城等網(wǎng)絡(luò)購(gòu)物平臺(tái)也迅速發(fā)展壯大,大規(guī)模的網(wǎng)絡(luò)購(gòu)物行為帶來(lái)了海量的評(píng)論文本數(shù)據(jù),這些評(píng)論文本的情感傾向性,對(duì)于買家的購(gòu)買決策和賣家的銷售策略調(diào)整、宣傳重點(diǎn)優(yōu)化以及產(chǎn)品市場(chǎng)定位等有著重要的參考價(jià)值。然而,評(píng)論文本是一種典型的短文本,傳統(tǒng)的文本情感分析方法并不能很好地適用于短文本情感分析,目前短文本情感分析的研究還處于起步段。為了進(jìn)一步提升對(duì)于短文本的情感分析效果,本文以天貓?jiān)u論短文本為研究數(shù)據(jù),提出了一種基于擴(kuò)展情感詞典的短文本情感分析方案。文章主要包括研究數(shù)據(jù)的獲取與處理、擴(kuò)展情感詞典的構(gòu)建、評(píng)論短文本的情感分析以及應(yīng)用系統(tǒng)的設(shè)計(jì)與開發(fā)等。在數(shù)據(jù)的獲取與處理方,首先,基于python編寫程序,獲取研究要的數(shù)據(jù),并進(jìn)行數(shù)據(jù)清洗,保留有意義的數(shù)據(jù),按照規(guī)定的格式進(jìn)行存儲(chǔ);然后,合并初次評(píng)論和追加評(píng)論的評(píng)論文本,并人工標(biāo)注評(píng)論文本的情感極性,去掉情感傾向不明顯的中性評(píng)論;最后,對(duì)帶有情感極性的評(píng)論文本進(jìn)行文本處理,包括去標(biāo)點(diǎn)符號(hào)、中文分詞、去停用詞等。在擴(kuò)展情感詞典的構(gòu)建方,為了增加情感詞典的準(zhǔn)確率和覆蓋率,本文提出了...
【文章來(lái)源】:青島理工大學(xué)山東省
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
實(shí)僂數(shù)據(jù)
島理工大學(xué)工學(xué)士學(xué)位文24然后把把Ti的值賦給該條評(píng)論短文本中的所有情感詞,記為Tij,其中i代表第i條評(píng)論,j代表第j個(gè)情感詞。要注意的是,當(dāng)一條評(píng)論短文本中情感詞的人工判定極性和該詞所在評(píng)論的整體情感傾向性矛盾時(shí),以人工判定的極性結(jié)果為準(zhǔn);當(dāng)同一個(gè)情感詞同時(shí)出現(xiàn)在多條評(píng)論短文本中時(shí),對(duì)所有包含該詞語(yǔ)的評(píng)論短文本的snowNLP分值計(jì)算平均值,并把該平均值用作情感詞的基礎(chǔ)情感分值。程序結(jié)果如圖3.4所示。圖3.4基于snowNLP的文本情感分析結(jié)果為了更直觀的展現(xiàn)基于snowNLP方法的應(yīng)用效果,本文使用python語(yǔ)言編程,根據(jù)基礎(chǔ)情感分值的大小,選取了排名前的200個(gè)詞,進(jìn)行圖3.5所示的詞云展示。圖3.5云結(jié)果3.2.2.2基于TF-IDF情感權(quán)分值取TF-IDF算法可以計(jì)算出一個(gè)語(yǔ)料庫(kù)中所有詞語(yǔ)的重要程度分值,如果去掉無(wú)意義詞語(yǔ)和不帶情感傾向性的詞語(yǔ),只保留帶有情感傾向性的詞語(yǔ),即基礎(chǔ)情感詞,那么該詞語(yǔ)對(duì)于所在語(yǔ)料庫(kù)的重要程度分值,就可以被認(rèn)為是該詞語(yǔ)相對(duì)
云結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]領(lǐng)域情感詞典構(gòu)建方法研究[J]. 李楓林,范雅嫻. 圖書館理論與實(shí)踐. 2019(12)
[2]基于多部情感詞典和規(guī)則集的中文微博情感分析研究[J]. 吳杰勝,陸奎. 計(jì)算機(jī)應(yīng)用與軟件. 2019(09)
[3]基于文本情感分析的電商在線評(píng)論數(shù)據(jù)挖掘[J]. 張昊. 現(xiàn)代經(jīng)濟(jì)信息. 2019(17)
[4]基于Python的改進(jìn)關(guān)鍵詞提取算法的實(shí)現(xiàn)[J]. 牛永潔. 電子設(shè)計(jì)工程. 2019(13)
[5]基于共詞分析的國(guó)內(nèi)文本情感分析研究[J]. 陳紅琳,魏瑞斌,張瑋,張宇航. 現(xiàn)代情報(bào). 2019(06)
[6]基于表情符號(hào)的文本情感分析研究[J]. 陽(yáng)慶玲,鄭志偉,邱佳玲,郭山清,賈忠偉,宋超,顧菁,李菁華,郝元濤,郝春. 現(xiàn)代預(yù)防醫(yī)學(xué). 2019(09)
[7]基于PMI的豆瓣電影評(píng)論文本情感分析[J]. 張琰,黃霽風(fēng). 現(xiàn)代計(jì)算機(jī). 2019(12)
[8]基于主題模型的短文本情感分析的研究[J]. 花樹雯,張?jiān)迫A. 電工技術(shù). 2019(04)
[9]大數(shù)據(jù)環(huán)境下文本情感分析算法的規(guī)模適配研究:以Twitter為數(shù)據(jù)源[J]. 余傳明,原賽,王峰,安璐. 圖書情報(bào)工作. 2019(04)
[10]基于文本情感分析的電商在線評(píng)論數(shù)據(jù)挖掘[J]. 劉玉林,菅利榮. 統(tǒng)計(jì)與信息論壇. 2018(12)
博士論文
[1]情感詞典構(gòu)建方法及其應(yīng)用研究[D]. 鄧東.北京交通大學(xué) 2019
[2]基于句法和語(yǔ)義挖掘的Web金融評(píng)論情感分析[D]. 江騰蛟.江西財(cái)經(jīng)大學(xué) 2015
[3]基于語(yǔ)義統(tǒng)計(jì)分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究[D]. 萬(wàn)源.武漢理工大學(xué) 2012
碩士論文
[1]微博文本情感分析研究[D]. 袁婷婷.新疆大學(xué) 2019
[2]基于情感分析的旅游景點(diǎn)推薦[D]. 何雪琴.新疆大學(xué) 2019
[3]中文微博情感分析關(guān)鍵技術(shù)研究[D]. 林江豪.廣東外語(yǔ)外貿(mào)大學(xué) 2013
[4]文本傾向性分析在輿情監(jiān)控系統(tǒng)中的應(yīng)用研究[D]. 張超.北京郵電大學(xué) 2008
本文編號(hào):3010698
【文章來(lái)源】:青島理工大學(xué)山東省
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
實(shí)僂數(shù)據(jù)
島理工大學(xué)工學(xué)士學(xué)位文24然后把把Ti的值賦給該條評(píng)論短文本中的所有情感詞,記為Tij,其中i代表第i條評(píng)論,j代表第j個(gè)情感詞。要注意的是,當(dāng)一條評(píng)論短文本中情感詞的人工判定極性和該詞所在評(píng)論的整體情感傾向性矛盾時(shí),以人工判定的極性結(jié)果為準(zhǔn);當(dāng)同一個(gè)情感詞同時(shí)出現(xiàn)在多條評(píng)論短文本中時(shí),對(duì)所有包含該詞語(yǔ)的評(píng)論短文本的snowNLP分值計(jì)算平均值,并把該平均值用作情感詞的基礎(chǔ)情感分值。程序結(jié)果如圖3.4所示。圖3.4基于snowNLP的文本情感分析結(jié)果為了更直觀的展現(xiàn)基于snowNLP方法的應(yīng)用效果,本文使用python語(yǔ)言編程,根據(jù)基礎(chǔ)情感分值的大小,選取了排名前的200個(gè)詞,進(jìn)行圖3.5所示的詞云展示。圖3.5云結(jié)果3.2.2.2基于TF-IDF情感權(quán)分值取TF-IDF算法可以計(jì)算出一個(gè)語(yǔ)料庫(kù)中所有詞語(yǔ)的重要程度分值,如果去掉無(wú)意義詞語(yǔ)和不帶情感傾向性的詞語(yǔ),只保留帶有情感傾向性的詞語(yǔ),即基礎(chǔ)情感詞,那么該詞語(yǔ)對(duì)于所在語(yǔ)料庫(kù)的重要程度分值,就可以被認(rèn)為是該詞語(yǔ)相對(duì)
云結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]領(lǐng)域情感詞典構(gòu)建方法研究[J]. 李楓林,范雅嫻. 圖書館理論與實(shí)踐. 2019(12)
[2]基于多部情感詞典和規(guī)則集的中文微博情感分析研究[J]. 吳杰勝,陸奎. 計(jì)算機(jī)應(yīng)用與軟件. 2019(09)
[3]基于文本情感分析的電商在線評(píng)論數(shù)據(jù)挖掘[J]. 張昊. 現(xiàn)代經(jīng)濟(jì)信息. 2019(17)
[4]基于Python的改進(jìn)關(guān)鍵詞提取算法的實(shí)現(xiàn)[J]. 牛永潔. 電子設(shè)計(jì)工程. 2019(13)
[5]基于共詞分析的國(guó)內(nèi)文本情感分析研究[J]. 陳紅琳,魏瑞斌,張瑋,張宇航. 現(xiàn)代情報(bào). 2019(06)
[6]基于表情符號(hào)的文本情感分析研究[J]. 陽(yáng)慶玲,鄭志偉,邱佳玲,郭山清,賈忠偉,宋超,顧菁,李菁華,郝元濤,郝春. 現(xiàn)代預(yù)防醫(yī)學(xué). 2019(09)
[7]基于PMI的豆瓣電影評(píng)論文本情感分析[J]. 張琰,黃霽風(fēng). 現(xiàn)代計(jì)算機(jī). 2019(12)
[8]基于主題模型的短文本情感分析的研究[J]. 花樹雯,張?jiān)迫A. 電工技術(shù). 2019(04)
[9]大數(shù)據(jù)環(huán)境下文本情感分析算法的規(guī)模適配研究:以Twitter為數(shù)據(jù)源[J]. 余傳明,原賽,王峰,安璐. 圖書情報(bào)工作. 2019(04)
[10]基于文本情感分析的電商在線評(píng)論數(shù)據(jù)挖掘[J]. 劉玉林,菅利榮. 統(tǒng)計(jì)與信息論壇. 2018(12)
博士論文
[1]情感詞典構(gòu)建方法及其應(yīng)用研究[D]. 鄧東.北京交通大學(xué) 2019
[2]基于句法和語(yǔ)義挖掘的Web金融評(píng)論情感分析[D]. 江騰蛟.江西財(cái)經(jīng)大學(xué) 2015
[3]基于語(yǔ)義統(tǒng)計(jì)分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究[D]. 萬(wàn)源.武漢理工大學(xué) 2012
碩士論文
[1]微博文本情感分析研究[D]. 袁婷婷.新疆大學(xué) 2019
[2]基于情感分析的旅游景點(diǎn)推薦[D]. 何雪琴.新疆大學(xué) 2019
[3]中文微博情感分析關(guān)鍵技術(shù)研究[D]. 林江豪.廣東外語(yǔ)外貿(mào)大學(xué) 2013
[4]文本傾向性分析在輿情監(jiān)控系統(tǒng)中的應(yīng)用研究[D]. 張超.北京郵電大學(xué) 2008
本文編號(hào):3010698
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3010698.html
最近更新
教材專著