基于詞典和機(jī)器學(xué)習(xí)的酒店評(píng)論情感分析
發(fā)布時(shí)間:2021-12-24 13:47
隨著電子商務(wù)與社交網(wǎng)絡(luò)的快速發(fā)展,互聯(lián)網(wǎng)平臺(tái)中每日產(chǎn)生海量的個(gè)人言論和商品服務(wù)的評(píng)論。這些評(píng)論包含人們的各種情感并且蘊(yùn)含巨大的商業(yè)價(jià)值。由于數(shù)據(jù)來源廣泛,數(shù)量巨大,每時(shí)每刻都在增長變化,若通過人工方式來挖掘這些龐大的信息,不僅耗時(shí)耗力而且成效甚微,所以需要通過情感分析技術(shù)對(duì)海量的文本數(shù)據(jù)進(jìn)行處理與分析。情感分析是自然語言處理領(lǐng)域的一個(gè)重要研究方向,具有重要的研究價(jià)值和實(shí)際的應(yīng)用價(jià)值。本文主要對(duì)酒店領(lǐng)域的用戶評(píng)論進(jìn)行情感分析,從中挖掘用戶對(duì)酒店服務(wù)等方面的態(tài)度,為酒店提高服務(wù)質(zhì)量提供一定的幫助。本文主要工作如下:(1)以通用的中文情感詞典為基礎(chǔ)并將酒店評(píng)論數(shù)據(jù)作為擴(kuò)充詞典的語料,構(gòu)造適用于酒店評(píng)論的情感詞典。使用通用的詞典與本文構(gòu)造的情感詞典對(duì)同一語料進(jìn)行情感分類,并比較分類結(jié)果。實(shí)驗(yàn)結(jié)果表明:在正向與負(fù)向分類中,本文構(gòu)造的詞典在準(zhǔn)確率上分別是76.5%及80.4%,優(yōu)于通用詞典的分類效果。(2)由于詞向量表示方法未能考慮文本中詞語的重要程度,因此本文將特征權(quán)值與詞向量相結(jié)合,提出加權(quán)詞向量,將普通詞向量與加權(quán)詞向量分別作為文本表示的方法,并利用支持向量機(jī)進(jìn)行分類實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明:使用...
【文章來源】:江蘇科技大學(xué)江蘇省
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀和發(fā)展趨勢
1.2.1 基于情感詞典的情感分析
1.2.2 基于機(jī)器學(xué)習(xí)的情感分析
1.3 本文主要研究內(nèi)容
1.4 本文章節(jié)結(jié)構(gòu)
1.5 本章小結(jié)
第2章 情感分析相關(guān)理論
2.1 情感分析基本含義
2.2 情感分析的分類及流程
2.2.1 情感分析的分類
2.2.2 情感分析的流程
2.3 文本預(yù)處理
2.3.1 中文分詞
2.3.2 停用詞
2.3.3 詞性標(biāo)注
2.4 文本特征選擇
2.4.1 信息增益
2.4.2 互信息
2.4.3 文檔頻率
2.4.4 期望交叉熵
2.4.5 卡方統(tǒng)計(jì)
2.5 文本表示
2.5.1 布爾模型
2.5.2 概率模型
2.5.3 向量空間模型
2.6 分類評(píng)測標(biāo)準(zhǔn)
2.6.1 評(píng)測指標(biāo)
2.6.2 評(píng)測平臺(tái)
2.7 本章小結(jié)
第3章 情感詞典的構(gòu)造及情感值計(jì)算
3.1 基礎(chǔ)情感詞典
3.2 修飾詞詞典
3.2.1 程度副詞詞典
3.2.2 否定詞詞典
3.3 基于SO-PMI算法的情感詞典擴(kuò)充
3.4 基于酒店評(píng)論的情感詞典構(gòu)建
3.5 基于情感詞典計(jì)算情感值
3.6 實(shí)驗(yàn)及結(jié)果分析
3.7 本章小結(jié)
第4章 基于TFIDF情感權(quán)值的詞向量表示
4.1 常見特征權(quán)值計(jì)算方法
4.1.1 布爾權(quán)值
4.1.2 熵權(quán)值
4.1.3 TFIDF權(quán)值
4.2 詞向量表示
4.3 改進(jìn)TFIDF算法
4.4 基于改進(jìn)TFIDF的詞向量表示
4.5 本章小結(jié)
第5章 基于酒店評(píng)論數(shù)據(jù)的情感分析
5.1 分類算法介紹
5.1.1 樸素貝葉斯
5.1.2 支持向量機(jī)
5.2 實(shí)驗(yàn)設(shè)置及結(jié)果分析
5.2.1 實(shí)驗(yàn)數(shù)據(jù)集
5.2.2 實(shí)驗(yàn)環(huán)境
5.2.3 實(shí)驗(yàn)流程
5.2.4 數(shù)據(jù)預(yù)處理
5.2.5 基于情感詞典構(gòu)建訓(xùn)練集
5.2.6 詞向量訓(xùn)練和表示
5.2.7 實(shí)驗(yàn)及結(jié)果分析
5.3 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝
大摘要
【參考文獻(xiàn)】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)參數(shù)優(yōu)化的中文情感分析[J]. 王盛玉,曾碧卿,胡翩翩. 計(jì)算機(jī)工程. 2017(08)
[2]基于卷積神經(jīng)網(wǎng)絡(luò)和注意力模型的文本情感分析[J]. 馮興杰,張志偉,史金釧. 計(jì)算機(jī)應(yīng)用研究. 2018(05)
[3]文本情感分析綜述[J]. 楊立公,朱儉,湯世平. 計(jì)算機(jī)應(yīng)用. 2013(06)
[4]一種基于樸素貝葉斯的微博情感分類[J]. 林江豪,陽愛民,周詠梅,陳錦,蔡澤鍵. 計(jì)算機(jī)工程與科學(xué). 2012(09)
[5]基于單層標(biāo)注級(jí)聯(lián)模型的篇章情感傾向分析[J]. 李本陽,關(guān)毅,董喜雙,李生. 中文信息學(xué)報(bào). 2012(04)
[6]基于機(jī)器學(xué)習(xí)的中文微博情感分類實(shí)證研究[J]. 劉志明,劉魯. 計(jì)算機(jī)工程與應(yīng)用. 2012(01)
[7]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學(xué)報(bào). 2010(08)
[8]互聯(lián)網(wǎng)商品評(píng)論情感分析研究綜述[J]. 張紫瓊,葉強(qiáng),李一軍. 管理科學(xué)學(xué)報(bào). 2010(06)
[9]中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J]. 柳位平,朱艷輝,栗春亮,向華政,文志強(qiáng). 計(jì)算機(jī)應(yīng)用. 2009(10)
[10]中文分詞算法研究綜述[J]. 張啟宇,朱玲,張雅萍. 情報(bào)探索. 2008(11)
博士論文
[1]基于機(jī)器學(xué)習(xí)的文本情感分類研究[D]. 張慶慶.西北工業(yè)大學(xué) 2016
[2]中文詞法句法語義聯(lián)合分析模型研究[D]. 張梅山.哈爾濱工業(yè)大學(xué) 2014
[3]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學(xué) 2013
碩士論文
[1]基于詞典和機(jī)器學(xué)習(xí)組合的情感分析[D]. 丁蔚.西安郵電大學(xué) 2017
[2]基于文本挖掘的電商用戶評(píng)論分析與系統(tǒng)實(shí)現(xiàn)[D]. 易劍波.東南大學(xué) 2017
[3]社交媒體文本情感分析[D]. 姜杰.南京理工大學(xué) 2017
[4]基于酒店中文評(píng)論情感傾向分析[D]. 李長江.華南理工大學(xué) 2016
[5]基于電商網(wǎng)站商品評(píng)論數(shù)據(jù)的用戶情感分析[D]. 崔志剛.北京交通大學(xué) 2014
[6]基于情感詞典的中文微博情感傾向分析研究[D]. 陳曉東.華中科技大學(xué) 2012
本文編號(hào):3550594
【文章來源】:江蘇科技大學(xué)江蘇省
【文章頁數(shù)】:72 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀和發(fā)展趨勢
1.2.1 基于情感詞典的情感分析
1.2.2 基于機(jī)器學(xué)習(xí)的情感分析
1.3 本文主要研究內(nèi)容
1.4 本文章節(jié)結(jié)構(gòu)
1.5 本章小結(jié)
第2章 情感分析相關(guān)理論
2.1 情感分析基本含義
2.2 情感分析的分類及流程
2.2.1 情感分析的分類
2.2.2 情感分析的流程
2.3 文本預(yù)處理
2.3.1 中文分詞
2.3.2 停用詞
2.3.3 詞性標(biāo)注
2.4 文本特征選擇
2.4.1 信息增益
2.4.2 互信息
2.4.3 文檔頻率
2.4.4 期望交叉熵
2.4.5 卡方統(tǒng)計(jì)
2.5 文本表示
2.5.1 布爾模型
2.5.2 概率模型
2.5.3 向量空間模型
2.6 分類評(píng)測標(biāo)準(zhǔn)
2.6.1 評(píng)測指標(biāo)
2.6.2 評(píng)測平臺(tái)
2.7 本章小結(jié)
第3章 情感詞典的構(gòu)造及情感值計(jì)算
3.1 基礎(chǔ)情感詞典
3.2 修飾詞詞典
3.2.1 程度副詞詞典
3.2.2 否定詞詞典
3.3 基于SO-PMI算法的情感詞典擴(kuò)充
3.4 基于酒店評(píng)論的情感詞典構(gòu)建
3.5 基于情感詞典計(jì)算情感值
3.6 實(shí)驗(yàn)及結(jié)果分析
3.7 本章小結(jié)
第4章 基于TFIDF情感權(quán)值的詞向量表示
4.1 常見特征權(quán)值計(jì)算方法
4.1.1 布爾權(quán)值
4.1.2 熵權(quán)值
4.1.3 TFIDF權(quán)值
4.2 詞向量表示
4.3 改進(jìn)TFIDF算法
4.4 基于改進(jìn)TFIDF的詞向量表示
4.5 本章小結(jié)
第5章 基于酒店評(píng)論數(shù)據(jù)的情感分析
5.1 分類算法介紹
5.1.1 樸素貝葉斯
5.1.2 支持向量機(jī)
5.2 實(shí)驗(yàn)設(shè)置及結(jié)果分析
5.2.1 實(shí)驗(yàn)數(shù)據(jù)集
5.2.2 實(shí)驗(yàn)環(huán)境
5.2.3 實(shí)驗(yàn)流程
5.2.4 數(shù)據(jù)預(yù)處理
5.2.5 基于情感詞典構(gòu)建訓(xùn)練集
5.2.6 詞向量訓(xùn)練和表示
5.2.7 實(shí)驗(yàn)及結(jié)果分析
5.3 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
致謝
大摘要
【參考文獻(xiàn)】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)參數(shù)優(yōu)化的中文情感分析[J]. 王盛玉,曾碧卿,胡翩翩. 計(jì)算機(jī)工程. 2017(08)
[2]基于卷積神經(jīng)網(wǎng)絡(luò)和注意力模型的文本情感分析[J]. 馮興杰,張志偉,史金釧. 計(jì)算機(jī)應(yīng)用研究. 2018(05)
[3]文本情感分析綜述[J]. 楊立公,朱儉,湯世平. 計(jì)算機(jī)應(yīng)用. 2013(06)
[4]一種基于樸素貝葉斯的微博情感分類[J]. 林江豪,陽愛民,周詠梅,陳錦,蔡澤鍵. 計(jì)算機(jī)工程與科學(xué). 2012(09)
[5]基于單層標(biāo)注級(jí)聯(lián)模型的篇章情感傾向分析[J]. 李本陽,關(guān)毅,董喜雙,李生. 中文信息學(xué)報(bào). 2012(04)
[6]基于機(jī)器學(xué)習(xí)的中文微博情感分類實(shí)證研究[J]. 劉志明,劉魯. 計(jì)算機(jī)工程與應(yīng)用. 2012(01)
[7]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學(xué)報(bào). 2010(08)
[8]互聯(lián)網(wǎng)商品評(píng)論情感分析研究綜述[J]. 張紫瓊,葉強(qiáng),李一軍. 管理科學(xué)學(xué)報(bào). 2010(06)
[9]中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J]. 柳位平,朱艷輝,栗春亮,向華政,文志強(qiáng). 計(jì)算機(jī)應(yīng)用. 2009(10)
[10]中文分詞算法研究綜述[J]. 張啟宇,朱玲,張雅萍. 情報(bào)探索. 2008(11)
博士論文
[1]基于機(jī)器學(xué)習(xí)的文本情感分類研究[D]. 張慶慶.西北工業(yè)大學(xué) 2016
[2]中文詞法句法語義聯(lián)合分析模型研究[D]. 張梅山.哈爾濱工業(yè)大學(xué) 2014
[3]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學(xué) 2013
碩士論文
[1]基于詞典和機(jī)器學(xué)習(xí)組合的情感分析[D]. 丁蔚.西安郵電大學(xué) 2017
[2]基于文本挖掘的電商用戶評(píng)論分析與系統(tǒng)實(shí)現(xiàn)[D]. 易劍波.東南大學(xué) 2017
[3]社交媒體文本情感分析[D]. 姜杰.南京理工大學(xué) 2017
[4]基于酒店中文評(píng)論情感傾向分析[D]. 李長江.華南理工大學(xué) 2016
[5]基于電商網(wǎng)站商品評(píng)論數(shù)據(jù)的用戶情感分析[D]. 崔志剛.北京交通大學(xué) 2014
[6]基于情感詞典的中文微博情感傾向分析研究[D]. 陳曉東.華中科技大學(xué) 2012
本文編號(hào):3550594
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3550594.html
最近更新
教材專著