基于詞典和機器學習的酒店評論情感分析
發(fā)布時間:2021-12-24 13:47
隨著電子商務與社交網(wǎng)絡的快速發(fā)展,互聯(lián)網(wǎng)平臺中每日產(chǎn)生海量的個人言論和商品服務的評論。這些評論包含人們的各種情感并且蘊含巨大的商業(yè)價值。由于數(shù)據(jù)來源廣泛,數(shù)量巨大,每時每刻都在增長變化,若通過人工方式來挖掘這些龐大的信息,不僅耗時耗力而且成效甚微,所以需要通過情感分析技術對海量的文本數(shù)據(jù)進行處理與分析。情感分析是自然語言處理領域的一個重要研究方向,具有重要的研究價值和實際的應用價值。本文主要對酒店領域的用戶評論進行情感分析,從中挖掘用戶對酒店服務等方面的態(tài)度,為酒店提高服務質(zhì)量提供一定的幫助。本文主要工作如下:(1)以通用的中文情感詞典為基礎并將酒店評論數(shù)據(jù)作為擴充詞典的語料,構造適用于酒店評論的情感詞典。使用通用的詞典與本文構造的情感詞典對同一語料進行情感分類,并比較分類結果。實驗結果表明:在正向與負向分類中,本文構造的詞典在準確率上分別是76.5%及80.4%,優(yōu)于通用詞典的分類效果。(2)由于詞向量表示方法未能考慮文本中詞語的重要程度,因此本文將特征權值與詞向量相結合,提出加權詞向量,將普通詞向量與加權詞向量分別作為文本表示的方法,并利用支持向量機進行分類實驗。實驗結果表明:使用...
【文章來源】:江蘇科技大學江蘇省
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀和發(fā)展趨勢
1.2.1 基于情感詞典的情感分析
1.2.2 基于機器學習的情感分析
1.3 本文主要研究內(nèi)容
1.4 本文章節(jié)結構
1.5 本章小結
第2章 情感分析相關理論
2.1 情感分析基本含義
2.2 情感分析的分類及流程
2.2.1 情感分析的分類
2.2.2 情感分析的流程
2.3 文本預處理
2.3.1 中文分詞
2.3.2 停用詞
2.3.3 詞性標注
2.4 文本特征選擇
2.4.1 信息增益
2.4.2 互信息
2.4.3 文檔頻率
2.4.4 期望交叉熵
2.4.5 卡方統(tǒng)計
2.5 文本表示
2.5.1 布爾模型
2.5.2 概率模型
2.5.3 向量空間模型
2.6 分類評測標準
2.6.1 評測指標
2.6.2 評測平臺
2.7 本章小結
第3章 情感詞典的構造及情感值計算
3.1 基礎情感詞典
3.2 修飾詞詞典
3.2.1 程度副詞詞典
3.2.2 否定詞詞典
3.3 基于SO-PMI算法的情感詞典擴充
3.4 基于酒店評論的情感詞典構建
3.5 基于情感詞典計算情感值
3.6 實驗及結果分析
3.7 本章小結
第4章 基于TFIDF情感權值的詞向量表示
4.1 常見特征權值計算方法
4.1.1 布爾權值
4.1.2 熵權值
4.1.3 TFIDF權值
4.2 詞向量表示
4.3 改進TFIDF算法
4.4 基于改進TFIDF的詞向量表示
4.5 本章小結
第5章 基于酒店評論數(shù)據(jù)的情感分析
5.1 分類算法介紹
5.1.1 樸素貝葉斯
5.1.2 支持向量機
5.2 實驗設置及結果分析
5.2.1 實驗數(shù)據(jù)集
5.2.2 實驗環(huán)境
5.2.3 實驗流程
5.2.4 數(shù)據(jù)預處理
5.2.5 基于情感詞典構建訓練集
5.2.6 詞向量訓練和表示
5.2.7 實驗及結果分析
5.3 本章小結
總結與展望
參考文獻
攻讀學位期間發(fā)表的學術論文
致謝
大摘要
【參考文獻】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡參數(shù)優(yōu)化的中文情感分析[J]. 王盛玉,曾碧卿,胡翩翩. 計算機工程. 2017(08)
[2]基于卷積神經(jīng)網(wǎng)絡和注意力模型的文本情感分析[J]. 馮興杰,張志偉,史金釧. 計算機應用研究. 2018(05)
[3]文本情感分析綜述[J]. 楊立公,朱儉,湯世平. 計算機應用. 2013(06)
[4]一種基于樸素貝葉斯的微博情感分類[J]. 林江豪,陽愛民,周詠梅,陳錦,蔡澤鍵. 計算機工程與科學. 2012(09)
[5]基于單層標注級聯(lián)模型的篇章情感傾向分析[J]. 李本陽,關毅,董喜雙,李生. 中文信息學報. 2012(04)
[6]基于機器學習的中文微博情感分類實證研究[J]. 劉志明,劉魯. 計算機工程與應用. 2012(01)
[7]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學報. 2010(08)
[8]互聯(lián)網(wǎng)商品評論情感分析研究綜述[J]. 張紫瓊,葉強,李一軍. 管理科學學報. 2010(06)
[9]中文基礎情感詞詞典構建方法研究[J]. 柳位平,朱艷輝,栗春亮,向華政,文志強. 計算機應用. 2009(10)
[10]中文分詞算法研究綜述[J]. 張啟宇,朱玲,張雅萍. 情報探索. 2008(11)
博士論文
[1]基于機器學習的文本情感分類研究[D]. 張慶慶.西北工業(yè)大學 2016
[2]中文詞法句法語義聯(lián)合分析模型研究[D]. 張梅山.哈爾濱工業(yè)大學 2014
[3]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學 2013
碩士論文
[1]基于詞典和機器學習組合的情感分析[D]. 丁蔚.西安郵電大學 2017
[2]基于文本挖掘的電商用戶評論分析與系統(tǒng)實現(xiàn)[D]. 易劍波.東南大學 2017
[3]社交媒體文本情感分析[D]. 姜杰.南京理工大學 2017
[4]基于酒店中文評論情感傾向分析[D]. 李長江.華南理工大學 2016
[5]基于電商網(wǎng)站商品評論數(shù)據(jù)的用戶情感分析[D]. 崔志剛.北京交通大學 2014
[6]基于情感詞典的中文微博情感傾向分析研究[D]. 陳曉東.華中科技大學 2012
本文編號:3550594
【文章來源】:江蘇科技大學江蘇省
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀和發(fā)展趨勢
1.2.1 基于情感詞典的情感分析
1.2.2 基于機器學習的情感分析
1.3 本文主要研究內(nèi)容
1.4 本文章節(jié)結構
1.5 本章小結
第2章 情感分析相關理論
2.1 情感分析基本含義
2.2 情感分析的分類及流程
2.2.1 情感分析的分類
2.2.2 情感分析的流程
2.3 文本預處理
2.3.1 中文分詞
2.3.2 停用詞
2.3.3 詞性標注
2.4 文本特征選擇
2.4.1 信息增益
2.4.2 互信息
2.4.3 文檔頻率
2.4.4 期望交叉熵
2.4.5 卡方統(tǒng)計
2.5 文本表示
2.5.1 布爾模型
2.5.2 概率模型
2.5.3 向量空間模型
2.6 分類評測標準
2.6.1 評測指標
2.6.2 評測平臺
2.7 本章小結
第3章 情感詞典的構造及情感值計算
3.1 基礎情感詞典
3.2 修飾詞詞典
3.2.1 程度副詞詞典
3.2.2 否定詞詞典
3.3 基于SO-PMI算法的情感詞典擴充
3.4 基于酒店評論的情感詞典構建
3.5 基于情感詞典計算情感值
3.6 實驗及結果分析
3.7 本章小結
第4章 基于TFIDF情感權值的詞向量表示
4.1 常見特征權值計算方法
4.1.1 布爾權值
4.1.2 熵權值
4.1.3 TFIDF權值
4.2 詞向量表示
4.3 改進TFIDF算法
4.4 基于改進TFIDF的詞向量表示
4.5 本章小結
第5章 基于酒店評論數(shù)據(jù)的情感分析
5.1 分類算法介紹
5.1.1 樸素貝葉斯
5.1.2 支持向量機
5.2 實驗設置及結果分析
5.2.1 實驗數(shù)據(jù)集
5.2.2 實驗環(huán)境
5.2.3 實驗流程
5.2.4 數(shù)據(jù)預處理
5.2.5 基于情感詞典構建訓練集
5.2.6 詞向量訓練和表示
5.2.7 實驗及結果分析
5.3 本章小結
總結與展望
參考文獻
攻讀學位期間發(fā)表的學術論文
致謝
大摘要
【參考文獻】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡參數(shù)優(yōu)化的中文情感分析[J]. 王盛玉,曾碧卿,胡翩翩. 計算機工程. 2017(08)
[2]基于卷積神經(jīng)網(wǎng)絡和注意力模型的文本情感分析[J]. 馮興杰,張志偉,史金釧. 計算機應用研究. 2018(05)
[3]文本情感分析綜述[J]. 楊立公,朱儉,湯世平. 計算機應用. 2013(06)
[4]一種基于樸素貝葉斯的微博情感分類[J]. 林江豪,陽愛民,周詠梅,陳錦,蔡澤鍵. 計算機工程與科學. 2012(09)
[5]基于單層標注級聯(lián)模型的篇章情感傾向分析[J]. 李本陽,關毅,董喜雙,李生. 中文信息學報. 2012(04)
[6]基于機器學習的中文微博情感分類實證研究[J]. 劉志明,劉魯. 計算機工程與應用. 2012(01)
[7]文本情感分析[J]. 趙妍妍,秦兵,劉挺. 軟件學報. 2010(08)
[8]互聯(lián)網(wǎng)商品評論情感分析研究綜述[J]. 張紫瓊,葉強,李一軍. 管理科學學報. 2010(06)
[9]中文基礎情感詞詞典構建方法研究[J]. 柳位平,朱艷輝,栗春亮,向華政,文志強. 計算機應用. 2009(10)
[10]中文分詞算法研究綜述[J]. 張啟宇,朱玲,張雅萍. 情報探索. 2008(11)
博士論文
[1]基于機器學習的文本情感分類研究[D]. 張慶慶.西北工業(yè)大學 2016
[2]中文詞法句法語義聯(lián)合分析模型研究[D]. 張梅山.哈爾濱工業(yè)大學 2014
[3]文本分類中文本表示模型和特征選擇算法研究[D]. 楊杰明.吉林大學 2013
碩士論文
[1]基于詞典和機器學習組合的情感分析[D]. 丁蔚.西安郵電大學 2017
[2]基于文本挖掘的電商用戶評論分析與系統(tǒng)實現(xiàn)[D]. 易劍波.東南大學 2017
[3]社交媒體文本情感分析[D]. 姜杰.南京理工大學 2017
[4]基于酒店中文評論情感傾向分析[D]. 李長江.華南理工大學 2016
[5]基于電商網(wǎng)站商品評論數(shù)據(jù)的用戶情感分析[D]. 崔志剛.北京交通大學 2014
[6]基于情感詞典的中文微博情感傾向分析研究[D]. 陳曉東.華中科技大學 2012
本文編號:3550594
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3550594.html
最近更新
教材專著