面向電子商務的評論文本情感分析研究
發(fā)布時間:2017-09-20 19:26
本文關鍵詞:面向電子商務的評論文本情感分析研究
更多相關文章: 情感分析 評論文本 情感詞典 隱含語義索引 序列回歸
【摘要】:評論文本情感分析一般是指通過基于語義或者機器學習的方法對評論文本挖掘和分析并從中獲取能夠表達消費者評論態(tài)度的一些主觀信息,如立場、建議、情緒等,在完成這些工作的之后對評論文本的情感傾向進行計算,并給出判斷。近年來隨著電子商務的發(fā)展,面向電子商務的評論文本情感分析研究已經(jīng)成為了當前相關領域的重點研究課題。通過對相關商品的評論文本進行情感分析可以使買賣雙方準確了解商品的優(yōu)缺點及消費者對商品的評論。從而為賣方改進商品、制定合適的銷售策略以及為買方根據(jù)自己的需求購買合適的商品提供有效依據(jù)。然而,由于傳統(tǒng)的評論文本情感分析方法大都僅采用統(tǒng)計評論中褒、貶義詞數(shù)量并對其進行分析得出評論判斷結(jié)果,難以準確獲取對評論的真實情感。論文針對傳統(tǒng)評論文本情感分析方法存在的缺點,采用基于語義和機器學習的方法對評論文本情感分析問題進行研究驗證論文中的方法可以提高情感分析準確率。具體工作如下: 1.采用情感詞典對評論文本進行特征提取,并構(gòu)建分類模型進行評論文本情感分析。論文針對筆記本電腦領域評論文本的特點,綜合考慮修飾詞和評價搭配關系構(gòu)建情感詞典,并給出情感詞典各要素詞典的情感強度標注處理方法。論文構(gòu)建的情感詞典主要的主要元素包括評價要素、情感詞/評價詞、否定詞、程度副詞、轉(zhuǎn)折詞以及評價搭配關系,在處理完這些主要元素的情感傾向強度標注之后對評論文本的情感傾向進行計算,并通過實驗證明修飾詞典以及評價搭配詞典對情感分類的有效性。 2.采用隱含語義索引方法對評論文本進行特征變換,并構(gòu)建分類模型進行評論文本情感分析。論文針對電子商務中分級打分問題的實際需求,采用隱含語義索引方法對評論文本進行文本模型表示并實現(xiàn)詞-文檔矩陣的維數(shù)約減,在此基礎上利用核判別學習序列回歸方法對訓練樣本集進行訓練,獲得的序列回歸模型可以實現(xiàn)對評論文本的情感分級,并通過與VSM特征變換下的情感分析方法進行對比實驗證明了基于隱含語義索引的評論文本情感序列回歸方法對情感分析的有效性。
【關鍵詞】:情感分析 評論文本 情感詞典 隱含語義索引 序列回歸
【學位授予單位】:中國科學技術(shù)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.1
【目錄】:
- 摘要5-6
- ABSTRACT6-8
- 目錄8-11
- 第1章 緒論11-17
- 1.1 研究背景及研究意義11-12
- 1.2 文本情感分析研究綜述12-15
- 1.2.1 情感分析相關知識介紹13
- 1.2.2 國內(nèi)外研究現(xiàn)狀13-15
- 1.2.2.1 國外研究現(xiàn)狀14
- 1.2.2.2 國內(nèi)研究現(xiàn)狀14-15
- 1.3 論文主要工作15
- 1.4 論文組織結(jié)構(gòu)15-17
- 第2章 文本情感分析基本原理17-33
- 2.1 基于機器學習的方法17-28
- 2.1.1 語料庫選擇18-19
- 2.1.2 文本預處理19-20
- 2.1.3 文本表示模型20-21
- 2.1.4 特征提取21-22
- 2.1.5 特征選擇22-25
- 2.1.6 文本分類機器學習算法25-28
- 2.2 基于語義的方法28-32
- 2.2.1 情感詞典綜述29-31
- 2.2.1.1 情感詞典相關知識29-30
- 2.2.1.2 常見中文情感詞庫30-31
- 2.2.2 情感詞典擴展31-32
- 2.3 本章小結(jié)32-33
- 第3章 基于情感詞典的評論文本情感分類研究33-45
- 3.1 情感詞典構(gòu)建33-37
- 3.1.1 評價要素選取33-34
- 3.1.2 情感詞處理34-35
- 3.1.3 否定詞處理35
- 3.1.4 程度副詞處理35-36
- 3.1.5 轉(zhuǎn)折詞處理36
- 3.1.6 評價搭配詞典構(gòu)建36-37
- 3.2 情感傾向計算37-40
- 3.2.1 評價單元識別38-39
- 3.2.2 總結(jié)詞識別39-40
- 3.2.3 情感傾向計算40
- 3.3 實驗設計與結(jié)果分析40-43
- 3.3.1 實驗語料選取41
- 3.3.2 實驗評價指標41-42
- 3.3.3 實驗設計42-43
- 3.3.4 實驗結(jié)果與分析43
- 3.4 本章小結(jié)43-45
- 第4章 基于隱含語義索引的文本情感序列回歸方法45-51
- 4.1 序列回歸方法提出背景45
- 4.2 評論文本表示方法45-47
- 4.3 評論文本序列回歸方法47
- 4.4 實驗設計與結(jié)果分析47-49
- 4.4.1 實驗語料選取48
- 4.4.2 實驗設計48
- 4.4.3 實驗結(jié)果與分析48-49
- 4.5 本章小結(jié)49-51
- 第5章 總結(jié)與展望51-53
- 5.1 研究工作總結(jié)51
- 5.2 未來工作展望51-53
- 參考文獻53-57
- 致謝57-59
- 在讀期間發(fā)表的學術(shù)論文與取得的其他研究成果59
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 廖祥文;曹冬林;方濱興;許洪波;程學旗;;基于概率推理模型的博客傾向性檢索研究[J];計算機研究與發(fā)展;2009年09期
2 劉志明;劉魯;;基于機器學習的中文微博情感分類實證研究[J];計算機工程與應用;2012年01期
3 潘宇;林鴻飛;;基于語義極性分析的餐館評論挖掘[J];計算機工程;2008年17期
4 呂林濤;董迎;;基于上下文的概念語義相似度計算模型[J];計算機工程;2010年21期
5 代六玲,黃河燕,陳肇雄;中文文本分類中特征抽取方法的比較研究[J];中文信息學報;2004年01期
6 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學報;2006年01期
7 唐慧豐;譚松波;程學旗;;基于監(jiān)督學習的中文情感分類技術(shù)比較研究[J];中文信息學報;2007年06期
8 徐軍;丁宇新;王曉龍;;使用機器學習方法進行新聞的情感自動分類[J];中文信息學報;2007年06期
9 劉康;趙軍;;基于層疊CRFs模型的句子褒貶度分析研究[J];中文信息學報;2008年01期
10 江敏;肖詩斌;王弘蔚;施水才;;一種改進的基于《知網(wǎng)》的詞語語義相似度計算[J];中文信息學報;2008年05期
,本文編號:889971
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/889971.html
最近更新
教材專著