細粒度中文網(wǎng)絡(luò)消費評論情感極性分類方法研究
本文關(guān)鍵詞:細粒度中文網(wǎng)絡(luò)消費評論情感極性分類方法研究
更多相關(guān)文章: 細粒度 情感詞 屬性詞 LDA主題模型 情感極性分類
【摘要】:近年來,隨著電子商務(wù)和各種類型互聯(lián)網(wǎng)互動社區(qū)的同步快速發(fā)展,網(wǎng)絡(luò)消費評論信息,形成了具有重要商業(yè)價值的大數(shù)據(jù)集。網(wǎng)絡(luò)商品評論的情感分析技術(shù)能夠從主觀性文本中識別、抽取相關(guān)的傾向性信息,通過特定算法以量化形式描述出文本所表達的主觀意見,借此推測出評論者對所購買商品或服務(wù)的喜好程度,能夠影響消費者的決策行為,對于改進商品特性、精準推送商品信息也具有重要的指導(dǎo)意義。為使情感分析的效用更加精準的作用于某一屬性之上,以最大發(fā)揮消費評論的商業(yè)價值,本文開展網(wǎng)絡(luò)消費評論分析中情感詞與屬性詞的自動提取算法,以及基于情感詞與屬性詞分析的細粒度網(wǎng)絡(luò)消費評論情感極性分類方法研究。本文首先利用網(wǎng)絡(luò)爬蟲技術(shù)抓取了網(wǎng)絡(luò)餐飲消費評論作為語料庫,借助機器學習、自然語言處理等領(lǐng)域的理論知識,結(jié)合中文網(wǎng)絡(luò)評價語言表達方式的特點,提出一種基于語料的領(lǐng)域情感詞庫自動構(gòu)建方法;結(jié)合了餐飲評論中情感詞與屬性詞之間的特征分析,提出基于名詞+LDA(Latent Dirichlet Allocation)和基于字詞間距+LDA+情感詞庫兩種屬性詞搜尋策略,并對方法和策略的有效性進行了實驗驗證和實驗結(jié)果分析;構(gòu)建情感評價單元,根據(jù)情感評價單元進行情感計算,依據(jù)計算得分實現(xiàn)細粒度的文本情感分析,將細粒度情感分析結(jié)果以圖形化層次結(jié)構(gòu)進行了輸入顯不。通過本文的研究能夠進一步提高用戶評論情感分析的精確性,并使其在產(chǎn)品或服務(wù)改進、消費決策過程中發(fā)揮更大的指導(dǎo)作用。
【關(guān)鍵詞】:細粒度 情感詞 屬性詞 LDA主題模型 情感極性分類
【學位授予單位】:大連海事大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第1章 緒論10-23
- 1.1 論文的研究背景及意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-21
- 1.2.1 文本分類技術(shù)研究11-15
- 1.2.2 情感分類技術(shù)研究15-21
- 1.2.3 存在的問題和挑戰(zhàn)21
- 1.3 論文的主要研究內(nèi)容與章節(jié)安排21-23
- 1.3.1 論文主要研究內(nèi)容21-22
- 1.3.2 論文的組織結(jié)構(gòu)22-23
- 第2章 相關(guān)知識介紹與研究方案設(shè)計23-29
- 2.1 中文自然語言處理相關(guān)知識23-25
- 2.1.1 中文分詞23-24
- 2.1.2 中文詞性標注24-25
- 2.1.3 中文分詞系統(tǒng)25
- 2.2 情感詞與屬性詞的搭配抽取25-27
- 2.2.1 情感詞與屬性詞25-26
- 2.2.2 情感詞與屬性詞的搭配抽取26-27
- 2.3 研究方案設(shè)計27-28
- 2.3.1 總體研究過程框架27
- 2.3.2 研究方案設(shè)計說明27-28
- 2.4 本章小結(jié)28-29
- 第3章 基于語料的領(lǐng)域情感詞庫構(gòu)建方法29-40
- 3.1 領(lǐng)域情感詞庫構(gòu)建總體過程框架29-30
- 3.2 領(lǐng)域情感詞庫結(jié)構(gòu)設(shè)計30-31
- 3.3 語料選取與預(yù)處理31-33
- 3.3.1 語料選取31-32
- 3.3.2 語料預(yù)處理32-33
- 3.4 領(lǐng)域基準情感詞集構(gòu)建33-38
- 3.4.1 基于公共詞典庫的領(lǐng)域基礎(chǔ)標準情感詞集構(gòu)建34-35
- 3.4.2 基于詞性特征的語料庫種子情感詞提取35-37
- 3.4.3 基于點互信息(PMI)的語料庫情感詞自動擴充37-38
- 3.5 實驗與分析38-39
- 3.5.1 實驗結(jié)果38-39
- 3.5.2 結(jié)果分析39
- 3.6 本章小結(jié)39-40
- 第4章 基于LDA主題模型的屬性詞提取方法40-50
- 4.1 方法概述40-42
- 4.1.1 LDA主題模型簡介40-41
- 4.1.2 基于LDA主題模型的屬性詞提取策略41-42
- 4.2 實驗方案設(shè)計42-47
- 4.2.1 實驗流程設(shè)計42-43
- 4.2.2 領(lǐng)域語料庫基準屬性詞集構(gòu)建43-44
- 4.2.3 準屬性詞集篩選44-47
- 4.3 實驗結(jié)果分析47-49
- 4.4 本章小結(jié)49-50
- 第5章 面向評價屬性的細粒度文本情感分析實現(xiàn)50-58
- 5.1 方法概述50-51
- 5.2 情感評價單元構(gòu)建51-55
- 5.2.1 情感評價單元定義51
- 5.2.2 斷句處理算法51-53
- 5.2.3 程度副詞、否定詞提取53-55
- 5.3 情感聚合與情感傾向分類計算55
- 5.4 實驗結(jié)果可視化表示55-57
- 5.5 本章小結(jié)57-58
- 第6章 總結(jié)與展望58-60
- 6.1 總結(jié)58
- 6.2 展望58-60
- 參考文獻60-67
- 致謝67-68
- 作者簡介68
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 許璐蕾;;網(wǎng)絡(luò)評論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期
2 肖健;徐建;朱姝;萬纓;許亮;;基于翻譯和語義方法的情感詞挖掘研究[J];計算機工程與應(yīng)用;2011年32期
3 趙鵬;趙志偉;卓景文;;一種情感詞語義加權(quán)的句子傾向性識別方法[J];計算機工程與應(yīng)用;2011年35期
4 代大明;李壽山;李培峰;朱巧明;;基于情緒詞與情感詞協(xié)作學習的情感分類方法研究[J];計算機科學;2012年12期
5 李勇敢;周學廣;孫艷;張煥國;;結(jié)合依存關(guān)聯(lián)分析和規(guī)則統(tǒng)計分析的情感詞庫構(gòu)建方法[J];武漢大學學報(理學版);2013年05期
6 彭慶喜;錢鐵云;;基于量化情感的網(wǎng)店垃圾評論檢測[J];山東大學學報(理學版);2013年11期
7 杜嘉忠;徐健;劉穎;;網(wǎng)絡(luò)商品評論的特征 情感詞本體構(gòu)建與情感分析方法研究[J];現(xiàn)代圖書情報技術(shù);2014年05期
8 張清亮;徐健;;網(wǎng)絡(luò)情感詞自動識別方法研究[J];現(xiàn)代圖書情報技術(shù);2011年10期
9 黃俊;田生偉;禹龍;馮冠軍;;基于維吾爾語情感詞的句子情感分析[J];計算機工程;2012年09期
10 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計算機工程;2013年12期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 陳奇哲;劉全升;姚天f ;;漢語意見型語句主題與情感關(guān)系抽取的研究[A];第五屆全國信息檢索學術(shù)會議論文集[C];2009年
2 孫慧;關(guān)毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國信息檢索學術(shù)會議論文集[C];2010年
3 段秀婷;何婷婷;宋樂;;基于PMI-IR算法的Blog情感分類研究[A];第五屆全國青年計算語言學研討會論文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標簽圖像自動標注算法[A];第六屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2010)、第19屆全國多媒體學術(shù)會議(NCMT2010)、第6屆全國人機交互學術(shù)會議(CHCI2010)、第5屆全國普適計算學術(shù)會議(PCC2010)論文集[C];2010年
5 王樅;涂序彥;劉嘉;;注意-情緒協(xié)調(diào)的個性化信息推薦模型[A];2006年首屆ICT大會信息、知識、智能及其轉(zhuǎn)換理論第一次高峰論壇會議論文集[C];2006年
中國博士學位論文全文數(shù)據(jù)庫 前8條
1 劉全超;面向中文微博的觀點挖掘與傾向性分析研究[D];北京理工大學;2015年
2 董喜雙;基于免疫多詞主體自治學習的情感分析研究[D];哈爾濱工業(yè)大學;2013年
3 寇廣增;基于意見挖掘通用框架的情感極性強度模糊性研究[D];武漢大學;2010年
4 楊玉珍;基于Web評論信息的傾向性分析關(guān)鍵技術(shù)研究[D];山東師范大學;2014年
5 黃勝;Web評論文本的細粒度意見挖掘技術(shù)研究[D];北京理工大學;2014年
6 施寒瀟;細粒度情感分析研究[D];蘇州大學;2013年
7 李榮軍;中文商品評論傾向性分析研究[D];北京郵電大學;2011年
8 李芳;面向中文Web評論的觀點挖掘關(guān)鍵技術(shù)研究[D];華中師范大學;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 孫博;關(guān)于情感詞的意義用法[D];遼寧大學;2012年
2 王銀;中文微博情感分析方法研究[D];廣東技術(shù)師范學院;2015年
3 崔連超;互聯(lián)網(wǎng)評論文本情感分析研究[D];山東大學;2015年
4 杜雪峰;藏文句子傾向性分析研究[D];中央民族大學;2015年
5 孫建超;微博輿情挖掘技術(shù)的研究與應(yīng)用[D];電子科技大學;2015年
6 張圣聲;基于微博平臺的產(chǎn)品評論情感分類研究[D];廣東外語外貿(mào)大學;2015年
7 何天翔;基于情感詞網(wǎng)的短文本情感分類方法研究[D];西南科技大學;2015年
8 丁星;基于文本傾向性分析技術(shù)的微博監(jiān)控系統(tǒng)[D];江蘇科技大學;2015年
9 李茜;博客意見檢索關(guān)鍵問題研究[D];北京理工大學;2015年
10 李瑞靜;漢語情感詞模糊語義的量化分析及應(yīng)用研究[D];北京理工大學;2015年
,本文編號:931141
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/931141.html