細(xì)粒度中文網(wǎng)絡(luò)消費(fèi)評(píng)論情感極性分類方法研究
本文關(guān)鍵詞:細(xì)粒度中文網(wǎng)絡(luò)消費(fèi)評(píng)論情感極性分類方法研究
更多相關(guān)文章: 細(xì)粒度 情感詞 屬性詞 LDA主題模型 情感極性分類
【摘要】:近年來,隨著電子商務(wù)和各種類型互聯(lián)網(wǎng)互動(dòng)社區(qū)的同步快速發(fā)展,網(wǎng)絡(luò)消費(fèi)評(píng)論信息,形成了具有重要商業(yè)價(jià)值的大數(shù)據(jù)集。網(wǎng)絡(luò)商品評(píng)論的情感分析技術(shù)能夠從主觀性文本中識(shí)別、抽取相關(guān)的傾向性信息,通過特定算法以量化形式描述出文本所表達(dá)的主觀意見,借此推測(cè)出評(píng)論者對(duì)所購買商品或服務(wù)的喜好程度,能夠影響消費(fèi)者的決策行為,對(duì)于改進(jìn)商品特性、精準(zhǔn)推送商品信息也具有重要的指導(dǎo)意義。為使情感分析的效用更加精準(zhǔn)的作用于某一屬性之上,以最大發(fā)揮消費(fèi)評(píng)論的商業(yè)價(jià)值,本文開展網(wǎng)絡(luò)消費(fèi)評(píng)論分析中情感詞與屬性詞的自動(dòng)提取算法,以及基于情感詞與屬性詞分析的細(xì)粒度網(wǎng)絡(luò)消費(fèi)評(píng)論情感極性分類方法研究。本文首先利用網(wǎng)絡(luò)爬蟲技術(shù)抓取了網(wǎng)絡(luò)餐飲消費(fèi)評(píng)論作為語料庫,借助機(jī)器學(xué)習(xí)、自然語言處理等領(lǐng)域的理論知識(shí),結(jié)合中文網(wǎng)絡(luò)評(píng)價(jià)語言表達(dá)方式的特點(diǎn),提出一種基于語料的領(lǐng)域情感詞庫自動(dòng)構(gòu)建方法;結(jié)合了餐飲評(píng)論中情感詞與屬性詞之間的特征分析,提出基于名詞+LDA(Latent Dirichlet Allocation)和基于字詞間距+LDA+情感詞庫兩種屬性詞搜尋策略,并對(duì)方法和策略的有效性進(jìn)行了實(shí)驗(yàn)驗(yàn)證和實(shí)驗(yàn)結(jié)果分析;構(gòu)建情感評(píng)價(jià)單元,根據(jù)情感評(píng)價(jià)單元進(jìn)行情感計(jì)算,依據(jù)計(jì)算得分實(shí)現(xiàn)細(xì)粒度的文本情感分析,將細(xì)粒度情感分析結(jié)果以圖形化層次結(jié)構(gòu)進(jìn)行了輸入顯不。通過本文的研究能夠進(jìn)一步提高用戶評(píng)論情感分析的精確性,并使其在產(chǎn)品或服務(wù)改進(jìn)、消費(fèi)決策過程中發(fā)揮更大的指導(dǎo)作用。
【關(guān)鍵詞】:細(xì)粒度 情感詞 屬性詞 LDA主題模型 情感極性分類
【學(xué)位授予單位】:大連海事大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第1章 緒論10-23
- 1.1 論文的研究背景及意義10-11
- 1.2 國內(nèi)外研究現(xiàn)狀11-21
- 1.2.1 文本分類技術(shù)研究11-15
- 1.2.2 情感分類技術(shù)研究15-21
- 1.2.3 存在的問題和挑戰(zhàn)21
- 1.3 論文的主要研究?jī)?nèi)容與章節(jié)安排21-23
- 1.3.1 論文主要研究?jī)?nèi)容21-22
- 1.3.2 論文的組織結(jié)構(gòu)22-23
- 第2章 相關(guān)知識(shí)介紹與研究方案設(shè)計(jì)23-29
- 2.1 中文自然語言處理相關(guān)知識(shí)23-25
- 2.1.1 中文分詞23-24
- 2.1.2 中文詞性標(biāo)注24-25
- 2.1.3 中文分詞系統(tǒng)25
- 2.2 情感詞與屬性詞的搭配抽取25-27
- 2.2.1 情感詞與屬性詞25-26
- 2.2.2 情感詞與屬性詞的搭配抽取26-27
- 2.3 研究方案設(shè)計(jì)27-28
- 2.3.1 總體研究過程框架27
- 2.3.2 研究方案設(shè)計(jì)說明27-28
- 2.4 本章小結(jié)28-29
- 第3章 基于語料的領(lǐng)域情感詞庫構(gòu)建方法29-40
- 3.1 領(lǐng)域情感詞庫構(gòu)建總體過程框架29-30
- 3.2 領(lǐng)域情感詞庫結(jié)構(gòu)設(shè)計(jì)30-31
- 3.3 語料選取與預(yù)處理31-33
- 3.3.1 語料選取31-32
- 3.3.2 語料預(yù)處理32-33
- 3.4 領(lǐng)域基準(zhǔn)情感詞集構(gòu)建33-38
- 3.4.1 基于公共詞典庫的領(lǐng)域基礎(chǔ)標(biāo)準(zhǔn)情感詞集構(gòu)建34-35
- 3.4.2 基于詞性特征的語料庫種子情感詞提取35-37
- 3.4.3 基于點(diǎn)互信息(PMI)的語料庫情感詞自動(dòng)擴(kuò)充37-38
- 3.5 實(shí)驗(yàn)與分析38-39
- 3.5.1 實(shí)驗(yàn)結(jié)果38-39
- 3.5.2 結(jié)果分析39
- 3.6 本章小結(jié)39-40
- 第4章 基于LDA主題模型的屬性詞提取方法40-50
- 4.1 方法概述40-42
- 4.1.1 LDA主題模型簡(jiǎn)介40-41
- 4.1.2 基于LDA主題模型的屬性詞提取策略41-42
- 4.2 實(shí)驗(yàn)方案設(shè)計(jì)42-47
- 4.2.1 實(shí)驗(yàn)流程設(shè)計(jì)42-43
- 4.2.2 領(lǐng)域語料庫基準(zhǔn)屬性詞集構(gòu)建43-44
- 4.2.3 準(zhǔn)屬性詞集篩選44-47
- 4.3 實(shí)驗(yàn)結(jié)果分析47-49
- 4.4 本章小結(jié)49-50
- 第5章 面向評(píng)價(jià)屬性的細(xì)粒度文本情感分析實(shí)現(xiàn)50-58
- 5.1 方法概述50-51
- 5.2 情感評(píng)價(jià)單元構(gòu)建51-55
- 5.2.1 情感評(píng)價(jià)單元定義51
- 5.2.2 斷句處理算法51-53
- 5.2.3 程度副詞、否定詞提取53-55
- 5.3 情感聚合與情感傾向分類計(jì)算55
- 5.4 實(shí)驗(yàn)結(jié)果可視化表示55-57
- 5.5 本章小結(jié)57-58
- 第6章 總結(jié)與展望58-60
- 6.1 總結(jié)58
- 6.2 展望58-60
- 參考文獻(xiàn)60-67
- 致謝67-68
- 作者簡(jiǎn)介68
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 許璐蕾;;網(wǎng)絡(luò)評(píng)論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期
2 肖健;徐建;朱姝;萬纓;許亮;;基于翻譯和語義方法的情感詞挖掘研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年32期
3 趙鵬;趙志偉;卓景文;;一種情感詞語義加權(quán)的句子傾向性識(shí)別方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年35期
4 代大明;李壽山;李培峰;朱巧明;;基于情緒詞與情感詞協(xié)作學(xué)習(xí)的情感分類方法研究[J];計(jì)算機(jī)科學(xué);2012年12期
5 李勇敢;周學(xué)廣;孫艷;張煥國;;結(jié)合依存關(guān)聯(lián)分析和規(guī)則統(tǒng)計(jì)分析的情感詞庫構(gòu)建方法[J];武漢大學(xué)學(xué)報(bào)(理學(xué)版);2013年05期
6 彭慶喜;錢鐵云;;基于量化情感的網(wǎng)店垃圾評(píng)論檢測(cè)[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2013年11期
7 杜嘉忠;徐健;劉穎;;網(wǎng)絡(luò)商品評(píng)論的特征 情感詞本體構(gòu)建與情感分析方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2014年05期
8 張清亮;徐健;;網(wǎng)絡(luò)情感詞自動(dòng)識(shí)別方法研究[J];現(xiàn)代圖書情報(bào)技術(shù);2011年10期
9 黃俊;田生偉;禹龍;馮冠軍;;基于維吾爾語情感詞的句子情感分析[J];計(jì)算機(jī)工程;2012年09期
10 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計(jì)算機(jī)工程;2013年12期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前5條
1 陳奇哲;劉全升;姚天f ;;漢語意見型語句主題與情感關(guān)系抽取的研究[A];第五屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
2 孫慧;關(guān)毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
3 段秀婷;何婷婷;宋樂;;基于PMI-IR算法的Blog情感分類研究[A];第五屆全國青年計(jì)算語言學(xué)研討會(huì)論文集[C];2010年
4 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標(biāo)簽圖像自動(dòng)標(biāo)注算法[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
5 王樅;涂序彥;劉嘉;;注意-情緒協(xié)調(diào)的個(gè)性化信息推薦模型[A];2006年首屆ICT大會(huì)信息、知識(shí)、智能及其轉(zhuǎn)換理論第一次高峰論壇會(huì)議論文集[C];2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前8條
1 劉全超;面向中文微博的觀點(diǎn)挖掘與傾向性分析研究[D];北京理工大學(xué);2015年
2 董喜雙;基于免疫多詞主體自治學(xué)習(xí)的情感分析研究[D];哈爾濱工業(yè)大學(xué);2013年
3 寇廣增;基于意見挖掘通用框架的情感極性強(qiáng)度模糊性研究[D];武漢大學(xué);2010年
4 楊玉珍;基于Web評(píng)論信息的傾向性分析關(guān)鍵技術(shù)研究[D];山東師范大學(xué);2014年
5 黃勝;Web評(píng)論文本的細(xì)粒度意見挖掘技術(shù)研究[D];北京理工大學(xué);2014年
6 施寒瀟;細(xì)粒度情感分析研究[D];蘇州大學(xué);2013年
7 李榮軍;中文商品評(píng)論傾向性分析研究[D];北京郵電大學(xué);2011年
8 李芳;面向中文Web評(píng)論的觀點(diǎn)挖掘關(guān)鍵技術(shù)研究[D];華中師范大學(xué);2013年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 孫博;關(guān)于情感詞的意義用法[D];遼寧大學(xué);2012年
2 王銀;中文微博情感分析方法研究[D];廣東技術(shù)師范學(xué)院;2015年
3 崔連超;互聯(lián)網(wǎng)評(píng)論文本情感分析研究[D];山東大學(xué);2015年
4 杜雪峰;藏文句子傾向性分析研究[D];中央民族大學(xué);2015年
5 孫建超;微博輿情挖掘技術(shù)的研究與應(yīng)用[D];電子科技大學(xué);2015年
6 張圣聲;基于微博平臺(tái)的產(chǎn)品評(píng)論情感分類研究[D];廣東外語外貿(mào)大學(xué);2015年
7 何天翔;基于情感詞網(wǎng)的短文本情感分類方法研究[D];西南科技大學(xué);2015年
8 丁星;基于文本傾向性分析技術(shù)的微博監(jiān)控系統(tǒng)[D];江蘇科技大學(xué);2015年
9 李茜;博客意見檢索關(guān)鍵問題研究[D];北京理工大學(xué);2015年
10 李瑞靜;漢語情感詞模糊語義的量化分析及應(yīng)用研究[D];北京理工大學(xué);2015年
,本文編號(hào):931141
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/931141.html