面向電子商務(wù)評(píng)論文本的觀點(diǎn)挖掘系統(tǒng)研究與實(shí)現(xiàn)
本文關(guān)鍵詞:面向電子商務(wù)評(píng)論文本的觀點(diǎn)挖掘系統(tǒng)研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:隨著Web2.0時(shí)代的到來(lái),,互聯(lián)網(wǎng)上評(píng)論信息成幾何級(jí)數(shù)的增長(zhǎng)。對(duì)于這些文本信息,往往包括用戶對(duì)某件事物的看法和論斷。能夠準(zhǔn)確高效的識(shí)別其評(píng)論文本中的觀點(diǎn)信息并加以利用,將具有巨大的實(shí)際應(yīng)用和經(jīng)濟(jì)價(jià)值。 本文首先介紹了觀點(diǎn)挖掘的背景意義,概括列舉了國(guó)內(nèi)外具有代表性的學(xué)者研究情況,然后針對(duì)本文所主要解決的三大問(wèn)題:情感計(jì)算、特征挖掘和觀點(diǎn)分類(lèi)匯總,通過(guò)研究國(guó)內(nèi)外相關(guān)的研究成果,對(duì)一些傳統(tǒng)算法進(jìn)行了改進(jìn),并提出了一些具有創(chuàng)新性的算法。 (1)在情感計(jì)算當(dāng)中,不僅考慮了分句本身詞語(yǔ)對(duì)分句情感傾向的作用,同時(shí)結(jié)合了上下文語(yǔ)境對(duì)分句情感傾向的影響,提出了一種基于上下文語(yǔ)境的分句情感傾向推斷方法。 (2)在特征屬性挖掘中,采用了基于屬性詞和情感詞修飾關(guān)系的雙向迭代擴(kuò)展方法,針對(duì)中文語(yǔ)言特征,利用臨近原則方法獲取屬性詞和情感詞的修飾關(guān)系。并且通過(guò)屬性詞和情感詞之間的修飾關(guān)聯(lián)關(guān)系,來(lái)發(fā)現(xiàn)隱式的屬性詞。 (3)在觀點(diǎn)分類(lèi)匯總中,利用屬性詞和情感詞的關(guān)聯(lián)關(guān)系,對(duì)屬性詞進(jìn)行加強(qiáng)聚類(lèi)運(yùn)算,獲得各種粒度上的屬性詞簇。按照屬性詞簇的分類(lèi)以及其他信息,對(duì)觀點(diǎn)進(jìn)行分類(lèi)匯總,獲得用戶關(guān)心的各種主題層面評(píng)價(jià)信息。 實(shí)驗(yàn)結(jié)果表明:與傳統(tǒng)方法相比,本文提出的相關(guān)方法在結(jié)果的準(zhǔn)確率和召回率上均有較大提高,同時(shí)所獲取的觀點(diǎn)信息能夠更加直觀具體的為用戶服務(wù)。
【關(guān)鍵詞】:觀點(diǎn)挖掘 情感計(jì)算 特征挖掘 競(jìng)拍規(guī)則 雙向迭代
【學(xué)位授予單位】:浙江理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類(lèi)號(hào)】:TP391.1
【目錄】:
- 摘要4-5
- Abstract5-9
- 第一章 緒論9-19
- 1.1 評(píng)論文本觀點(diǎn)挖掘的背景和研究意義9-11
- 1.2 亟待解決的幾個(gè)問(wèn)題11-13
- 1.2.1 評(píng)論文本的情感計(jì)算11
- 1.2.2 評(píng)論對(duì)象特征的挖掘11-12
- 1.2.3 觀點(diǎn)的分類(lèi)與匯總12-13
- 1.3 相關(guān)研究綜述13-17
- 1.3.1 國(guó)外研究概況13-15
- 1.3.2 國(guó)內(nèi)研究概況15-17
- 1.4 本文的組織結(jié)構(gòu)安排17-19
- 第二章 綜述19-23
- 2.1 本文研究的對(duì)象及特點(diǎn)19
- 2.2 本文主要的研究任務(wù)19-21
- 2.3 本文所用到的數(shù)據(jù)介紹21-23
- 第三章 中文評(píng)論文本的情感極性及強(qiáng)度判斷23-33
- 3.1 基于情感詞典的極性判斷23-25
- 3.1.1 分詞及詞性標(biāo)注23
- 3.1.2 基于否定詞反轉(zhuǎn)語(yǔ)義的情感極性判斷法23-24
- 3.1.3 基于 AuctionRules 算法的主要情感計(jì)算24-25
- 3.2 基于上下文語(yǔ)境的情感極性計(jì)算25-28
- 3.2.1 分句情感強(qiáng)度計(jì)算方法25-27
- 3.2.2 上下文語(yǔ)境的情感極性判別27-28
- 3.3 算法步驟詳細(xì)說(shuō)明28-30
- 3.4 實(shí)驗(yàn)效果分析30-32
- 3.4.1 實(shí)驗(yàn)數(shù)據(jù)介紹30-31
- 3.4.2 P,R,F(xiàn) 評(píng)測(cè)結(jié)果31-32
- 3.5 本章小結(jié)32-33
- 第四章 評(píng)論文本中評(píng)論對(duì)象的特征挖掘33-50
- 4.1 基于臨近原則的顯式評(píng)論特征挖掘35-36
- 4.2 隱式特征挖掘的方法36-45
- 4.2.1 雙向迭代法構(gòu)建情感詞與屬性詞間的關(guān)聯(lián)關(guān)系37-41
- 4.2.2 基于關(guān)聯(lián)規(guī)則的目標(biāo)特征確定方法41-44
- 4.2.3 缺省屬性詞的前置推斷方法44-45
- 4.3 屬性詞推斷的整體框架及實(shí)驗(yàn)分析45-49
- 4.3.1 整體框架45-46
- 4.3.2 實(shí)驗(yàn)分析46-49
- 4.4 本章小結(jié)49-50
- 第五章 觀點(diǎn)的分類(lèi)匯總及決策支持50-64
- 5.1 數(shù)據(jù)50-51
- 5.2 整條評(píng)論的情感計(jì)算問(wèn)題51-52
- 5.3 屬性分類(lèi)聚類(lèi)問(wèn)題52-56
- 5.3.1 相似度計(jì)算公式54-55
- 5.3.2 聚類(lèi)算法55-56
- 5.4 實(shí)驗(yàn)結(jié)果分析56-63
- 5.4.1 屬性詞聚類(lèi)實(shí)驗(yàn)結(jié)果56-59
- 5.4.2 觀點(diǎn)匯總分類(lèi)實(shí)驗(yàn)結(jié)果59-63
- 5.5 本章小結(jié)63-64
- 第六章 觀點(diǎn)挖掘系統(tǒng)的實(shí)現(xiàn)64-73
- 6.1 系統(tǒng)總體框架64-65
- 6.2 系統(tǒng)的詳細(xì)設(shè)計(jì)65-66
- 6.3 系統(tǒng)實(shí)現(xiàn)66-71
- 6.3.1 詞表的構(gòu)建66-67
- 6.3.2 系統(tǒng)實(shí)現(xiàn)展示67-71
- 6.4 本章小結(jié)71-73
- 第七章 總結(jié)與展望73-75
- 7.1 本文工作總結(jié)73-74
- 7.2 未來(lái)工作展望74-75
- 攻讀碩士學(xué)位期間主要的研究成果75-76
- 參考文獻(xiàn)76-80
- 致謝80-81
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 顧益軍,樊孝忠,王建華,汪濤,黃維金;中文停用詞表的自動(dòng)選取[J];北京理工大學(xué)學(xué)報(bào);2005年04期
2 蔣溢;丁優(yōu);熊安萍;王化晶;;一種基于知網(wǎng)的詞匯語(yǔ)義相似度改進(jìn)計(jì)算方法[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年04期
3 王國(guó)勝;;基于支持向量機(jī)的數(shù)據(jù)挖掘技術(shù)[J];德州學(xué)院學(xué)報(bào);2007年02期
4 趙鵬;趙志偉;卓景文;;一種情感詞語(yǔ)義加權(quán)的句子傾向性識(shí)別方法[J];計(jì)算機(jī)工程與應(yīng)用;2011年35期
5 李鈍;曹付元;曹元大;萬(wàn)月亮;;基于短語(yǔ)模式的文本情感分類(lèi)研究[J];計(jì)算機(jī)科學(xué);2008年04期
6 李艷玲;戴冠中;朱燁行;;基于類(lèi)別空間模型的文本傾向性分類(lèi)方法[J];計(jì)算機(jī)應(yīng)用;2007年09期
7 劉笛,朱學(xué)峰,蘇彩紅;一種新型的模糊C均值聚類(lèi)初始化方法[J];計(jì)算機(jī)仿真;2004年11期
8 袁軍鵬;朱東華;李毅;李連宏;黃進(jìn);;文本挖掘技術(shù)研究進(jìn)展[J];計(jì)算機(jī)應(yīng)用研究;2006年02期
9 李實(shí);葉強(qiáng);李一軍;羅嗣卿;;挖掘中文網(wǎng)絡(luò)客戶評(píng)論的產(chǎn)品特征及情感傾向[J];計(jì)算機(jī)應(yīng)用研究;2010年08期
10 吳曉彥;鄭驍慶;顧軼靈;沈元一;;基于結(jié)構(gòu)語(yǔ)義熵的網(wǎng)上商品信息提取系統(tǒng)[J];計(jì)算機(jī)應(yīng)用與軟件;2010年09期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 季元葉;語(yǔ)言學(xué)特征在中文命名實(shí)體間語(yǔ)義關(guān)系抽取中的應(yīng)用研究[D];蘇州大學(xué);2010年
2 李本陽(yáng);句子和篇章文本傾向分析[D];哈爾濱工業(yè)大學(xué);2010年
3 張紫瓊;面向中文情感分析的詞類(lèi)組合模式研究[D];哈爾濱工業(yè)大學(xué);2007年
4 戴臻;內(nèi)容文本分類(lèi)中的語(yǔ)義特征提取算法研究[D];中南大學(xué);2010年
5 梁偉明;中文關(guān)鍵詞提取技術(shù)[D];上海交通大學(xué);2010年
本文關(guān)鍵詞:面向電子商務(wù)評(píng)論文本的觀點(diǎn)挖掘系統(tǒng)研究與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):316099
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/316099.html