電子商務(wù)中的中文評論挖掘技術(shù)及應(yīng)用的研究
本文關(guān)鍵詞:電子商務(wù)中的中文評論挖掘技術(shù)及應(yīng)用的研究,由筆耕文化傳播整理發(fā)布。
【摘要】:中文商品評論作為網(wǎng)購消費(fèi)者意見的重要載體,對于潛在的消費(fèi)者的購買決策和產(chǎn)品生產(chǎn)廠家的產(chǎn)品改善,都起著重要的參考作用。因此,論文緊緊圍繞提高情感極性判別準(zhǔn)確率,對中文產(chǎn)品評論挖掘技術(shù)展開分析和研究。論文先分別闡述屬性提取和情感分析的研究現(xiàn)狀。通過發(fā)展現(xiàn)狀總結(jié)出現(xiàn)有中文產(chǎn)品評論挖掘技術(shù)還存在沒有充分考慮屬性詞對用戶的不同重要程度、程度副詞不在基準(zhǔn)程度副詞庫中無法賦值權(quán)重和基于分類器的評論挖掘算法提取特征不夠全面的問題。針對以上問題,論文設(shè)計一種結(jié)合屬性詞和程度副詞權(quán)重的中文產(chǎn)品評論挖掘方法,采取由細(xì)粒度到粗粒度的句子分析的思想,對評論的傾向性進(jìn)行判定。該方法以基于消費(fèi)者關(guān)注程度的屬性詞權(quán)重計算為基礎(chǔ),充分考慮消費(fèi)者對不同屬性的關(guān)注程度來設(shè)置不同屬性詞的權(quán)重,提高同一整句中正反極性同時存在情形下的極性判別準(zhǔn)確率;設(shè)計一種基于基準(zhǔn)程度副詞詞庫進(jìn)行語義相似度計算求得程度副詞權(quán)重的方法,改善現(xiàn)有基于基準(zhǔn)程度副詞表匹配的權(quán)重賦值方法無法對所有程度副詞賦值權(quán)重的缺點,降低了極性判別句的漏檢率。論文也進(jìn)一步探索了該方法在評論多極性判定上的有效性。實驗結(jié)果表明,結(jié)合屬性詞和程度副詞權(quán)重的情感分析方法能夠降低極性判別句的漏檢率,提高了算法的極性判別準(zhǔn)確率。為了進(jìn)一步提高結(jié)合屬性詞和副詞權(quán)重的情感傾向分析方法的準(zhǔn)確率,論文還設(shè)計了利用評論短句計算特征的中文評論挖掘方法。先利用基于屬性詞和副詞權(quán)重的情感分析方法得到評論短句計算特征,結(jié)合一般統(tǒng)計特征和基本統(tǒng)計特征作為分類器的輸入,對評論整句進(jìn)行粗粒度的情感傾向分析。實驗結(jié)果表明結(jié)合評論短句計算特征的情感分析方法進(jìn)一步改善了結(jié)合屬性詞和程度副詞權(quán)重方法的準(zhǔn)確率。最后,對本文的研究內(nèi)容進(jìn)行了總結(jié),并對以后的研究方向進(jìn)行了展望。總之,論文以提高中文評論挖掘算法的極性判別準(zhǔn)確率為最終目標(biāo),分別設(shè)計了基于屬性詞和程度副詞權(quán)重、利用評論短句特征的中文評論挖掘算法,并利用實驗對算法在不同數(shù)據(jù)集上的有效性進(jìn)行驗證和分析,以提高算法的實際應(yīng)用能力。
【關(guān)鍵詞】:情感分析 語義相似度 屬性詞提取 觀點挖掘 權(quán)重
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.1
【目錄】:
- 摘要6-7
- Abstract7-11
- 第1章 緒論11-18
- 1.1 研究背景和意義11-12
- 1.2 相關(guān)概念定義及解釋12
- 1.3 國內(nèi)外研究現(xiàn)狀12-15
- 1.3.1 屬性提取13-14
- 1.3.2 情感傾向判別14-15
- 1.3.3 產(chǎn)品評論挖掘的應(yīng)用15
- 1.4 本文的研究內(nèi)容和貢獻(xiàn)15-17
- 1.5 論文的組織結(jié)構(gòu)17-18
- 第2章 相關(guān)技術(shù)介紹18-26
- 2.1 詞匯語義相似度計算方法18-21
- 2.1.1 知網(wǎng)(Hownet)簡介18
- 2.1.2 利用知網(wǎng)計算詞匯的語義相似度18-21
- 2.2 分類算法概述21-23
- 2.2.1 樸素貝葉斯算法21-22
- 2.2.2 決策樹算法22
- 2.2.3 支持向量機(jī)SVM(Support Vector Machine)22-23
- 2.2.4 分類算法的優(yōu)缺點比較23
- 2.3 分類器的衡量指標(biāo)23-25
- 2.3.1 評估方法24
- 2.3.2 評價指標(biāo)24-25
- 2.4 本章小結(jié)25-26
- 第3章 Web產(chǎn)品評論挖掘框架設(shè)計及預(yù)處理26-36
- 3.1 Web評論挖掘總體框架設(shè)計26
- 3.2 構(gòu)造商品評論數(shù)據(jù)集26-27
- 3.3 商品評論數(shù)據(jù)預(yù)處理27-29
- 3.3.1 評論內(nèi)容的初步去噪28
- 3.3.2 中文分詞及詞性標(biāo)注28-29
- 3.4 屬性詞的提取29-31
- 3.4.1 屬性詞的提取方法29-31
- 3.4.2 屬性詞的提取結(jié)果示例31
- 3.5 評論中的情感詞提取31-32
- 3.6 評論短句的提取32-35
- 3.6.1 評論短句fs(feature sentence)的概念32-33
- 3.6.2 規(guī)則模板提取評論短句33-34
- 3.6.3 提取過程實現(xiàn)及結(jié)果34-35
- 3.7 本章小結(jié)35-36
- 第4章 結(jié)合屬性詞及程度副詞權(quán)重的情感傾向分析36-58
- 4.1 屬性詞的權(quán)重設(shè)置37-38
- 4.1.1 常用權(quán)重設(shè)置方法37
- 4.1.2 本文屬性詞權(quán)重設(shè)置方式37-38
- 4.2 情感詞的極性計算38-43
- 4.2.1 極性詞典的構(gòu)建39
- 4.2.2 基于極性詞典和語義相似度的情感極性計算39-41
- 4.2.3 情感詞極性計算實現(xiàn)及結(jié)果41-43
- 4.3 程度副詞的權(quán)重設(shè)置43-45
- 4.4 評論短句及整句的情感傾向45-46
- 4.5 屬性詞權(quán)重和副詞權(quán)重改進(jìn)實驗結(jié)果分析46-52
- 4.5.1 實驗使用的數(shù)據(jù)集46-47
- 4.5.2 屬性詞權(quán)重改進(jìn)結(jié)果分析47-50
- 4.5.3 程度副詞權(quán)重改進(jìn)結(jié)果對比50-52
- 4.6 整句極性判定結(jié)果52-57
- 4.6.1 不同權(quán)重設(shè)置時二極性判定結(jié)果對比52-54
- 4.6.2 多極性判定的實驗54-57
- 4.7 本章小結(jié)57-58
- 第5章 利用評論短句計算特征的情感傾向分析58-65
- 5.1 分類器特征分析58-59
- 5.1.1 一般統(tǒng)計特征58-59
- 5.1.2 基本統(tǒng)計特征59
- 5.1.3 評論短句fs(feature sentence)計算特征59
- 5.2 利用評論短句計算特征的情感分析實現(xiàn)59-60
- 5.3 實驗設(shè)置60-62
- 5.3.1 實驗使用的數(shù)據(jù)集60-61
- 5.3.2 Dataset 2上的分類結(jié)果分析61
- 5.3.3 Dataset 3上上的分類結(jié)果分析61-62
- 5.4 論文兩種傾向性分析方法的對比62-63
- 5.5 論文方法與其他文獻(xiàn)方法的對比63-64
- 5.6 本章小結(jié)64-65
- 第6章 總結(jié)與展望65-67
- 6.1 總結(jié)65
- 6.2 展望65-67
- 致謝67-68
- 參考文獻(xiàn)68-73
- 攻讀碩士學(xué)位期間發(fā)表的論文73
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊靜;徐蔚然;譚松波;;COAE2014情感關(guān)鍵句評測任務(wù)和評測數(shù)據(jù)設(shè)計[J];山西大學(xué)學(xué)報(自然科學(xué)版);2015年01期
2 劉麗珍;劉昊;王函石;宋巍;趙新蕾;;Generating Domain-Specific Affective Ontology from Chinese Reviews for Sentiment Analysis[J];Journal of Shanghai Jiaotong University(Science);2015年01期
3 張林;錢冠群;樊衛(wèi)國;華琨;張莉;;輕型評論的情感分析研究[J];軟件學(xué)報;2014年12期
4 董麗麗;趙繁榮;張翔;;基于領(lǐng)域本體、情感詞典的商品評論傾向性分析[J];計算機(jī)應(yīng)用與軟件;2014年12期
5 李澤魁;趙妍妍;秦兵;劉挺;;中文微博情感傾向性分析特征工程[J];山西大學(xué)學(xué)報(自然科學(xué)版);2014年04期
6 王祖輝;姜維;李一軍;;在線評論情感分析中固定搭配特征提取方法研究[J];管理工程學(xué)報;2014年04期
7 肖正;劉輝;李兵;;一種基于語義距離的Web評論SVM情感分類方法[J];計算機(jī)科學(xué);2014年09期
8 鐘將;楊思源;孫啟干;;基于文本分類的商品評價情感分析[J];計算機(jī)應(yīng)用;2014年08期
9 楊慧;劉紅巖;何軍;;中文產(chǎn)品評論結(jié)構(gòu)化引擎[J];計算機(jī)與現(xiàn)代化;2014年07期
10 戴敏;王榮洋;李壽山;朱珠;周國棟;;基于句法特征的評價對象抽取方法研究[J];中文信息學(xué)報;2014年04期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 倪茂樹;林鴻飛;;基于關(guān)聯(lián)規(guī)則和極性分析的商品評論挖掘[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
本文關(guān)鍵詞:電子商務(wù)中的中文評論挖掘技術(shù)及應(yīng)用的研究,,由筆耕文化傳播整理發(fā)布。
本文編號:276050
本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/276050.html