天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

電子商務(wù)中的中文評論挖掘技術(shù)及應(yīng)用的研究

發(fā)布時(shí)間:2017-03-30 03:04

  本文關(guān)鍵詞:電子商務(wù)中的中文評論挖掘技術(shù)及應(yīng)用的研究,由筆耕文化傳播整理發(fā)布。


【摘要】:中文商品評論作為網(wǎng)購消費(fèi)者意見的重要載體,對于潛在的消費(fèi)者的購買決策和產(chǎn)品生產(chǎn)廠家的產(chǎn)品改善,都起著重要的參考作用。因此,論文緊緊圍繞提高情感極性判別準(zhǔn)確率,對中文產(chǎn)品評論挖掘技術(shù)展開分析和研究。論文先分別闡述屬性提取和情感分析的研究現(xiàn)狀。通過發(fā)展現(xiàn)狀總結(jié)出現(xiàn)有中文產(chǎn)品評論挖掘技術(shù)還存在沒有充分考慮屬性詞對用戶的不同重要程度、程度副詞不在基準(zhǔn)程度副詞庫中無法賦值權(quán)重和基于分類器的評論挖掘算法提取特征不夠全面的問題。針對以上問題,論文設(shè)計(jì)一種結(jié)合屬性詞和程度副詞權(quán)重的中文產(chǎn)品評論挖掘方法,采取由細(xì)粒度到粗粒度的句子分析的思想,對評論的傾向性進(jìn)行判定。該方法以基于消費(fèi)者關(guān)注程度的屬性詞權(quán)重計(jì)算為基礎(chǔ),充分考慮消費(fèi)者對不同屬性的關(guān)注程度來設(shè)置不同屬性詞的權(quán)重,提高同一整句中正反極性同時(shí)存在情形下的極性判別準(zhǔn)確率;設(shè)計(jì)一種基于基準(zhǔn)程度副詞詞庫進(jìn)行語義相似度計(jì)算求得程度副詞權(quán)重的方法,改善現(xiàn)有基于基準(zhǔn)程度副詞表匹配的權(quán)重賦值方法無法對所有程度副詞賦值權(quán)重的缺點(diǎn),降低了極性判別句的漏檢率。論文也進(jìn)一步探索了該方法在評論多極性判定上的有效性。實(shí)驗(yàn)結(jié)果表明,結(jié)合屬性詞和程度副詞權(quán)重的情感分析方法能夠降低極性判別句的漏檢率,提高了算法的極性判別準(zhǔn)確率。為了進(jìn)一步提高結(jié)合屬性詞和副詞權(quán)重的情感傾向分析方法的準(zhǔn)確率,論文還設(shè)計(jì)了利用評論短句計(jì)算特征的中文評論挖掘方法。先利用基于屬性詞和副詞權(quán)重的情感分析方法得到評論短句計(jì)算特征,結(jié)合一般統(tǒng)計(jì)特征和基本統(tǒng)計(jì)特征作為分類器的輸入,對評論整句進(jìn)行粗粒度的情感傾向分析。實(shí)驗(yàn)結(jié)果表明結(jié)合評論短句計(jì)算特征的情感分析方法進(jìn)一步改善了結(jié)合屬性詞和程度副詞權(quán)重方法的準(zhǔn)確率。最后,對本文的研究內(nèi)容進(jìn)行了總結(jié),并對以后的研究方向進(jìn)行了展望?傊,論文以提高中文評論挖掘算法的極性判別準(zhǔn)確率為最終目標(biāo),分別設(shè)計(jì)了基于屬性詞和程度副詞權(quán)重、利用評論短句特征的中文評論挖掘算法,并利用實(shí)驗(yàn)對算法在不同數(shù)據(jù)集上的有效性進(jìn)行驗(yàn)證和分析,以提高算法的實(shí)際應(yīng)用能力。
【關(guān)鍵詞】:情感分析 語義相似度 屬性詞提取 觀點(diǎn)挖掘 權(quán)重
【學(xué)位授予單位】:西南交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP391.1
【目錄】:
  • 摘要6-7
  • Abstract7-11
  • 第1章 緒論11-18
  • 1.1 研究背景和意義11-12
  • 1.2 相關(guān)概念定義及解釋12
  • 1.3 國內(nèi)外研究現(xiàn)狀12-15
  • 1.3.1 屬性提取13-14
  • 1.3.2 情感傾向判別14-15
  • 1.3.3 產(chǎn)品評論挖掘的應(yīng)用15
  • 1.4 本文的研究內(nèi)容和貢獻(xiàn)15-17
  • 1.5 論文的組織結(jié)構(gòu)17-18
  • 第2章 相關(guān)技術(shù)介紹18-26
  • 2.1 詞匯語義相似度計(jì)算方法18-21
  • 2.1.1 知網(wǎng)(Hownet)簡介18
  • 2.1.2 利用知網(wǎng)計(jì)算詞匯的語義相似度18-21
  • 2.2 分類算法概述21-23
  • 2.2.1 樸素貝葉斯算法21-22
  • 2.2.2 決策樹算法22
  • 2.2.3 支持向量機(jī)SVM(Support Vector Machine)22-23
  • 2.2.4 分類算法的優(yōu)缺點(diǎn)比較23
  • 2.3 分類器的衡量指標(biāo)23-25
  • 2.3.1 評估方法24
  • 2.3.2 評價(jià)指標(biāo)24-25
  • 2.4 本章小結(jié)25-26
  • 第3章 Web產(chǎn)品評論挖掘框架設(shè)計(jì)及預(yù)處理26-36
  • 3.1 Web評論挖掘總體框架設(shè)計(jì)26
  • 3.2 構(gòu)造商品評論數(shù)據(jù)集26-27
  • 3.3 商品評論數(shù)據(jù)預(yù)處理27-29
  • 3.3.1 評論內(nèi)容的初步去噪28
  • 3.3.2 中文分詞及詞性標(biāo)注28-29
  • 3.4 屬性詞的提取29-31
  • 3.4.1 屬性詞的提取方法29-31
  • 3.4.2 屬性詞的提取結(jié)果示例31
  • 3.5 評論中的情感詞提取31-32
  • 3.6 評論短句的提取32-35
  • 3.6.1 評論短句fs(feature sentence)的概念32-33
  • 3.6.2 規(guī)則模板提取評論短句33-34
  • 3.6.3 提取過程實(shí)現(xiàn)及結(jié)果34-35
  • 3.7 本章小結(jié)35-36
  • 第4章 結(jié)合屬性詞及程度副詞權(quán)重的情感傾向分析36-58
  • 4.1 屬性詞的權(quán)重設(shè)置37-38
  • 4.1.1 常用權(quán)重設(shè)置方法37
  • 4.1.2 本文屬性詞權(quán)重設(shè)置方式37-38
  • 4.2 情感詞的極性計(jì)算38-43
  • 4.2.1 極性詞典的構(gòu)建39
  • 4.2.2 基于極性詞典和語義相似度的情感極性計(jì)算39-41
  • 4.2.3 情感詞極性計(jì)算實(shí)現(xiàn)及結(jié)果41-43
  • 4.3 程度副詞的權(quán)重設(shè)置43-45
  • 4.4 評論短句及整句的情感傾向45-46
  • 4.5 屬性詞權(quán)重和副詞權(quán)重改進(jìn)實(shí)驗(yàn)結(jié)果分析46-52
  • 4.5.1 實(shí)驗(yàn)使用的數(shù)據(jù)集46-47
  • 4.5.2 屬性詞權(quán)重改進(jìn)結(jié)果分析47-50
  • 4.5.3 程度副詞權(quán)重改進(jìn)結(jié)果對比50-52
  • 4.6 整句極性判定結(jié)果52-57
  • 4.6.1 不同權(quán)重設(shè)置時(shí)二極性判定結(jié)果對比52-54
  • 4.6.2 多極性判定的實(shí)驗(yàn)54-57
  • 4.7 本章小結(jié)57-58
  • 第5章 利用評論短句計(jì)算特征的情感傾向分析58-65
  • 5.1 分類器特征分析58-59
  • 5.1.1 一般統(tǒng)計(jì)特征58-59
  • 5.1.2 基本統(tǒng)計(jì)特征59
  • 5.1.3 評論短句fs(feature sentence)計(jì)算特征59
  • 5.2 利用評論短句計(jì)算特征的情感分析實(shí)現(xiàn)59-60
  • 5.3 實(shí)驗(yàn)設(shè)置60-62
  • 5.3.1 實(shí)驗(yàn)使用的數(shù)據(jù)集60-61
  • 5.3.2 Dataset 2上的分類結(jié)果分析61
  • 5.3.3 Dataset 3上上的分類結(jié)果分析61-62
  • 5.4 論文兩種傾向性分析方法的對比62-63
  • 5.5 論文方法與其他文獻(xiàn)方法的對比63-64
  • 5.6 本章小結(jié)64-65
  • 第6章 總結(jié)與展望65-67
  • 6.1 總結(jié)65
  • 6.2 展望65-67
  • 致謝67-68
  • 參考文獻(xiàn)68-73
  • 攻讀碩士學(xué)位期間發(fā)表的論文73

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 楊靜;徐蔚然;譚松波;;COAE2014情感關(guān)鍵句評測任務(wù)和評測數(shù)據(jù)設(shè)計(jì)[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年01期

2 劉麗珍;劉昊;王函石;宋巍;趙新蕾;;Generating Domain-Specific Affective Ontology from Chinese Reviews for Sentiment Analysis[J];Journal of Shanghai Jiaotong University(Science);2015年01期

3 張林;錢冠群;樊衛(wèi)國;華琨;張莉;;輕型評論的情感分析研究[J];軟件學(xué)報(bào);2014年12期

4 董麗麗;趙繁榮;張翔;;基于領(lǐng)域本體、情感詞典的商品評論傾向性分析[J];計(jì)算機(jī)應(yīng)用與軟件;2014年12期

5 李澤魁;趙妍妍;秦兵;劉挺;;中文微博情感傾向性分析特征工程[J];山西大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年04期

6 王祖輝;姜維;李一軍;;在線評論情感分析中固定搭配特征提取方法研究[J];管理工程學(xué)報(bào);2014年04期

7 肖正;劉輝;李兵;;一種基于語義距離的Web評論SVM情感分類方法[J];計(jì)算機(jī)科學(xué);2014年09期

8 鐘將;楊思源;孫啟干;;基于文本分類的商品評價(jià)情感分析[J];計(jì)算機(jī)應(yīng)用;2014年08期

9 楊慧;劉紅巖;何軍;;中文產(chǎn)品評論結(jié)構(gòu)化引擎[J];計(jì)算機(jī)與現(xiàn)代化;2014年07期

10 戴敏;王榮洋;李壽山;朱珠;周國棟;;基于句法特征的評價(jià)對象抽取方法研究[J];中文信息學(xué)報(bào);2014年04期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條

1 倪茂樹;林鴻飛;;基于關(guān)聯(lián)規(guī)則和極性分析的商品評論挖掘[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年


  本文關(guān)鍵詞:電子商務(wù)中的中文評論挖掘技術(shù)及應(yīng)用的研究,,由筆耕文化傳播整理發(fā)布。



本文編號:276050

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/dianzishangwulunwen/276050.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶56e8c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com