天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

網(wǎng)站商品評論挖掘技術的研究

發(fā)布時間:2017-05-05 09:03

  本文關鍵詞:網(wǎng)站商品評論挖掘技術的研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著互聯(lián)網(wǎng)應用的迅速發(fā)展,購物網(wǎng)站、點評網(wǎng)站以及各種論壇上不斷積累了越來越多的商品評論文本。在商品評論挖掘的研究中,基于方面的情感分析備受關注。從消費者的角度來看,不同消費者看重的方面會有所區(qū)別,基于方面的情感分析結果可以幫助他們選擇更適合自己的產(chǎn)品。從商家的角度來看,基于方面的情感分析結果可以讓商家知道其產(chǎn)品有哪些方面存在問題,可以幫助他們對產(chǎn)品進行改進。本文利用CRFs模型,對評論文本進行基于方面的情感分析研究,主要包括方面與評價詞抽取、情感極性及強度分析、基于主題-方面的情感極性及強度分析結果總結三部分。關于方面與評價詞的抽取,本文提出了基于LDA和CRFs的半監(jiān)督方面詞與評價詞同步抽取方法。初始方面詞與評價詞集合從LDA主題模型的訓練結果以及知網(wǎng)的情感詞典中獲取。在CRFs模型中,融合了統(tǒng)計特征(從LDA主題模型的訓練結果中得到)、語義特征(詞、詞性、語氣詞、程度詞、詞之間的前后關系)以及方面與評價詞的共現(xiàn)等特征,最終得到方面詞抽取的F1值為71.7%,評價詞抽取的F1值為55.3%。和有監(jiān)督學習相比,本文的半監(jiān)督方法能很大程度上減少方面詞和評價詞標注的工作量。因為是半監(jiān)督,該方法還具有一定的跨領域性,如果應用到其他領域,需要做的額外工作很少。關于情感極性分類及強度分析,本文利用層疊CRFs模型,融合詞、詞性、語氣詞、程度詞、方面和評價詞的共現(xiàn)等特征,在情感句識別、情感極性分類和情感強度分析上得到的F1值分別為86.3%、77.2%、70.7%。關于意見總結,本文提出了基于主題-方面的情感極性及強度分析結果總結方法,并實現(xiàn)了一個評論挖掘系統(tǒng),對挖掘效果進行了直觀的展示。
【關鍵詞】:商品評論 方面抽取 情感分析 條件隨機場 主題模型
【學位授予單位】:北京交通大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.1;F724.6
【目錄】:
  • 致謝5-6
  • 摘要6-7
  • ABSTRACT7-12
  • 1 引言12-22
  • 1.1 研究背景和選題意義12-13
  • 1.2 研究現(xiàn)狀13-20
  • 1.2.1 方面抽取研究現(xiàn)狀13-15
  • 1.2.2 評價詞抽取研究現(xiàn)狀15-16
  • 1.2.3 主觀句識別研究現(xiàn)狀16
  • 1.2.4 文本情感極性及強度分析研究現(xiàn)狀16-19
  • 1.2.5 評論挖掘系統(tǒng)構建研究現(xiàn)狀19-20
  • 1.3 論文主要工作20
  • 1.4 論文組織結構20-22
  • 2 相關基礎知識22-32
  • 2.1 評論挖掘的一般流程22-23
  • 2.2 常用模型介紹23-31
  • 2.2.1 向量空間模型23-24
  • 2.2.2 主題模型24-25
  • 2.2.3 條件隨機場模型25-31
  • 2.3 文本分類性能評價31
  • 2.4 本章小結31-32
  • 3 方面與評價詞抽取32-46
  • 3.1 抽取對象的定義與說明32-33
  • 3.2 半監(jiān)督CRFs迭代抽取方面和評價詞33-38
  • 3.2.1 LDA主題模型的建模33-34
  • 3.2.2 獲取初始方面及評價詞集合34-35
  • 3.2.3 迭代抽取流程35-36
  • 3.2.4 CRFs特征的選取36-37
  • 3.2.5 CRFs特征模板的設計37-38
  • 3.3 實驗及結果分析38-45
  • 3.3.1 實驗環(huán)境、工具及語料說明38-39
  • 3.3.2 文本標注及統(tǒng)計39
  • 3.3.3 實驗過程39-42
  • 3.3.4 實驗結果及分析42-45
  • 3.4 本章小結45-46
  • 4 情感極性及強度分析46-62
  • 4.1 評論文本基于標點的切分和基于方面的合并47-48
  • 4.2 情感句識別48-50
  • 4.2.1 特征選取48-49
  • 4.2.2 特征模板的設計49-50
  • 4.3 褒貶極性分類50-51
  • 4.3.1 特征選取50-51
  • 4.3.2 特征模板的設計51
  • 4.4 褒貶強度分類51-53
  • 4.4.1 特征選取51-53
  • 4.4.2 特征模板的設計53
  • 4.5 情感極性及強度分析實驗53-61
  • 4.5.1 準備工作53-54
  • 4.5.2 情感句識別實驗54-56
  • 4.5.3 褒貶極性分類實驗56-58
  • 4.5.4 褒貶強度分類實驗58-61
  • 4.6 本章小結61-62
  • 5 基于主題-方面的商品評論挖掘系統(tǒng)的構建62-68
  • 5.1 基于主題-方面的意見總結62-64
  • 5.1.1 將短評論歸類到主題62-63
  • 5.1.2 方面的合并與各主題及整體打分63-64
  • 5.2 商品評論挖掘系統(tǒng)的設計與實現(xiàn)64-67
  • 5.2.1 商品評論的存儲形式64
  • 5.2.2 數(shù)據(jù)處理流程64-65
  • 5.2.3 挖掘結果的展示65-67
  • 5.3 本章小結67-68
  • 6 總結68-70
  • 6.1 研究工作總結68-69
  • 6.2 進一步工作69-70
  • 參考文獻70-73
  • 作者簡歷及攻讀碩士學位期間取得的研究成果73-75
  • 學位論文數(shù)據(jù)集75

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 許璐蕾;;網(wǎng)絡評論中情感詞的獲取及極性判斷方法比較[J];電腦與電信;2011年01期

2 肖健;徐建;朱姝;萬纓;許亮;;基于翻譯和語義方法的情感詞挖掘研究[J];計算機工程與應用;2011年32期

3 趙鵬;趙志偉;卓景文;;一種情感詞語義加權的句子傾向性識別方法[J];計算機工程與應用;2011年35期

4 代大明;李壽山;李培峰;朱巧明;;基于情緒詞與情感詞協(xié)作學習的情感分類方法研究[J];計算機科學;2012年12期

5 李勇敢;周學廣;孫艷;張煥國;;結合依存關聯(lián)分析和規(guī)則統(tǒng)計分析的情感詞庫構建方法[J];武漢大學學報(理學版);2013年05期

6 彭慶喜;錢鐵云;;基于量化情感的網(wǎng)店垃圾評論檢測[J];山東大學學報(理學版);2013年11期

7 杜嘉忠;徐健;劉穎;;網(wǎng)絡商品評論的特征 情感詞本體構建與情感分析方法研究[J];現(xiàn)代圖書情報技術;2014年05期

8 張清亮;徐健;;網(wǎng)絡情感詞自動識別方法研究[J];現(xiàn)代圖書情報技術;2011年10期

9 黃俊;田生偉;禹龍;馮冠軍;;基于維吾爾語情感詞的句子情感分析[J];計算機工程;2012年09期

10 孫勁光;馬志芳;孟祥福;;基于情感詞屬性和云模型的文本情感分類方法[J];計算機工程;2013年12期

中國重要會議論文全文數(shù)據(jù)庫 前5條

1 陳奇哲;劉全升;姚天f ;;漢語意見型語句主題與情感關系抽取的研究[A];第五屆全國信息檢索學術會議論文集[C];2009年

2 孫慧;關毅;董喜雙;;中文情感詞傾向消歧[A];第六屆全國信息檢索學術會議論文集[C];2010年

3 段秀婷;何婷婷;宋樂;;基于PMI-IR算法的Blog情感分類研究[A];第五屆全國青年計算語言學研討會論文集[C];2010年

4 李先斌;袁平波;俞能海;;基于局部最優(yōu)的情感標簽圖像自動標注算法[A];第六屆和諧人機環(huán)境聯(lián)合學術會議(HHME2010)、第19屆全國多媒體學術會議(NCMT2010)、第6屆全國人機交互學術會議(CHCI2010)、第5屆全國普適計算學術會議(PCC2010)論文集[C];2010年

5 王樅;涂序彥;劉嘉;;注意-情緒協(xié)調的個性化信息推薦模型[A];2006年首屆ICT大會信息、知識、智能及其轉換理論第一次高峰論壇會議論文集[C];2006年

中國博士學位論文全文數(shù)據(jù)庫 前8條

1 劉全超;面向中文微博的觀點挖掘與傾向性分析研究[D];北京理工大學;2015年

2 董喜雙;基于免疫多詞主體自治學習的情感分析研究[D];哈爾濱工業(yè)大學;2013年

3 寇廣增;基于意見挖掘通用框架的情感極性強度模糊性研究[D];武漢大學;2010年

4 楊玉珍;基于Web評論信息的傾向性分析關鍵技術研究[D];山東師范大學;2014年

5 黃勝;Web評論文本的細粒度意見挖掘技術研究[D];北京理工大學;2014年

6 施寒瀟;細粒度情感分析研究[D];蘇州大學;2013年

7 李榮軍;中文商品評論傾向性分析研究[D];北京郵電大學;2011年

8 李芳;面向中文Web評論的觀點挖掘關鍵技術研究[D];華中師范大學;2013年

中國碩士學位論文全文數(shù)據(jù)庫 前10條

1 孫博;關于情感詞的意義用法[D];遼寧大學;2012年

2 王銀;中文微博情感分析方法研究[D];廣東技術師范學院;2015年

3 崔連超;互聯(lián)網(wǎng)評論文本情感分析研究[D];山東大學;2015年

4 杜雪峰;藏文句子傾向性分析研究[D];中央民族大學;2015年

5 孫建超;微博輿情挖掘技術的研究與應用[D];電子科技大學;2015年

6 張圣聲;基于微博平臺的產(chǎn)品評論情感分類研究[D];廣東外語外貿(mào)大學;2015年

7 何天翔;基于情感詞網(wǎng)的短文本情感分類方法研究[D];西南科技大學;2015年

8 丁星;基于文本傾向性分析技術的微博監(jiān)控系統(tǒng)[D];江蘇科技大學;2015年

9 李茜;博客意見檢索關鍵問題研究[D];北京理工大學;2015年

10 李瑞靜;漢語情感詞模糊語義的量化分析及應用研究[D];北京理工大學;2015年


  本文關鍵詞:網(wǎng)站商品評論挖掘技術的研究,由筆耕文化傳播整理發(fā)布。

,

本文編號:346033

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/346033.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶c5e67***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
午夜视频成人在线免费| 国产又粗又猛又爽又黄| 国产精品亚洲精品亚洲| 91欧美亚洲视频在线| 精品人妻一区二区三区四在线| 日本加勒比系列在线播放| 大香蕉伊人一区二区三区| 国产伦精品一区二区三区高清版 | 又色又爽又无遮挡的视频| 91亚洲国产日韩在线| 欧美大黄片在线免费观看| 日本理论片午夜在线观看| 国产午夜精品久久福利| 国产成人精品资源在线观看| 亚洲视频在线观看你懂的| 亚洲中文字幕高清视频在线观看| 欧美日韩国产的另类视频| 中文字幕区自拍偷拍区| 丁香七月啪啪激情综合| 国产精品丝袜美腿一区二区| 国产自拍欧美日韩在线观看| 精品人妻少妇二区三区| 欧美精品久久99九九| 成人三级视频在线观看不卡| 亚洲中文字幕三区四区| 国产精品一区二区三区欧美 | 久久99精品日韩人妻| 日本免费熟女一区二区三区| 激情偷拍一区二区三区视频| 国产性色精品福利在线观看| 一区二区三区国产日韩| 手机在线不卡国产视频| 欧美一区二区日韩一区二区| 午夜直播免费福利平台| 91麻豆视频国产一区二区| 人妻少妇系列中文字幕| 免费在线播放不卡视频| 日韩不卡一区二区视频| 国产麻豆成人精品区在线观看| 久久机热频这里只精品| 色偷偷亚洲女人天堂观看|