天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向話題型微博評(píng)論的觀點(diǎn)識(shí)別及其情感傾向分析研究

發(fā)布時(shí)間:2017-04-16 18:12

  本文關(guān)鍵詞:面向話題型微博評(píng)論的觀點(diǎn)識(shí)別及其情感傾向分析研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著互聯(lián)網(wǎng)在中國(guó)的普及,人們的生活方式也逐漸地發(fā)生變化,越來(lái)越多的人通過(guò)互聯(lián)網(wǎng)獲取和發(fā)布信息。廣大互聯(lián)網(wǎng)用戶開始在微博上傳播政治話題、體育話題、娛樂話題。每天都有大量的具有分析價(jià)值的微博評(píng)論產(chǎn)生,這些評(píng)論信息包含大量情感信息和觀點(diǎn)。 微博研究已經(jīng)成為熱點(diǎn)。通過(guò)對(duì)中文微博情感分析相關(guān)文獻(xiàn)的研究,發(fā)現(xiàn)微博情感分類方法主要有兩類:基于情感詞典的方法和基于機(jī)器學(xué)習(xí)的方法。由于中文語(yǔ)法復(fù)雜,基于機(jī)器學(xué)習(xí)的方法無(wú)法保留了情感相關(guān)特征項(xiàng)之間的關(guān)系,也無(wú)法應(yīng)對(duì)多個(gè)情感詞和評(píng)價(jià)對(duì)象的情況。而基于情感詞典的方法,在情感極性分類過(guò)程中,較少考慮到微博話題領(lǐng)域詞匯,同時(shí)情感詞典中的情感詞不區(qū)分情感詞之間情感強(qiáng)弱,這樣使得分類結(jié)果的準(zhǔn)確性受到影響。目前中文微博情感分析缺乏針對(duì)性研究,忽略評(píng)價(jià)對(duì)象對(duì)情感的極性和強(qiáng)弱影響,而且情感特征項(xiàng)抽取算法也有待改進(jìn)。 針對(duì)這些問(wèn)題,本文采用基于情感詞典的方法,,選擇中文情感詞匯本體庫(kù)作為本文的基礎(chǔ)情感詞典,有效地改進(jìn)以往情感詞典不區(qū)分情感之間情感強(qiáng)弱的缺點(diǎn)。并且采用一種基于HowNet的詞匯語(yǔ)義相似度計(jì)算方法,構(gòu)建面向微博話題的領(lǐng)域情感詞典。同時(shí)考慮到評(píng)價(jià)對(duì)象對(duì)微博情感分類的影響,構(gòu)建合理的評(píng)價(jià)對(duì)象詞典。本文采用規(guī)則和SVM模型進(jìn)行觀點(diǎn)識(shí)別,篩選出和微博話題相關(guān)的微博評(píng)論,提高情感分析中評(píng)論文本的質(zhì)量。然后對(duì)微博評(píng)論文本進(jìn)行相應(yīng)的文本預(yù)處理,并采用平滑算法、語(yǔ)法規(guī)則相結(jié)合,作為微博評(píng)論文本情感特征項(xiàng)抽取方法,對(duì)微博評(píng)論中的否定詞、程度副詞、微博表情符號(hào)、情感詞以及評(píng)論中的評(píng)價(jià)對(duì)象做相應(yīng)的處理。最后本文結(jié)合微博評(píng)論語(yǔ)句情感計(jì)算公式,對(duì)評(píng)論句的情感傾向進(jìn)行分類,有效改進(jìn)了以往微博情感分析的缺陷,實(shí)現(xiàn)了一個(gè)能夠較為合理判斷微博評(píng)論句情感強(qiáng)弱的計(jì)算公式。不同的話題,其領(lǐng)域詞典存在不同。本文基于微博話題構(gòu)建針對(duì)性的情感傾向詞典和評(píng)價(jià)對(duì)象詞典做特定話題的情感分析研究,可以進(jìn)一步提升情感分析效果。 實(shí)驗(yàn)數(shù)據(jù)采用數(shù)據(jù)堂提供的微博語(yǔ)料,包含生活、交通事故、科技三個(gè)領(lǐng)域的微博話題評(píng)論數(shù)據(jù),實(shí)驗(yàn)結(jié)果表明,本文設(shè)計(jì)的觀點(diǎn)識(shí)別方法和情感分類模型與以往的分類模型對(duì)比,觀點(diǎn)識(shí)別和情感分類效果具有明顯提升,說(shuō)明本文提出的方法具有合理性和有效性。
【關(guān)鍵詞】:微博話題 觀點(diǎn)識(shí)別 詞匯相似度 情感詞典 情感傾向
【學(xué)位授予單位】:杭州電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1;TP393.092
【目錄】:
  • 摘要5-6
  • ABSTRACT6-8
  • 目錄8-11
  • 1 緒論11-20
  • 1.1 研究背景11-12
  • 1.2 研究目的及意義12-13
  • 1.3 微博國(guó)內(nèi)外研究綜述13-15
  • 1.3.1 國(guó)內(nèi)微博情感分析研究現(xiàn)狀13-14
  • 1.3.2 國(guó)外微博情感分析研究現(xiàn)狀14-15
  • 1.4 觀點(diǎn)識(shí)別研究綜述15-16
  • 1.5 研究?jī)?nèi)容及挑戰(zhàn)16-17
  • 1.6 研究框架17-19
  • 1.7 本章小結(jié)19-20
  • 2 相關(guān)介紹與理論概述20-31
  • 2.1 微博概述20-22
  • 2.1.1 微博定義及發(fā)展20
  • 2.1.2 微博特點(diǎn)及其成功原因20-21
  • 2.1.3 國(guó)內(nèi)外微博比較21-22
  • 2.2 文本特征選擇方法22-25
  • 2.2.1 特征選取及要點(diǎn)22
  • 2.2.2 目前常用的幾種特征選擇方法22-24
  • 2.2.3 目前文本特征提取的難點(diǎn)24-25
  • 2.2.4 微博研究特征選取方法25
  • 2.3 文本預(yù)處理25-30
  • 2.3.1 中文分詞26-27
  • 2.3.2 中文分詞難點(diǎn)總結(jié)27
  • 2.3.3 中文分詞系統(tǒng)27-28
  • 2.3.4 詞性標(biāo)注28-30
  • 2.3.5 停用詞過(guò)濾30
  • 2.4 本章小結(jié)30-31
  • 3 話題型微博相關(guān)情感詞典構(gòu)建31-43
  • 3.1 HowNet介紹31
  • 3.2 詞語(yǔ)相似度與詞語(yǔ)距離31-32
  • 3.2.1 詞語(yǔ)相似度含義31
  • 3.2.2 詞語(yǔ)相似度與詞語(yǔ)距離的關(guān)系31-32
  • 3.3 情感詞典相關(guān)介紹32-34
  • 3.3.1 情感相關(guān)術(shù)語(yǔ)介紹32-33
  • 3.3.2 情感詞典的重要性33
  • 3.3.3 相關(guān)情感詞典介紹33-34
  • 3.3.4 微博情感詞典的組成34
  • 3.4 基礎(chǔ)情感詞典構(gòu)建34-37
  • 3.5 程度副詞、否定詞詞典構(gòu)建37-38
  • 3.5.1 程度副詞詞典構(gòu)建37
  • 3.5.2 否定詞詞典構(gòu)建37-38
  • 3.6 表情符號(hào)、網(wǎng)絡(luò)用語(yǔ)詞典構(gòu)建38
  • 3.6.1 表情符號(hào)詞典構(gòu)建38
  • 3.6.2 網(wǎng)絡(luò)用語(yǔ)詞典構(gòu)建38
  • 3.7 評(píng)價(jià)對(duì)象詞典構(gòu)建38-39
  • 3.8 面向微博話題的領(lǐng)域情感詞典構(gòu)建39-42
  • 3.8.1 領(lǐng)域詞匯獲取40
  • 3.8.2 基于HowNet詞匯語(yǔ)義相似度計(jì)算方法40-41
  • 3.8.3 領(lǐng)域情感詞典構(gòu)建41-42
  • 3.9 本章小結(jié)42-43
  • 4 話題型微博評(píng)論的觀點(diǎn)識(shí)別及其情感傾向分析43-59
  • 4.1 微博情感相關(guān)特征項(xiàng)分析43-47
  • 4.1.1 話題型微博評(píng)論文本的特點(diǎn)43-44
  • 4.1.2 本文微博情感相關(guān)特征項(xiàng)44-47
  • 4.2 微博特征項(xiàng)抽取算法47-51
  • 4.2.1 情感詞、程度副詞、否定詞、評(píng)價(jià)對(duì)象的抽取48-50
  • 4.2.2 表情符號(hào)的抽取50
  • 4.2.3 網(wǎng)絡(luò)用語(yǔ)的抽取50-51
  • 4.3 話題型微博評(píng)論觀點(diǎn)識(shí)別介紹51-54
  • 4.3.1 觀點(diǎn)識(shí)別相關(guān)介紹51
  • 4.3.2 微博觀點(diǎn)識(shí)別特征項(xiàng)選擇51-52
  • 4.3.3 SVM介紹52-54
  • 4.4 基于規(guī)則和SVM相結(jié)合的觀點(diǎn)句識(shí)別54-56
  • 4.4.1 觀點(diǎn)識(shí)別過(guò)濾規(guī)則54-55
  • 4.4.2 基于SVM的觀點(diǎn)識(shí)別55-56
  • 4.5 微博話題評(píng)論情感傾向計(jì)算56-57
  • 4.6 本章小結(jié)57-59
  • 5 實(shí)驗(yàn)及結(jié)果分析59-66
  • 5.1 實(shí)驗(yàn)及結(jié)果分析59
  • 5.2 實(shí)驗(yàn)的評(píng)價(jià)指標(biāo)59-60
  • 5.2.1 準(zhǔn)確率和召回率59
  • 5.2.2 F1 值59-60
  • 5.3 話題相關(guān)領(lǐng)域情感詞擴(kuò)展實(shí)驗(yàn)結(jié)果60
  • 5.4 觀點(diǎn)識(shí)別實(shí)驗(yàn)結(jié)果60-61
  • 5.5 話題微博評(píng)論情感極性分類61-65
  • 5.6 本章小結(jié)65-66
  • 6 總結(jié)和展望66-68
  • 6.1 工作總結(jié)66
  • 6.2 不足與進(jìn)一步改進(jìn)66-68
  • 致謝68-69
  • 參考文獻(xiàn)69-73
  • 附錄73-86
  • 附錄173-74
  • 附錄274-86

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 王銀;吳新玲;;中文微博情感分析方法研究[J];廣東技術(shù)師范學(xué)院學(xué)報(bào);2014年03期

2 王樂;閉應(yīng)洲;;基于特征模板提取及SVM的觀點(diǎn)句識(shí)別[J];廣西師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2014年03期

3 王晶;;論英語(yǔ)教學(xué)中的情感教育[J];黑龍江科技信息;2010年09期

4 盧葦;彭雅;;幾種常用文本分類算法性能比較與分析[J];湖南大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年06期

5 劉志明;劉魯;;基于機(jī)器學(xué)習(xí)的中文微博情感分類實(shí)證研究[J];計(jì)算機(jī)工程與應(yīng)用;2012年01期

6 柳位平;朱艷輝;栗春亮;向華政;文志強(qiáng);;中文基礎(chǔ)情感詞詞典構(gòu)建方法研究[J];計(jì)算機(jī)應(yīng)用;2009年10期

7 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語(yǔ)義傾向計(jì)算[J];中文信息學(xué)報(bào);2006年01期

8 王根;趙軍;;基于多重冗余標(biāo)記CRFs的句子情感分析研究[J];中文信息學(xué)報(bào);2007年05期

9 徐琳宏;林鴻飛;趙晶;;情感語(yǔ)料庫(kù)的構(gòu)建和分析[J];中文信息學(xué)報(bào);2008年01期

10 喬維;孫茂松;;漢語(yǔ)交集型歧義切分字段關(guān)于專業(yè)領(lǐng)域的統(tǒng)計(jì)特性[J];中文信息學(xué)報(bào);2008年04期


  本文關(guān)鍵詞:面向話題型微博評(píng)論的觀點(diǎn)識(shí)別及其情感傾向分析研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):311377

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/311377.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d7548***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com