天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于詞典與改進信息增益的微博情感分析

發(fā)布時間:2021-03-30 16:16
  隨著計算機與網(wǎng)絡技術(shù)的發(fā)展日新月異,社交媒體與網(wǎng)絡平臺已然成為人們獲取、發(fā)布、共享、傳播信息的載體。這些信息對于政府與企業(yè)進行網(wǎng)絡輿情監(jiān)控、電子商務等都具有重要的社會意義與商業(yè)價值。本文以新浪微博平臺中的人們所發(fā)布的語料信息為研究對象,重點研究分析了情感分析任務中基于情感詞典與基于機器學習的兩種方法。主要研究內(nèi)容如下:1.針對現(xiàn)有的情感詞典由于對網(wǎng)絡新詞的涵蓋率較低而無法應用于微博領域的情感分析問題,本文搜集了當前現(xiàn)有的一些基礎情感詞典,網(wǎng)絡情感詞典與表情符號庫,并在去重后構(gòu)造了基礎綜合情感詞典。針對SO-PMI算法中共現(xiàn)窗口大小與語料庫規(guī)模對算法效果產(chǎn)生不利影響等問題,本文提出了使用距離互信息與古德-圖靈平滑方法來對SO-PMI算法進行優(yōu)化,并利用改進后的SO-PMI算法來擴展基于微博領域的情感詞典。通過實驗對比綜合基礎情感詞典、基于傳統(tǒng)SO-PMI算法擴展的情感詞典、基于拉普拉斯平滑的SO-PMI算法擴展的情感詞典以及本文所構(gòu)建的中文微博綜合情感詞典,使用本文所構(gòu)建的情感詞典進行情感分析的效果皆好于其他三種情感詞典。2.研究分析了常用的特征選擇算法并著重研究了信息增益算法。針對傳統(tǒng)... 

【文章來源】:安徽理工大學安徽省

【文章頁數(shù)】:72 頁

【學位級別】:碩士

【部分圖文】:

基于詞典與改進信息增益的微博情感分析


圖2-1文檔的向量空間模型示意圖??Fig2-1?Schematic?diagram?of?the?vector?space?model?of?the?document??

分類原理


使兩側(cè)的所有節(jié)點距離平面最遠,兩個類之間的距離最遠,從而提供分類能力。??有許多超平面符合條件,為了找到超平面,平面兩側(cè)的白色空間最大化以實現(xiàn)最??準確的分類。SVM在二維空間下的分類原理如圖2-2所示:??i?\??\?H:?=?0??〇?\?m?H+:'lp-x+b=l??c-°?〇?:w?x?+?b?=?-l??????圖2-2?SVM分類原理圖??Fig2-2?SVM?classification?schematic??15??

詞典,情感,中文,詞語


將其進行整合,并利用距離互信息與古德-圖靈平滑結(jié)合改進后的SO-PMI算法對??微博領域的情感詞典進行擴展,將兩者整合構(gòu)建出中文微博綜合情感詞典。主要??組成結(jié)構(gòu)如圖3-1所示:??中文微博綜合情感詞典??構(gòu)建???T?????議合—詞典碰.?囂???y???5;???iii????^調(diào)構(gòu)|?|M絡:^典|?卜?1獅|?|程度_詞典|?|否定詞詞典??圖3-1中文微博情感詞典組成結(jié)構(gòu)圖??Fig3-1?Chinese?Weibo?Sentiment?Dictionary?Composition?Chart??3.2基礎綜合情感詞典構(gòu)建??本節(jié)將利用幾種常用情感詞典整合構(gòu)建成的基礎微博情感詞典,網(wǎng)絡情感詞??典,表情符號詞典,程度副詞詞典,否定詞詞典等構(gòu)建綜合基礎情感詞典。??3.2.1基礎情感詞典構(gòu)建??本節(jié)將當前使用廣泛的幾種中文情感詞典收集整合后構(gòu)建成基礎情感詞典。??1.知網(wǎng)??中科院的董振東教授耗費十年時間構(gòu)造了知網(wǎng)(Hownet)知識體系t43],同時??知網(wǎng)也是一部較為詳實的語義知識詞典。在知網(wǎng)中,部分詞語的情感傾向可以由??構(gòu)成其概念的義原(漢語中最小語義單位)表示出來。目前,已經(jīng)在網(wǎng)上公布了??情感詞匯資源信息分為主張詞語、正面情感詞語、正面評價詞語、負面情感詞語、??負面評價詞語和程度級別詞語。本文選取知網(wǎng)情感詞匯資源中的正、反面情感詞??語,正、反面評價詞語來加入基礎情感詞典中。??本文選用HowNet中情感詞的具體數(shù)目如表3-1所示:??20??

【參考文獻】:
期刊論文
[1]基于語義的微博短文本傾向性分析研究[J]. 馬力,劉笑,宮玉龍.  計算機應用研究. 2016(10)
[2]面向中文微博的觀點句識別研究[J]. 丁晟春,孟美任,李霄.  情報學報. 2014 (02)
[3]微博產(chǎn)品評論挖掘模型研究[J]. 唐曉波,王洪艷.  情報雜志. 2013(02)
[4]基于機器學習的中文微博情感分類實證研究[J]. 劉志明,劉魯.  計算機工程與應用. 2012(01)
[5]網(wǎng)絡評論情感語料庫的構(gòu)建研究[J]. 崔大志,李媛.  中國社會科學院研究生院學報. 2010(04)
[6]微博:一種蘊含巨大能量的新型傳播形態(tài)[J]. 喻國明.  新聞與寫作. 2010(02)
[7]中文文本分類中的文本表示因素比較[J]. 張愛華,荊繼武,向繼.  中國科學院研究生院學報. 2009(03)
[8]中文分詞算法解析[J]. 張磊,張代遠.  電腦知識與技術(shù). 2009(01)
[9]知識抽取中的停用詞處理技術(shù)[J]. 化柏林.  現(xiàn)代圖書情報技術(shù). 2007(08)
[10]基于語義理解的文本傾向性識別機制[J]. 徐琳宏,林鴻飛,楊志豪.  中文信息學報. 2007(01)

博士論文
[1]自動文本分類若干基本問題研究[D]. 宋楓溪.南京理工大學 2004

碩士論文
[1]基于機器學習的微博情感分析及應用[D]. 張俊東.北京郵電大學 2017
[2]中文情感詞匯本體的擴充及應用[D]. 趙虹杰.大連理工大學 2015
[3]中文微博情感分析[D]. 張俊.西北民族大學 2015
[4]面向中文微博文本的情感分類研究[D]. 杜銳.湖南工業(yè)大學 2014
[5]基于情感詞典與規(guī)則結(jié)合的微博情感分析模型研究[D]. 楊希.安徽大學 2014
[6]基于語義情感空間模型的微博情感傾向性研究[D]. 游建平.暨南大學 2012
[7]搜索引擎中文分詞技術(shù)研究[D]. 任麗蕓.重慶理工大學 2011



本文編號:3109783

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3109783.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9dcf3***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com