天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 移動網絡論文 >

基于情感分類的微博主題挖掘算法的研究及應用

發(fā)布時間:2017-09-18 11:45

  本文關鍵詞:基于情感分類的微博主題挖掘算法的研究及應用


  更多相關文章: 微博 評論信息 主題挖掘 情感分析 SC-LDA SVM LDA


【摘要】:當今,微博在創(chuàng)新科技影響下得到迅猛發(fā)展,使得越來越多的人們在其平臺上發(fā)表對自己關注的各種信息的評論,該平臺已經成為人們日常生活的一部分。在微博平臺上時時刻刻都會產生大量由用戶發(fā)表的言論信息,包括新聞人物、突發(fā)事件、購物體驗等等。這些信息中不僅帶有用戶的情感傾向,而且所含有的主題信息包含著重要的社會價值和商業(yè)價值。因此,分析微博上的評論信息的情感傾向,挖掘出主題信息,找出人們所關心和需要的信息就顯得尤為重要,也成為了當前許多學者的研究熱點。本論文的研究重點是如何從微博評論信息中挖掘出潛在的、具有價值的、蘊含情感的主題信息。論文的主要工作和創(chuàng)新點如下:(1)考慮到評論信息中正向情感的表達和負向情感的表達對主題結果的意義完全不同,本文提出了一種將文本分類和主題挖掘相結合的微博主題挖掘算法SC-LDA(Sentiment Classification-Latent Dirichlet Allocation,SC-LDA)。SC-LDA算法的基本思想是:對微博上的評論信息進行分詞處理后的數(shù)據首先利用支持向量機(Support Vector Machine,SVM)進行情感分類,得到正向情感和負向情感兩類數(shù)據,然后再利用LDA(Latent Dirichlet Allocation,LDA)模型對已分類的評論信息進行相關主題挖掘。(2)對本文提出的主題挖掘算法(SC-LDA)進行了仿真實驗,仿真結果表明SC-LDA對測試數(shù)據集的大小不敏感,對數(shù)據源的來源不敏感。同時對獲取的未經過分類處理的微博數(shù)據也進行了主題挖掘的實驗,實驗結果表明挖掘得到的主題信息不能夠有效的表明用戶的情感傾向,可能會影響第三方的推斷。從而從相反方向驗證了本文所提出算法的有效性。(3)同時為了能夠獲得更好的用戶體驗,針對SC-LDA算法,本文設計并實現(xiàn)了一個基于情感分類的微博主題挖掘系統(tǒng)。系統(tǒng)實現(xiàn)了微博數(shù)據的抓取、數(shù)據的預處理、特征提取、情感分類、主題挖掘、挖掘結果的呈現(xiàn)等功能。
【關鍵詞】:微博 評論信息 主題挖掘 情感分析 SC-LDA SVM LDA
【學位授予單位】:重慶師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP393.092;TP391.1
【目錄】:
  • 中文摘要5-6
  • 英文摘要6-10
  • 1 緒論10-17
  • 1.1 研究背景和意義10-11
  • 1.2 國內外研究現(xiàn)狀11-14
  • 1.3 主要研究內容14-15
  • 1.4 本論文結構15-17
  • 2 情感分類與微博主題挖掘的相關技術17-23
  • 2.1 研究意義17
  • 2.2 微博的特點和功能17-18
  • 2.3 預處理技術18-19
  • 2.3.1 中文分詞技術18
  • 2.3.2 詞典匹配分詞技術18-19
  • 2.3.3 分詞工具19
  • 2.4 情感特征的抽取方法19
  • 2.4.1 情感詞典的特征抽取19
  • 2.4.2 表情符號的抽取19
  • 2.5 情感分析相關技術19-21
  • 2.5.1 微博單詞極性分析20
  • 2.5.2 微博全文情感極性的分析20-21
  • 2.6 主題挖掘21-22
  • 2.7 本章總結22-23
  • 3 中文微博情感分析23-30
  • 3.1 研究意義23-24
  • 3.2 情感分類24-25
  • 3.3 具體實現(xiàn)25-28
  • 3.3.1 預處理模塊26
  • 3.3.2 情感特征抽取模塊26-27
  • 3.3.3 構造特征向量27-28
  • 3.4 實驗結果與分析28-29
  • 3.5 本章總結29-30
  • 4 基于情感分類的微博主題挖掘30-40
  • 4.1 LDA模型30-32
  • 4.1.1 LDA的模型表示和生成30-31
  • 4.1.2 符號和定義31-32
  • 4.2 Gibbs抽樣32-33
  • 4.3 基于情感分類的微博主題挖掘模型SC-LDA33-34
  • 4.4 仿真實驗及結果分析34-39
  • 4.4.1 SC-LDA模型對測試集的大小不敏感35-37
  • 4.4.2 SC-LDA模型對數(shù)據源的來源不敏感37-38
  • 4.4.3 驗證SC-LDA方法的有效性38-39
  • 4.5 本章總結39-40
  • 5 SC-LDA算法系統(tǒng)實現(xiàn)40-47
  • 5.1 系統(tǒng)功能模塊構成40
  • 5.2 系統(tǒng)的框架結構40-41
  • 5.3 系統(tǒng)具體實現(xiàn)41-46
  • 5.3.1 系統(tǒng)開發(fā)平臺42-43
  • 5.3.2 預處理模塊43-44
  • 5.3.3 情感分類模塊44-45
  • 5.3.4 主題挖掘模塊45-46
  • 5.4 本章總結46-47
  • 6 結論與展望47-50
  • 6.1 論文工作總結47-48
  • 6.2 論文展望48-50
  • 參考文獻50-53
  • 附錄A53-54
  • 致謝54-55

【相似文獻】

中國期刊全文數(shù)據庫 前10條

1 吳玲達,謝毓湘,欒悉道,肖鵬;互聯(lián)網多媒體主題信息自動收集與處理系統(tǒng)的研制[J];計算機應用研究;2005年05期

2 蔣凡,高俊波,張敏,王煦法;BBS中主題發(fā)現(xiàn)原型系統(tǒng)的設計與實現(xiàn)[J];計算機工程與應用;2005年31期

3 周亦鵬;杜軍平;;基于時空情境模型的主題跟蹤[J];華南理工大學學報(自然科學版);2012年08期

4 陳雄;都云程;李渝勤;施水才;;基于頁面結構分析的論壇主題信息定位方法研究[J];微計算機信息;2010年27期

5 何利益;陸國鋒;羅鵬;;動態(tài)新聞主題信息推薦系統(tǒng)設計[J];指揮信息系統(tǒng)與技術;2013年04期

6 關慧芬;師軍;;基于本體的主題爬蟲技術研究[J];計算機仿真;2009年10期

7 張宇;宋巍;劉挺;李生;;基于URL主題的查詢分類方法[J];計算機研究與發(fā)展;2012年06期

8 歐健文,董守斌,蔡斌;模板化網頁主題信息的提取方法[J];清華大學學報(自然科學版);2005年S1期

9 呂聚旺;都云程;王弘蔚;施水才;;基于新型主題信息量化方法的Web主題信息提取研究[J];現(xiàn)代圖書情報技術;2008年12期

10 朱夢麟;李光耀;周毅敏;;基于樹比較的Web頁面主題信息抽取[J];微型機與應用;2011年19期

中國重要會議論文全文數(shù)據庫 前6條

1 吳晨;宋丹;薛德軍;師慶輝;;科技主題識別及表示[A];第五屆全國信息檢索學術會議論文集[C];2009年

2 熊方;王曉宇;鄭駿;周傲英;;ITED:一種基于鏈接的主題提取和主題發(fā)現(xiàn)系統(tǒng)[A];第十九屆全國數(shù)據庫學術會議論文集(研究報告篇)[C];2002年

3 王玉婷;杜亞軍;涂騰濤;;基于Web鏈接的主題爬行蟲初始URL的研究[A];第四屆全國信息檢索與內容安全學術會議論文集(上)[C];2008年

4 馮少卿;都云程;施水才;;基于模板的網頁主題信息抽取[A];第三屆全國信息檢索與內容安全學術會議論文集[C];2007年

5 王琦;唐世渭;楊冬青;王騰蛟;;基于DOM的網頁主題信息自動提取[A];第二十一屆中國數(shù)據庫學術會議論文集(研究報告篇)[C];2004年

6 刁宇峰;王昊;林鴻飛;楊亮;;博客中重復評論發(fā)現(xiàn)[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年

中國博士學位論文全文數(shù)據庫 前4條

1 楊肖;基于主題的互聯(lián)網信息抓取研究[D];浙江大學;2014年

2 趙一鳴;基于多維尺度分析的潛在主題可視化研究[D];華中師范大學;2013年

3 吳永輝;面向專業(yè)領域的網絡信息采集及主題檢測技術研究與應用[D];哈爾濱工業(yè)大學;2010年

4 薛利;面向證券應用的WEB主題觀點挖掘若干關鍵問題研究[D];復旦大學;2013年

中國碩士學位論文全文數(shù)據庫 前10條

1 解琰;主題優(yōu)化過濾方法研究與應用[D];大連海事大學;2015年

2 楊春艷;基于語義和引用加權的文獻主題提取研究[D];浙江大學;2015年

3 盧洋;基于主題模型的混合推薦算法研究[D];電子科技大學;2014年

4 黃志;基于維基歧義頁的搜索結果聚類方法研究[D];北京理工大學;2015年

5 王亮;基于主題模型的文本挖掘的研究[D];大連理工大學;2015年

6 任昱鳳;基于Hadoop的分布式主題爬蟲及其實現(xiàn)[D];陜西師范大學;2015年

7 韓琳;基于貝葉斯主題爬蟲的研究與實現(xiàn)[D];北京工業(yè)大學;2015年

8 黎楠;面向專利的主題挖掘技術研究及應用[D];北京工業(yè)大學;2015年

9 劉學江;超大規(guī)模社交網絡中基于結構與主題的社團挖掘[D];電子科技大學;2015年

10 黃文強;安卓技術信息的主題爬蟲技術研究與實現(xiàn)[D];東南大學;2015年

,

本文編號:875323

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/875323.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶918de***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com