天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

微博熱點話題預判技術研究

發(fā)布時間:2021-02-27 14:40
  微博熱點話題預判是指從海量的微博文本中識別出話題信息,并基于用戶關注的廣泛性對話題熱度進行評估,基于評估的歷史結果對話題成為熱點的可能性進行判定。微博熱點話題預判技術的研究對于商業(yè)情報分析、微博輿情預警、引導和管控具有一定的實用價值。本文結合微博話題多元信息表示模型設計了微博熱點話題預判框架,并針對微博話題建模、話題熱度評估等內(nèi)容進行了細致深入的研究,全文主要工作如下:1.在微博話題多元信息表示方面,針對現(xiàn)有方法對結構化信息描述能力不足的問題,提出了層次化的話題多元信息表示模型,用以表示話題豐富的多元信息;借鑒“微博生命周期”理論,設計了基于“微博關注度”的話題多元信息動態(tài)更新機制;基于該模型對微博話題的一般特性進行了分析。2.在微博話題建模方面,本文結合微博數(shù)據(jù)的結構化特性設計了動態(tài)微博文本生成模型MB-dLDA用于微博話題增量識別。該模型對表征微博語義關聯(lián)的轉發(fā)關系統(tǒng)一建模,并結合話題的時序關聯(lián)信息用于模型訓練;通過該模型對微博隱主題信息進行挖掘,并對話題進行時序關聯(lián);實驗表明:該模型能較好的適應微博數(shù)據(jù)特性,效果比較理想。3.在話題熱度評估方面,本文基于微博話題的一般特性,結合話... 

【文章來源】:戰(zhàn)略支援部隊信息工程大學河南省

【文章頁數(shù)】:74 頁

【學位級別】:碩士

【部分圖文】:

微博熱點話題預判技術研究


微博示例從中可以發(fā)現(xiàn)微博數(shù)據(jù)的一些特性:微博文本比較短小,并且除了正文文本內(nèi)容外,

鄰接矩陣,多元信息,表示模型,時間片


第三章 話題多元信息表示模型第 17 頁圖8 話題多元關系的鄰接矩陣示例圖3.2 模型動態(tài)更新機制3.2.1 話題多元信息的更新本文上一節(jié)介紹了微博多元信息表示模型的相關描述,在討論微博信息層時涉及到了時序的微博集合 , 1,2,...,tM t T及其關系集合 , 1, 2,...,tMR t T,其中tMR 包含了前 t 個時間片的微博關系的歷史數(shù)據(jù)。隨著時間的不斷積累,與話題相關的最新微博及其轉發(fā)不斷加入,基于對微博數(shù)據(jù)時效性的考慮,應當對歷史數(shù)據(jù)進行適當?shù)募s減,著重對當前微博數(shù)據(jù)的分析。對模型進行實時更新就是通過微博發(fā)布的時間間隔對微博信息層相關數(shù)據(jù)進行約減的過程。本文借鑒微博話題生命周期理論[35],提出了基于微博關注度的話題多元信息表示模型的更新策略。定義微博的關注度 Att(d) 為微博轉發(fā)量 Rep(d):Att ( d ) Rep( d)(1)考慮微博關注度的時間積累過程,以微博發(fā)布所在時間片為第 1 個時間片,定義 A tt ( d)為微博關注度增量

實例圖,廣度,熱度,關系分析


如圖 11 所示,該圖是通過對微博轉發(fā)關系進行提取得到的,包含了與特定微博存在直接或間接轉發(fā)關系的所有微博,圖中節(jié)點代表微博,邊代表了微博的轉發(fā)關系。圖11 微博轉發(fā)樹實例圖由圖可知,微博轉發(fā)樹中存在較為明顯的轉發(fā)層次,微博的轉發(fā)關系集合可以看做是多個轉發(fā)樹的集合,每一個樹代表了一條微博的多層轉發(fā)。針對微博轉發(fā)樹本文設計了兩個轉發(fā)關系分析指標:轉發(fā)深度和轉發(fā)廣度。轉發(fā)深度:微博轉發(fā)樹中,定義某一棵轉發(fā)樹的轉發(fā)深度為該樹的層數(shù)。話題相關的所有轉發(fā)樹的最大轉發(fā)深度值為該話題的轉發(fā)深度。轉發(fā)廣度:微博轉發(fā)樹中,定義某一棵轉發(fā)樹的轉發(fā)廣度為該樹中孩子最多的微博節(jié)點的孩子數(shù)。話題相關的所有轉發(fā)樹的最大轉發(fā)廣度值為話題的轉發(fā)廣度。轉發(fā)網(wǎng)絡的深度和廣度是對話題轉發(fā)范圍的一種度量,不同的熱度的話題的轉發(fā)深度

【參考文獻】:
期刊論文
[1]面向熱點話題時間序列的有效聚類算法研究[J]. 韓忠明,陳妮,樂嘉錦,段大高,孫踐知.  計算機學報. 2012(11)
[2]微博客中轉發(fā)行為的預測研究[J]. 張旸,路榮,楊青.  中文信息學報. 2012(04)
[3]基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 路榮,項亮,劉明榮,楊青.  模式識別與人工智能. 2012(03)
[4]基于MB-LDA模型的微博主題挖掘[J]. 張晨逸,孫建伶,丁軼群.  計算機研究與發(fā)展. 2011(10)
[5]自然語言處理中主題模型的發(fā)展[J]. 徐戈,王厚峰.  計算機學報. 2011(08)
[6]一種改進的LDA主題模型[J]. 張小平,周雪忠,黃厚寬,馮奇,陳世波,焦宏官.  北京交通大學學報. 2010(02)
[7]周期分類和Single-Pass聚類相結合的話題識別與跟蹤方法[J]. 稅儀冬,瞿有利,黃厚寬.  北京交通大學學報. 2009(05)

博士論文
[1]社交網(wǎng)絡服務中信息傳播模式與輿論演進過程研究[D]. 張彥超.北京交通大學 2012
[2]社會網(wǎng)絡中節(jié)點角色以及群體演化研究[D]. 朱天.北京郵電大學 2011
[3]新聞話題表示模型和關聯(lián)追蹤技術研究[D]. 張曉艷.國防科學技術大學 2010
[4]網(wǎng)絡安全態(tài)勢評估與趨勢感知的分析研究[D]. 蕭海東.上海交通大學 2007

碩士論文
[1]結合話題的社會網(wǎng)絡社團發(fā)現(xiàn)技術研究[D]. 李明濤.解放軍信息工程大學 2012
[2]中文微博客熱點話題檢測與跟蹤技術研究[D]. 孫勝平.北京交通大學 2011
[3]郵件通聯(lián)網(wǎng)絡變化檢測關鍵技術研究[D]. 劉楝.解放軍信息工程大學 2011
[4]微博客熱點話題發(fā)現(xiàn)策略研究[D]. 楊冠超.浙江大學 2011
[5]基于內(nèi)容分析的Blog話題檢測方法研究[D]. 何金艷.哈爾濱工業(yè)大學 2010
[6]話題檢測研究[D]. 樂可欣.北京交通大學 2009
[7]話題追蹤與演化分析技術研究[D]. 呂楠.解放軍信息工程大學 2009



本文編號:3054379

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3054379.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶43ed5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com