微博熱點(diǎn)話題預(yù)判技術(shù)研究
發(fā)布時(shí)間:2021-02-27 14:40
微博熱點(diǎn)話題預(yù)判是指從海量的微博文本中識(shí)別出話題信息,并基于用戶關(guān)注的廣泛性對(duì)話題熱度進(jìn)行評(píng)估,基于評(píng)估的歷史結(jié)果對(duì)話題成為熱點(diǎn)的可能性進(jìn)行判定。微博熱點(diǎn)話題預(yù)判技術(shù)的研究對(duì)于商業(yè)情報(bào)分析、微博輿情預(yù)警、引導(dǎo)和管控具有一定的實(shí)用價(jià)值。本文結(jié)合微博話題多元信息表示模型設(shè)計(jì)了微博熱點(diǎn)話題預(yù)判框架,并針對(duì)微博話題建模、話題熱度評(píng)估等內(nèi)容進(jìn)行了細(xì)致深入的研究,全文主要工作如下:1.在微博話題多元信息表示方面,針對(duì)現(xiàn)有方法對(duì)結(jié)構(gòu)化信息描述能力不足的問(wèn)題,提出了層次化的話題多元信息表示模型,用以表示話題豐富的多元信息;借鑒“微博生命周期”理論,設(shè)計(jì)了基于“微博關(guān)注度”的話題多元信息動(dòng)態(tài)更新機(jī)制;基于該模型對(duì)微博話題的一般特性進(jìn)行了分析。2.在微博話題建模方面,本文結(jié)合微博數(shù)據(jù)的結(jié)構(gòu)化特性設(shè)計(jì)了動(dòng)態(tài)微博文本生成模型MB-dLDA用于微博話題增量識(shí)別。該模型對(duì)表征微博語(yǔ)義關(guān)聯(lián)的轉(zhuǎn)發(fā)關(guān)系統(tǒng)一建模,并結(jié)合話題的時(shí)序關(guān)聯(lián)信息用于模型訓(xùn)練;通過(guò)該模型對(duì)微博隱主題信息進(jìn)行挖掘,并對(duì)話題進(jìn)行時(shí)序關(guān)聯(lián);實(shí)驗(yàn)表明:該模型能較好的適應(yīng)微博數(shù)據(jù)特性,效果比較理想。3.在話題熱度評(píng)估方面,本文基于微博話題的一般特性,結(jié)合話...
【文章來(lái)源】:戰(zhàn)略支援部隊(duì)信息工程大學(xué)河南省
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
微博示例從中可以發(fā)現(xiàn)微博數(shù)據(jù)的一些特性:微博文本比較短小,并且除了正文文本內(nèi)容外,
第三章 話題多元信息表示模型第 17 頁(yè)圖8 話題多元關(guān)系的鄰接矩陣示例圖3.2 模型動(dòng)態(tài)更新機(jī)制3.2.1 話題多元信息的更新本文上一節(jié)介紹了微博多元信息表示模型的相關(guān)描述,在討論微博信息層時(shí)涉及到了時(shí)序的微博集合 , 1,2,...,tM t T及其關(guān)系集合 , 1, 2,...,tMR t T,其中tMR 包含了前 t 個(gè)時(shí)間片的微博關(guān)系的歷史數(shù)據(jù)。隨著時(shí)間的不斷積累,與話題相關(guān)的最新微博及其轉(zhuǎn)發(fā)不斷加入,基于對(duì)微博數(shù)據(jù)時(shí)效性的考慮,應(yīng)當(dāng)對(duì)歷史數(shù)據(jù)進(jìn)行適當(dāng)?shù)募s減,著重對(duì)當(dāng)前微博數(shù)據(jù)的分析。對(duì)模型進(jìn)行實(shí)時(shí)更新就是通過(guò)微博發(fā)布的時(shí)間間隔對(duì)微博信息層相關(guān)數(shù)據(jù)進(jìn)行約減的過(guò)程。本文借鑒微博話題生命周期理論[35],提出了基于微博關(guān)注度的話題多元信息表示模型的更新策略。定義微博的關(guān)注度 Att(d) 為微博轉(zhuǎn)發(fā)量 Rep(d):Att ( d ) Rep( d)(1)考慮微博關(guān)注度的時(shí)間積累過(guò)程,以微博發(fā)布所在時(shí)間片為第 1 個(gè)時(shí)間片,定義 A tt ( d)為微博關(guān)注度增量
如圖 11 所示,該圖是通過(guò)對(duì)微博轉(zhuǎn)發(fā)關(guān)系進(jìn)行提取得到的,包含了與特定微博存在直接或間接轉(zhuǎn)發(fā)關(guān)系的所有微博,圖中節(jié)點(diǎn)代表微博,邊代表了微博的轉(zhuǎn)發(fā)關(guān)系。圖11 微博轉(zhuǎn)發(fā)樹(shù)實(shí)例圖由圖可知,微博轉(zhuǎn)發(fā)樹(shù)中存在較為明顯的轉(zhuǎn)發(fā)層次,微博的轉(zhuǎn)發(fā)關(guān)系集合可以看做是多個(gè)轉(zhuǎn)發(fā)樹(shù)的集合,每一個(gè)樹(shù)代表了一條微博的多層轉(zhuǎn)發(fā)。針對(duì)微博轉(zhuǎn)發(fā)樹(shù)本文設(shè)計(jì)了兩個(gè)轉(zhuǎn)發(fā)關(guān)系分析指標(biāo):轉(zhuǎn)發(fā)深度和轉(zhuǎn)發(fā)廣度。轉(zhuǎn)發(fā)深度:微博轉(zhuǎn)發(fā)樹(shù)中,定義某一棵轉(zhuǎn)發(fā)樹(shù)的轉(zhuǎn)發(fā)深度為該樹(shù)的層數(shù)。話題相關(guān)的所有轉(zhuǎn)發(fā)樹(shù)的最大轉(zhuǎn)發(fā)深度值為該話題的轉(zhuǎn)發(fā)深度。轉(zhuǎn)發(fā)廣度:微博轉(zhuǎn)發(fā)樹(shù)中,定義某一棵轉(zhuǎn)發(fā)樹(shù)的轉(zhuǎn)發(fā)廣度為該樹(shù)中孩子最多的微博節(jié)點(diǎn)的孩子數(shù)。話題相關(guān)的所有轉(zhuǎn)發(fā)樹(shù)的最大轉(zhuǎn)發(fā)廣度值為話題的轉(zhuǎn)發(fā)廣度。轉(zhuǎn)發(fā)網(wǎng)絡(luò)的深度和廣度是對(duì)話題轉(zhuǎn)發(fā)范圍的一種度量,不同的熱度的話題的轉(zhuǎn)發(fā)深度
【參考文獻(xiàn)】:
期刊論文
[1]面向熱點(diǎn)話題時(shí)間序列的有效聚類算法研究[J]. 韓忠明,陳妮,樂(lè)嘉錦,段大高,孫踐知. 計(jì)算機(jī)學(xué)報(bào). 2012(11)
[2]微博客中轉(zhuǎn)發(fā)行為的預(yù)測(cè)研究[J]. 張旸,路榮,楊青. 中文信息學(xué)報(bào). 2012(04)
[3]基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 路榮,項(xiàng)亮,劉明榮,楊青. 模式識(shí)別與人工智能. 2012(03)
[4]基于MB-LDA模型的微博主題挖掘[J]. 張晨逸,孫建伶,丁軼群. 計(jì)算機(jī)研究與發(fā)展. 2011(10)
[5]自然語(yǔ)言處理中主題模型的發(fā)展[J]. 徐戈,王厚峰. 計(jì)算機(jī)學(xué)報(bào). 2011(08)
[6]一種改進(jìn)的LDA主題模型[J]. 張小平,周雪忠,黃厚寬,馮奇,陳世波,焦宏官. 北京交通大學(xué)學(xué)報(bào). 2010(02)
[7]周期分類和Single-Pass聚類相結(jié)合的話題識(shí)別與跟蹤方法[J]. 稅儀冬,瞿有利,黃厚寬. 北京交通大學(xué)學(xué)報(bào). 2009(05)
博士論文
[1]社交網(wǎng)絡(luò)服務(wù)中信息傳播模式與輿論演進(jìn)過(guò)程研究[D]. 張彥超.北京交通大學(xué) 2012
[2]社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)角色以及群體演化研究[D]. 朱天.北京郵電大學(xué) 2011
[3]新聞話題表示模型和關(guān)聯(lián)追蹤技術(shù)研究[D]. 張曉艷.國(guó)防科學(xué)技術(shù)大學(xué) 2010
[4]網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估與趨勢(shì)感知的分析研究[D]. 蕭海東.上海交通大學(xué) 2007
碩士論文
[1]結(jié)合話題的社會(huì)網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)技術(shù)研究[D]. 李明濤.解放軍信息工程大學(xué) 2012
[2]中文微博客熱點(diǎn)話題檢測(cè)與跟蹤技術(shù)研究[D]. 孫勝平.北京交通大學(xué) 2011
[3]郵件通聯(lián)網(wǎng)絡(luò)變化檢測(cè)關(guān)鍵技術(shù)研究[D]. 劉楝.解放軍信息工程大學(xué) 2011
[4]微博客熱點(diǎn)話題發(fā)現(xiàn)策略研究[D]. 楊冠超.浙江大學(xué) 2011
[5]基于內(nèi)容分析的Blog話題檢測(cè)方法研究[D]. 何金艷.哈爾濱工業(yè)大學(xué) 2010
[6]話題檢測(cè)研究[D]. 樂(lè)可欣.北京交通大學(xué) 2009
[7]話題追蹤與演化分析技術(shù)研究[D]. 呂楠.解放軍信息工程大學(xué) 2009
本文編號(hào):3054379
【文章來(lái)源】:戰(zhàn)略支援部隊(duì)信息工程大學(xué)河南省
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
微博示例從中可以發(fā)現(xiàn)微博數(shù)據(jù)的一些特性:微博文本比較短小,并且除了正文文本內(nèi)容外,
第三章 話題多元信息表示模型第 17 頁(yè)圖8 話題多元關(guān)系的鄰接矩陣示例圖3.2 模型動(dòng)態(tài)更新機(jī)制3.2.1 話題多元信息的更新本文上一節(jié)介紹了微博多元信息表示模型的相關(guān)描述,在討論微博信息層時(shí)涉及到了時(shí)序的微博集合 , 1,2,...,tM t T及其關(guān)系集合 , 1, 2,...,tMR t T,其中tMR 包含了前 t 個(gè)時(shí)間片的微博關(guān)系的歷史數(shù)據(jù)。隨著時(shí)間的不斷積累,與話題相關(guān)的最新微博及其轉(zhuǎn)發(fā)不斷加入,基于對(duì)微博數(shù)據(jù)時(shí)效性的考慮,應(yīng)當(dāng)對(duì)歷史數(shù)據(jù)進(jìn)行適當(dāng)?shù)募s減,著重對(duì)當(dāng)前微博數(shù)據(jù)的分析。對(duì)模型進(jìn)行實(shí)時(shí)更新就是通過(guò)微博發(fā)布的時(shí)間間隔對(duì)微博信息層相關(guān)數(shù)據(jù)進(jìn)行約減的過(guò)程。本文借鑒微博話題生命周期理論[35],提出了基于微博關(guān)注度的話題多元信息表示模型的更新策略。定義微博的關(guān)注度 Att(d) 為微博轉(zhuǎn)發(fā)量 Rep(d):Att ( d ) Rep( d)(1)考慮微博關(guān)注度的時(shí)間積累過(guò)程,以微博發(fā)布所在時(shí)間片為第 1 個(gè)時(shí)間片,定義 A tt ( d)為微博關(guān)注度增量
如圖 11 所示,該圖是通過(guò)對(duì)微博轉(zhuǎn)發(fā)關(guān)系進(jìn)行提取得到的,包含了與特定微博存在直接或間接轉(zhuǎn)發(fā)關(guān)系的所有微博,圖中節(jié)點(diǎn)代表微博,邊代表了微博的轉(zhuǎn)發(fā)關(guān)系。圖11 微博轉(zhuǎn)發(fā)樹(shù)實(shí)例圖由圖可知,微博轉(zhuǎn)發(fā)樹(shù)中存在較為明顯的轉(zhuǎn)發(fā)層次,微博的轉(zhuǎn)發(fā)關(guān)系集合可以看做是多個(gè)轉(zhuǎn)發(fā)樹(shù)的集合,每一個(gè)樹(shù)代表了一條微博的多層轉(zhuǎn)發(fā)。針對(duì)微博轉(zhuǎn)發(fā)樹(shù)本文設(shè)計(jì)了兩個(gè)轉(zhuǎn)發(fā)關(guān)系分析指標(biāo):轉(zhuǎn)發(fā)深度和轉(zhuǎn)發(fā)廣度。轉(zhuǎn)發(fā)深度:微博轉(zhuǎn)發(fā)樹(shù)中,定義某一棵轉(zhuǎn)發(fā)樹(shù)的轉(zhuǎn)發(fā)深度為該樹(shù)的層數(shù)。話題相關(guān)的所有轉(zhuǎn)發(fā)樹(shù)的最大轉(zhuǎn)發(fā)深度值為該話題的轉(zhuǎn)發(fā)深度。轉(zhuǎn)發(fā)廣度:微博轉(zhuǎn)發(fā)樹(shù)中,定義某一棵轉(zhuǎn)發(fā)樹(shù)的轉(zhuǎn)發(fā)廣度為該樹(shù)中孩子最多的微博節(jié)點(diǎn)的孩子數(shù)。話題相關(guān)的所有轉(zhuǎn)發(fā)樹(shù)的最大轉(zhuǎn)發(fā)廣度值為話題的轉(zhuǎn)發(fā)廣度。轉(zhuǎn)發(fā)網(wǎng)絡(luò)的深度和廣度是對(duì)話題轉(zhuǎn)發(fā)范圍的一種度量,不同的熱度的話題的轉(zhuǎn)發(fā)深度
【參考文獻(xiàn)】:
期刊論文
[1]面向熱點(diǎn)話題時(shí)間序列的有效聚類算法研究[J]. 韓忠明,陳妮,樂(lè)嘉錦,段大高,孫踐知. 計(jì)算機(jī)學(xué)報(bào). 2012(11)
[2]微博客中轉(zhuǎn)發(fā)行為的預(yù)測(cè)研究[J]. 張旸,路榮,楊青. 中文信息學(xué)報(bào). 2012(04)
[3]基于隱主題分析和文本聚類的微博客中新聞話題的發(fā)現(xiàn)[J]. 路榮,項(xiàng)亮,劉明榮,楊青. 模式識(shí)別與人工智能. 2012(03)
[4]基于MB-LDA模型的微博主題挖掘[J]. 張晨逸,孫建伶,丁軼群. 計(jì)算機(jī)研究與發(fā)展. 2011(10)
[5]自然語(yǔ)言處理中主題模型的發(fā)展[J]. 徐戈,王厚峰. 計(jì)算機(jī)學(xué)報(bào). 2011(08)
[6]一種改進(jìn)的LDA主題模型[J]. 張小平,周雪忠,黃厚寬,馮奇,陳世波,焦宏官. 北京交通大學(xué)學(xué)報(bào). 2010(02)
[7]周期分類和Single-Pass聚類相結(jié)合的話題識(shí)別與跟蹤方法[J]. 稅儀冬,瞿有利,黃厚寬. 北京交通大學(xué)學(xué)報(bào). 2009(05)
博士論文
[1]社交網(wǎng)絡(luò)服務(wù)中信息傳播模式與輿論演進(jìn)過(guò)程研究[D]. 張彥超.北京交通大學(xué) 2012
[2]社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)角色以及群體演化研究[D]. 朱天.北京郵電大學(xué) 2011
[3]新聞話題表示模型和關(guān)聯(lián)追蹤技術(shù)研究[D]. 張曉艷.國(guó)防科學(xué)技術(shù)大學(xué) 2010
[4]網(wǎng)絡(luò)安全態(tài)勢(shì)評(píng)估與趨勢(shì)感知的分析研究[D]. 蕭海東.上海交通大學(xué) 2007
碩士論文
[1]結(jié)合話題的社會(huì)網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)技術(shù)研究[D]. 李明濤.解放軍信息工程大學(xué) 2012
[2]中文微博客熱點(diǎn)話題檢測(cè)與跟蹤技術(shù)研究[D]. 孫勝平.北京交通大學(xué) 2011
[3]郵件通聯(lián)網(wǎng)絡(luò)變化檢測(cè)關(guān)鍵技術(shù)研究[D]. 劉楝.解放軍信息工程大學(xué) 2011
[4]微博客熱點(diǎn)話題發(fā)現(xiàn)策略研究[D]. 楊冠超.浙江大學(xué) 2011
[5]基于內(nèi)容分析的Blog話題檢測(cè)方法研究[D]. 何金艷.哈爾濱工業(yè)大學(xué) 2010
[6]話題檢測(cè)研究[D]. 樂(lè)可欣.北京交通大學(xué) 2009
[7]話題追蹤與演化分析技術(shù)研究[D]. 呂楠.解放軍信息工程大學(xué) 2009
本文編號(hào):3054379
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3054379.html
最近更新
教材專著