社交網(wǎng)絡(luò)熱點(diǎn)話題傳播分析和預(yù)測
發(fā)布時間:2022-01-23 06:34
在線社交網(wǎng)絡(luò)已成為信息傳播的主要渠道和載體。近年來我國網(wǎng)絡(luò)事件層出不窮,網(wǎng)絡(luò)輿論呈現(xiàn)井噴態(tài)勢。在這一背景下,對熱點(diǎn)話題傳播進(jìn)行分析和預(yù)測,不僅要從宏觀上掌握熱點(diǎn)話題流行度的演化態(tài)勢,更耑要追蹤掌握傳播中群體的觀點(diǎn)變化,并對信息源頭進(jìn)行精確定位和快速控制。研究社交網(wǎng)絡(luò)熱點(diǎn)話題傳播分析和預(yù)測相關(guān)技術(shù)有助于加深對社交用戶行為的認(rèn)識、對社交現(xiàn)象的理解,對于國家安全和社會穩(wěn)定也具有重要的意義。本文圍繞著社交網(wǎng)絡(luò)中“熱點(diǎn)話題檢測和跟蹤”、“熱點(diǎn)話題流行度”和“熱點(diǎn)話題溯源”這三個核心問題,以微博為主要研究場景,從四個方面展開研究,分別是面向大規(guī)模短文本流的熱點(diǎn)話題動態(tài)檢測和跟蹤、基于深度學(xué)習(xí)的熱點(diǎn)話題流行度演化分析和預(yù)測、基于傳播關(guān)系的熱點(diǎn)話題傳播分析和溯源以及社交網(wǎng)絡(luò)熱點(diǎn)話題傳播分析和預(yù)測系統(tǒng)。主要工作和成果總結(jié)如下:(1)針對傳統(tǒng)話題檢測與跟蹤方法在大規(guī)模短文本流中準(zhǔn)確率不高、性能不理想的問題,本文提出了一種面向大規(guī)模短文本流的熱點(diǎn)話題動態(tài)檢測和跟蹤方法。通過對熱點(diǎn)話題數(shù)據(jù)集的實(shí)證分析,探究了熱點(diǎn)話題相關(guān)特點(diǎn)和規(guī)律,實(shí)現(xiàn)了突發(fā)事件的時空間異常檢測和相關(guān)熱點(diǎn)話題的動態(tài)檢測和跟蹤。最后將系統(tǒng)部署在...
【文章來源】:北京科技大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:128 頁
【學(xué)位級別】:博士
【部分圖文】:
圖2-2流行度演化模式分類PA??-23-??
經(jīng)典方法是Szabo和Huberman提出的SH模型[25],他們發(fā)現(xiàn)如果對信??息的流行度做對數(shù)處理,早期流行度和晚期流行度會呈現(xiàn)出很強(qiáng)的線性關(guān)聯(lián)??性,如圖2-4所示;而且隨機(jī)波動可以表現(xiàn)為加性噪聲的形式,利用這種強(qiáng)??關(guān)聯(lián)性,他們建立了線性回歸模型,并且以Digg網(wǎng)站上的帖子和YouTube??網(wǎng)站上的視頻作為研究對象進(jìn)行了模型驗(yàn)證。Bao等人考慮了網(wǎng)絡(luò)結(jié)構(gòu)特性??對流行度的影響,對SH模型進(jìn)行了改進(jìn)[26]。用SH模型做預(yù)測,對于那些??受到短暫關(guān)注的網(wǎng)絡(luò)信息會預(yù)測得比較準(zhǔn)確,而對于長時間流行的網(wǎng)絡(luò)信息??會有很大的誤差[25]。SH模型在預(yù)測那些具有不同流行度模式的網(wǎng)絡(luò)信息也??會不準(zhǔn)確,為了克服這個缺點(diǎn),Pinto等人將SH模型擴(kuò)展成多元回歸模型,??以多個歷史時間點(diǎn)的流行度作為自變量,并且考慮了流行度模式相似性的特??征[|37]。該模型對不同歷史時間點(diǎn)的流行度分配了不同的權(quán)重,這些權(quán)重可??以通過最小化樣本集的MRSE?(Mean?Relative?Squared?Error)訓(xùn)練出來。相??似性則度量了待預(yù)測網(wǎng)絡(luò)信息與樣本集的相似程度。??Kong等人通過機(jī)器學(xué)習(xí)算法對Twitter的Hashtag進(jìn)行了學(xué)習(xí)[n8]。他們??提出了兩個基本任務(wù):該Hashtag是否會在不久的未來流行起來;如果流行??-27-??
3.1問題描述??本節(jié)對Yang和Leskovec收集的Twitter數(shù)據(jù)集tweet7丨241進(jìn)行分析。如??圖3-1所示,橫軸表示設(shè)定的流行度值,縱軸表示Hashtag在其生命周期內(nèi)??獲得的總流行度大于相應(yīng)橫軸流行度值的Hashtag總數(shù),可以看出,大多數(shù)??Hashtag在其生命周期內(nèi)獲得的總流行度很小,只有少數(shù)Hashtag可以獲得??大量的流行度。???—?——‘….........??????^??L:??14?\??2'。丨?、*.%??i?*??I?8?????????????——??—+、.一*^-.''-.^_*—-???10*?10*?10*?1?4?10^?10*?1〇???Popularity??圖3-1?tweet7數(shù)據(jù)集中流行度分布??-33?-??
【參考文獻(xiàn)】:
期刊論文
[1]在線社交網(wǎng)絡(luò)影響力分析[J]. 吳信東,李毅,李磊. 計算機(jī)學(xué)報. 2014(04)
博士論文
[1]社交網(wǎng)絡(luò)信息傳播關(guān)鍵技術(shù)研究[D]. 蘇援.北京郵電大學(xué) 2018
[2]面向社交網(wǎng)絡(luò)的信息傳播關(guān)鍵技術(shù)研究[D]. 朱湘.國防科學(xué)技術(shù)大學(xué) 2017
[3]面向社交網(wǎng)絡(luò)的話題傳播關(guān)鍵技術(shù)研究[D]. 汪祥.國防科學(xué)技術(shù)大學(xué) 2015
[4]面向熱點(diǎn)新聞話題的文本處理技術(shù)研究[D]. 方瑩.北京理工大學(xué) 2015
[5]面向在線社交網(wǎng)絡(luò)輿情的信息傳播分析關(guān)鍵技術(shù)研究[D]. 梁政.國防科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]概率圖模型在話題檢測和信息傳播中的應(yīng)用研究[D]. 丁茜.北京郵電大學(xué) 2017
[2]互聯(lián)網(wǎng)中事件檢測與跟蹤系統(tǒng)設(shè)計與實(shí)現(xiàn)[D]. 于兆鵬.北京交通大學(xué) 2017
本文編號:3603798
【文章來源】:北京科技大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:128 頁
【學(xué)位級別】:博士
【部分圖文】:
圖2-2流行度演化模式分類PA??-23-??
經(jīng)典方法是Szabo和Huberman提出的SH模型[25],他們發(fā)現(xiàn)如果對信??息的流行度做對數(shù)處理,早期流行度和晚期流行度會呈現(xiàn)出很強(qiáng)的線性關(guān)聯(lián)??性,如圖2-4所示;而且隨機(jī)波動可以表現(xiàn)為加性噪聲的形式,利用這種強(qiáng)??關(guān)聯(lián)性,他們建立了線性回歸模型,并且以Digg網(wǎng)站上的帖子和YouTube??網(wǎng)站上的視頻作為研究對象進(jìn)行了模型驗(yàn)證。Bao等人考慮了網(wǎng)絡(luò)結(jié)構(gòu)特性??對流行度的影響,對SH模型進(jìn)行了改進(jìn)[26]。用SH模型做預(yù)測,對于那些??受到短暫關(guān)注的網(wǎng)絡(luò)信息會預(yù)測得比較準(zhǔn)確,而對于長時間流行的網(wǎng)絡(luò)信息??會有很大的誤差[25]。SH模型在預(yù)測那些具有不同流行度模式的網(wǎng)絡(luò)信息也??會不準(zhǔn)確,為了克服這個缺點(diǎn),Pinto等人將SH模型擴(kuò)展成多元回歸模型,??以多個歷史時間點(diǎn)的流行度作為自變量,并且考慮了流行度模式相似性的特??征[|37]。該模型對不同歷史時間點(diǎn)的流行度分配了不同的權(quán)重,這些權(quán)重可??以通過最小化樣本集的MRSE?(Mean?Relative?Squared?Error)訓(xùn)練出來。相??似性則度量了待預(yù)測網(wǎng)絡(luò)信息與樣本集的相似程度。??Kong等人通過機(jī)器學(xué)習(xí)算法對Twitter的Hashtag進(jìn)行了學(xué)習(xí)[n8]。他們??提出了兩個基本任務(wù):該Hashtag是否會在不久的未來流行起來;如果流行??-27-??
3.1問題描述??本節(jié)對Yang和Leskovec收集的Twitter數(shù)據(jù)集tweet7丨241進(jìn)行分析。如??圖3-1所示,橫軸表示設(shè)定的流行度值,縱軸表示Hashtag在其生命周期內(nèi)??獲得的總流行度大于相應(yīng)橫軸流行度值的Hashtag總數(shù),可以看出,大多數(shù)??Hashtag在其生命周期內(nèi)獲得的總流行度很小,只有少數(shù)Hashtag可以獲得??大量的流行度。???—?——‘….........??????^??L:??14?\??2'。丨?、*.%??i?*??I?8?????????????——??—+、.一*^-.''-.^_*—-???10*?10*?10*?1?4?10^?10*?1〇???Popularity??圖3-1?tweet7數(shù)據(jù)集中流行度分布??-33?-??
【參考文獻(xiàn)】:
期刊論文
[1]在線社交網(wǎng)絡(luò)影響力分析[J]. 吳信東,李毅,李磊. 計算機(jī)學(xué)報. 2014(04)
博士論文
[1]社交網(wǎng)絡(luò)信息傳播關(guān)鍵技術(shù)研究[D]. 蘇援.北京郵電大學(xué) 2018
[2]面向社交網(wǎng)絡(luò)的信息傳播關(guān)鍵技術(shù)研究[D]. 朱湘.國防科學(xué)技術(shù)大學(xué) 2017
[3]面向社交網(wǎng)絡(luò)的話題傳播關(guān)鍵技術(shù)研究[D]. 汪祥.國防科學(xué)技術(shù)大學(xué) 2015
[4]面向熱點(diǎn)新聞話題的文本處理技術(shù)研究[D]. 方瑩.北京理工大學(xué) 2015
[5]面向在線社交網(wǎng)絡(luò)輿情的信息傳播分析關(guān)鍵技術(shù)研究[D]. 梁政.國防科學(xué)技術(shù)大學(xué) 2014
碩士論文
[1]概率圖模型在話題檢測和信息傳播中的應(yīng)用研究[D]. 丁茜.北京郵電大學(xué) 2017
[2]互聯(lián)網(wǎng)中事件檢測與跟蹤系統(tǒng)設(shè)計與實(shí)現(xiàn)[D]. 于兆鵬.北京交通大學(xué) 2017
本文編號:3603798
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3603798.html
最近更新
教材專著