在線(xiàn)社會(huì)網(wǎng)絡(luò)中影響力度量和流行度預(yù)測(cè)問(wèn)題研究
發(fā)布時(shí)間:2017-05-04 13:15
本文關(guān)鍵詞:在線(xiàn)社會(huì)網(wǎng)絡(luò)中影響力度量和流行度預(yù)測(cè)問(wèn)題研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展和Web 2.0時(shí)代的到來(lái),互聯(lián)網(wǎng)上涌現(xiàn)出各種類(lèi)型的社會(huì)媒體,深刻的改變了人們獲取信息和相互溝通的方式。社會(huì)媒體作為新的傳播媒介,大大弱化了傳統(tǒng)媒體在信息傳播中的主導(dǎo)地位,使信息傳播過(guò)程呈現(xiàn)出用戶(hù)既是信息源又是信息受眾的網(wǎng)絡(luò)化傳播模式。社會(huì)媒體的出現(xiàn)和發(fā)展大大降低了在線(xiàn)社會(huì)網(wǎng)絡(luò)中信息傳播的成本,使其呈現(xiàn)出傳播速度快、覆蓋范圍廣和社會(huì)影響力深等特點(diǎn)。然而已有研究指出,在線(xiàn)社會(huì)網(wǎng)絡(luò)中信息的流行程度呈現(xiàn)冪律分布,即僅有少量的信息可以覆蓋大范圍的用戶(hù),而大部分信息均不能變得流行。這種現(xiàn)象使研究者對(duì)以下幾個(gè)問(wèn)題比較關(guān)注:什么樣的信息能夠變得流行,即能否在信息傳播初期預(yù)測(cè)其流行程度;信息傳播過(guò)程涉及的諸多因素中,決定信息流行程度的關(guān)鍵因素是什么;如何衡量網(wǎng)絡(luò)中用戶(hù)傳播信息的能力并進(jìn)一步識(shí)別出在信息傳播過(guò)程中起到重要作用的用戶(hù)等。以上問(wèn)題涉及對(duì)在線(xiàn)社會(huì)網(wǎng)絡(luò)中影響力度量和流行度預(yù)測(cè)等問(wèn)題的研究,這是目前國(guó)內(nèi)外研究的熱點(diǎn)問(wèn)題,也是本文關(guān)注的主要研究問(wèn)題。本文以國(guó)家自然科學(xué)基金為依托,圍繞在線(xiàn)社會(huì)網(wǎng)絡(luò)上信息傳播過(guò)程這一研究主題,主要針對(duì)影響力度量和流行度預(yù)測(cè)兩個(gè)關(guān)鍵問(wèn)題展開(kāi)研究。本文的主要工作和創(chuàng)新點(diǎn)包括以下幾個(gè)方面:1.提出了一種基于網(wǎng)絡(luò)局部結(jié)構(gòu)的節(jié)點(diǎn)影響力測(cè)度。為實(shí)現(xiàn)對(duì)大規(guī)模在線(xiàn)社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)影響力準(zhǔn)確而高效的度量,本文提出了一種基于網(wǎng)絡(luò)局部結(jié)構(gòu)的局部結(jié)構(gòu)化中心性(Local Structural Centrality,簡(jiǎn)稱(chēng)LSC)測(cè)度。區(qū)別于已有局部測(cè)度,LSC測(cè)度綜合考慮了節(jié)點(diǎn)周?chē)植烤W(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)信息以及最近鄰節(jié)點(diǎn)的影響力反饋。具體的,節(jié)點(diǎn)周?chē)木植烤W(wǎng)絡(luò)由節(jié)點(diǎn)與其最近鄰和次近鄰節(jié)點(diǎn)組成,局部網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)信息包括網(wǎng)絡(luò)中節(jié)點(diǎn)的數(shù)量和節(jié)點(diǎn)間的拓?fù)溥B接。最近鄰節(jié)點(diǎn)的影響力反饋體現(xiàn)在節(jié)點(diǎn)的影響力為其最近鄰節(jié)點(diǎn)相對(duì)影響力的線(xiàn)性和。為驗(yàn)證LSC測(cè)度的有效性和魯棒性,本文在不同規(guī)模的真實(shí)網(wǎng)絡(luò)以及不同規(guī)模、不同度分布、不同社區(qū)結(jié)構(gòu)的人工網(wǎng)絡(luò)上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,LSC測(cè)度對(duì)節(jié)點(diǎn)影響力度量的性能優(yōu)于度中心性、k-殼中心性、介數(shù)中心性、接近中心性和局部中心性等測(cè)度,而且其性能不受網(wǎng)絡(luò)類(lèi)型的影響。此外,實(shí)驗(yàn)結(jié)果表明LSC測(cè)度可以更為細(xì)致的區(qū)分節(jié)點(diǎn)的影響力并能夠?qū)W(wǎng)絡(luò)中最有影響力的節(jié)點(diǎn)進(jìn)行更好地排序。由于僅考慮了節(jié)點(diǎn)周?chē)木植烤W(wǎng)絡(luò),LSC測(cè)度具有較低的時(shí)間復(fù)雜度,可在大規(guī)模網(wǎng)絡(luò)上直接應(yīng)用。2.研究了微博平臺(tái)上流行度預(yù)測(cè)問(wèn)題中的有效特征。本文通過(guò)將微博平臺(tái)上的流行度預(yù)測(cè)問(wèn)題形式化為分類(lèi)問(wèn)題,研究了分類(lèi)問(wèn)題中的有效特征。具體的,本文研究了兩種預(yù)測(cè)任務(wù),基于消息在其發(fā)布后1小時(shí)內(nèi)的轉(zhuǎn)發(fā)過(guò)程預(yù)測(cè)消息流行度(PPIH)和基于消息的前k次轉(zhuǎn)發(fā)預(yù)測(cè)消息流行度(PPkR)。本文將兩種預(yù)測(cè)任務(wù)分別形式化為預(yù)測(cè)消息流行度取值區(qū)間的多分類(lèi)任務(wù)和預(yù)測(cè)消息是否會(huì)流行的二分類(lèi)任務(wù),并采用了五種常用的分類(lèi)器(樸素貝葉斯、K近鄰、支持向量機(jī)、邏輯回歸和Bagging決策樹(shù))。為識(shí)別分類(lèi)任務(wù)中的有效特征,本文對(duì)消息轉(zhuǎn)發(fā)過(guò)程中的一系列特征進(jìn)行了研究分析,其中包括從底層用戶(hù)網(wǎng)絡(luò)中提取的轉(zhuǎn)發(fā)網(wǎng)絡(luò)特征和邊界網(wǎng)絡(luò)特征,以及從消息轉(zhuǎn)發(fā)鏈中提取的時(shí)間特征。進(jìn)一步,為消除用戶(hù)活躍度變化對(duì)分類(lèi)任務(wù)的影響,本文提出了微博時(shí)間的概念,并用其度量時(shí)間特征。通過(guò)在新浪微博數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明:在預(yù)測(cè)任務(wù)PPIH中,結(jié)合了全部特征的Bagging決策樹(shù)具有最優(yōu)的分類(lèi)性能,而且邊界網(wǎng)絡(luò)特征比剩余兩組特征更有效;在預(yù)測(cè)任務(wù)PPkR中,僅通過(guò)前10條轉(zhuǎn)發(fā)消息的時(shí)間特征就可以取得較好的分類(lèi)性能。進(jìn)一步,實(shí)驗(yàn)證實(shí),通過(guò)引入微博時(shí)間的概念,時(shí)間特征的分類(lèi)性能可以得到顯著提升。3.提出了一種基于增強(qiáng)泊松過(guò)程的微博消息流行度預(yù)測(cè)模型。該模型從建模微博消息轉(zhuǎn)發(fā)過(guò)程對(duì)應(yīng)時(shí)間序列的角度研究了流行度預(yù)測(cè)問(wèn)題。具體的,該模型基于增強(qiáng)泊松過(guò)程,建模了消息流行度的增長(zhǎng)機(jī)制,其中包括消息轉(zhuǎn)發(fā)過(guò)程中的三個(gè)關(guān)鍵因素:(1)消息的適應(yīng)力,表示消息吸引用戶(hù)轉(zhuǎn)發(fā)的能力;(2)冪律時(shí)間松弛方程,描述消息新穎性隨時(shí)間衰減的現(xiàn)象;(3)指數(shù)增強(qiáng)方程,描述消息轉(zhuǎn)發(fā)中存在的優(yōu)先連接現(xiàn)象。進(jìn)一步,為了消除用戶(hù)活躍度變化對(duì)于模型預(yù)測(cè)性能的影響,本文再次引入微博時(shí)間的概念并設(shè)計(jì)時(shí)間映射過(guò)程。通過(guò)在新浪微博數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明:相比于已有的預(yù)測(cè)模型,本文提出的模型可以更有效的建模微博消息的轉(zhuǎn)發(fā)過(guò)程并對(duì)消息流行度進(jìn)行更準(zhǔn)確的預(yù)測(cè)。此外,通過(guò)在模型中集成時(shí)間映射過(guò)程,可以去除用戶(hù)活躍度變化的影響并顯著地提高模型的預(yù)測(cè)性能。
【關(guān)鍵詞】:在線(xiàn)社會(huì)網(wǎng)絡(luò) 信息傳播 影響力度量 流行度預(yù)測(cè) 增強(qiáng)泊松過(guò)程
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP393.09
【目錄】:
- 摘要12-14
- ABSTRACT14-17
- 第1章 緒論17-33
- 1.1 研究背景17-20
- 1.2 本文的研究?jī)?nèi)容及研究意義20-22
- 1.3 相關(guān)研究工作22-29
- 1.3.1 影響力度量22-26
- 1.3.1.1 基于網(wǎng)絡(luò)局部結(jié)構(gòu)的測(cè)度22-23
- 1.3.1.2 基于網(wǎng)絡(luò)全局結(jié)構(gòu)的測(cè)度23-25
- 1.3.1.3 其他類(lèi)型的測(cè)度及討論25-26
- 1.3.2 流行度預(yù)測(cè)26-29
- 1.3.2.1 基于分類(lèi)/回歸的預(yù)測(cè)方法26-27
- 1.3.2.2 基于時(shí)間序列建模的預(yù)測(cè)方法27-28
- 1.3.2.3 其他類(lèi)型的預(yù)測(cè)方法及討論28-29
- 1.4 本文的主要工作及創(chuàng)新點(diǎn)29-31
- 1.5 本文的組織結(jié)構(gòu)31-33
- 第2章 相關(guān)預(yù)備知識(shí)33-50
- 2.1 網(wǎng)絡(luò)科學(xué)相關(guān)知識(shí)33-41
- 2.1.1 網(wǎng)絡(luò)基本拓?fù)湫再|(zhì)33-37
- 2.1.2 網(wǎng)絡(luò)模型37-40
- 2.1.2.1 BA無(wú)標(biāo)度網(wǎng)絡(luò)模型37-39
- 2.1.2.2 LFR網(wǎng)絡(luò)模型39-40
- 2.1.3 經(jīng)典傳染病模型40-41
- 2.2 機(jī)器學(xué)習(xí)中常用分類(lèi)器41-48
- 2.2.1 樸素貝葉斯42
- 2.2.2 K近鄰42-43
- 2.2.3 支持向量機(jī)43-45
- 2.2.4 邏輯回歸45-46
- 2.2.5 決策樹(shù)46-48
- 2.3 泊松過(guò)程48-49
- 2.4 本章小結(jié)49-50
- 第3章 基于網(wǎng)絡(luò)局部結(jié)構(gòu)的節(jié)點(diǎn)影響力測(cè)度50-72
- 3.1 引言50-51
- 3.2 中心性測(cè)度51-53
- 3.3 局部結(jié)構(gòu)化中心性測(cè)度53-55
- 3.4 實(shí)驗(yàn)設(shè)置55-57
- 3.4.1 數(shù)據(jù)集55-56
- 3.4.2 傳播模型及傳播概率56-57
- 3.4.3 評(píng)價(jià)標(biāo)準(zhǔn)57
- 3.5 實(shí)驗(yàn)與分析57-71
- 3.5.1 真實(shí)網(wǎng)絡(luò)57-64
- 3.5.1.1 測(cè)度性能分析57-60
- 3.5.1.2 排序最有影響力的節(jié)點(diǎn)60-64
- 3.5.2 人工網(wǎng)絡(luò)64-68
- 3.5.2.1 BA無(wú)標(biāo)度網(wǎng)絡(luò)64-66
- 3.5.2.2 LFR網(wǎng)絡(luò)66-68
- 3.5.3 SI模型68-70
- 3.5.4 區(qū)分節(jié)點(diǎn)影響力的能力70-71
- 3.6 本章小結(jié)71-72
- 第4章 微博平臺(tái)上流行度預(yù)測(cè)問(wèn)題有效特征研究72-86
- 4.1 引言72-73
- 4.2 問(wèn)題定義73-74
- 4.3 特征描述74-80
- 4.3.1 結(jié)構(gòu)特征74-77
- 4.3.1.1 轉(zhuǎn)發(fā)網(wǎng)絡(luò)特征74-76
- 4.3.1.2 邊界網(wǎng)絡(luò)特征76-77
- 4.3.2 時(shí)間特征77-79
- 4.3.3 討論79-80
- 4.4 實(shí)驗(yàn)設(shè)置80-81
- 4.4.1 數(shù)據(jù)集80
- 4.4.2 評(píng)價(jià)標(biāo)準(zhǔn)80-81
- 4.4.3 實(shí)現(xiàn)細(xì)節(jié)81
- 4.5 實(shí)驗(yàn)結(jié)果81-84
- 4.5.1 PP1H任務(wù)81-82
- 4.5.2 PPkR任務(wù)82-84
- 4.5.3 微博時(shí)間的有效性84
- 4.6 本章小結(jié)84-86
- 第5章 基于增強(qiáng)泊松過(guò)程的微博消息流行度預(yù)測(cè)模型86-105
- 5.1 引言86-87
- 5.2 問(wèn)題定義87-88
- 5.3 增強(qiáng)泊松過(guò)程模型概述88-89
- 5.4 微博平臺(tái)上流行度預(yù)測(cè)模型89-96
- 5.4.1 時(shí)間松弛方程89-90
- 5.4.2 增強(qiáng)方程90-91
- 5.4.3 用戶(hù)活躍度分析及時(shí)間映射過(guò)程91-93
- 5.4.4 預(yù)測(cè)模型93-96
- 5.4.4.1 模型輸入94
- 5.4.4.2 模型建立94-95
- 5.4.4.3 參數(shù)估計(jì)95
- 5.4.4.4 預(yù)測(cè)95-96
- 5.5 實(shí)驗(yàn)設(shè)置96-99
- 5.5.1 數(shù)據(jù)集96-97
- 5.5.2 比較方法97-98
- 5.5.3 評(píng)價(jià)標(biāo)準(zhǔn)98-99
- 5.6 實(shí)驗(yàn)結(jié)果99-103
- 5.6.1 預(yù)測(cè)結(jié)果99-102
- 5.6.2 模型參數(shù)分析102-103
- 5.7 本章小結(jié)103-105
- 第6章 總結(jié)與展望105-108
- 6.1 主要工作總結(jié)105-106
- 6.2 未來(lái)工作展望106-108
- 參考文獻(xiàn)108-121
- 致謝121-122
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄122-124
- 攻讀學(xué)位期間參與科研項(xiàng)目情況124-125
- 攻讀學(xué)位期間獲獎(jiǎng)情況125-126
- 外文論文126-162
- 學(xué)位論文評(píng)閱及答辯情化表162
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 胡慶成;尹煈q
本文編號(hào):345159
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/345159.html
最近更新
教材專(zhuān)著