在線社交網(wǎng)絡(luò)中的影響力分析及應(yīng)用研究
發(fā)布時(shí)間:2020-07-16 05:05
【摘要】:隨著移動(dòng)互聯(lián)網(wǎng)以及移動(dòng)終端的飛速發(fā)展,類型各異的在線社交網(wǎng)絡(luò)迅速普及。社交網(wǎng)絡(luò)的出現(xiàn),極大的豐富了用戶的社交需求。不同于傳統(tǒng)的信息媒體,在社交網(wǎng)絡(luò)中,人們不僅是信息的瀏覽者,而且可以發(fā)布以及傳播信息。在互聯(lián)網(wǎng)時(shí)代,在線社交網(wǎng)絡(luò)已然成為人們獲取信息、傳播信息以及溝通感情的重要媒介。隨著在線社交網(wǎng)絡(luò)的廣泛普及,社交用戶的規(guī)模呈爆炸式增長,并且產(chǎn)生了豐富的社交活動(dòng)數(shù)據(jù),這些數(shù)據(jù)蘊(yùn)含著重要的信息,對(duì)這類數(shù)據(jù)的深入研究可以很好地挖掘用戶的社交影響力,進(jìn)而推動(dòng)信息傳播、網(wǎng)絡(luò)營銷、社區(qū)發(fā)現(xiàn)、行為預(yù)測(cè)、社交推薦以及社交廣告等社交應(yīng)用的研究,這些應(yīng)用無疑會(huì)對(duì)社交網(wǎng)絡(luò)平臺(tái)以及社交用戶產(chǎn)生巨大的幫助。由于社交影響力具有巨大的商業(yè)價(jià)值以及應(yīng)用價(jià)值,在線社交網(wǎng)絡(luò)中的用戶影響力及應(yīng)用研究受到了學(xué)術(shù)界和應(yīng)用界的廣泛關(guān)注。類型各異的在線社交網(wǎng)站以及多樣化的社交數(shù)據(jù)給在線社交網(wǎng)絡(luò)中的影響力分析及應(yīng)用研究帶來發(fā)展機(jī)遇的同時(shí)也帶來了嚴(yán)峻的挑戰(zhàn)。雖然國內(nèi)外的研究人員在該領(lǐng)域取得了一系列的研究成果,然而現(xiàn)有的成果在社交影響力度量的準(zhǔn)確性以及社交網(wǎng)絡(luò)數(shù)據(jù)挖掘的深度性等方面仍有不足。因此,本文針對(duì)在線社交網(wǎng)絡(luò)中的多樣化應(yīng)用需求以及現(xiàn)有成果的不足,利用社交網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)以及用戶在社交網(wǎng)絡(luò)中的行為信息,深入研究了在線社交網(wǎng)絡(luò)中用戶影響力的度量以及基于用戶影響力的重要社交應(yīng)用(即病毒營銷與社區(qū)發(fā)現(xiàn)),取得了以下研究成果:(1)針對(duì)社交網(wǎng)絡(luò)中的用戶影響力度量問題,根據(jù)基于活動(dòng)的社交網(wǎng)絡(luò)的獨(dú)有特性,提出了一種基于協(xié)同過濾的用戶影響力度量方法。為了研究基于活動(dòng)的社交網(wǎng)絡(luò)中用戶更為細(xì)粒度的影響力,將用戶在活動(dòng)層面的影響力定義為用戶在每個(gè)活動(dòng)上能夠影響的好友比例,并且根據(jù)用戶在過去所參與的活動(dòng)信息,構(gòu)造了用戶-活動(dòng)影響力矩陣。針對(duì)用戶-活動(dòng)影響力矩陣中的未知元素預(yù)測(cè)問題,提出了一種混合協(xié)同過濾模型,該模型同時(shí)將活動(dòng)近鄰方法以及用戶近鄰方法融入到了矩陣分解方法中。為了進(jìn)一步提高預(yù)測(cè)的準(zhǔn)確度,利用基于活動(dòng)的社交網(wǎng)絡(luò)中的多元屬性,即活動(dòng)的文本內(nèi)容,活動(dòng)的地理位置以及活動(dòng)的組織者,提出了活動(dòng)近鄰發(fā)現(xiàn)方法以及用戶近鄰發(fā)現(xiàn)方法。最后,利用真實(shí)的基于活動(dòng)的社交網(wǎng)絡(luò)數(shù)據(jù)集,即豆瓣同城數(shù)據(jù)集,開展了實(shí)驗(yàn)驗(yàn)證,實(shí)驗(yàn)結(jié)果表明,所提的混合協(xié)同過濾模型可以準(zhǔn)確的度量用戶在活動(dòng)層面的社交影響力。(2)針對(duì)社交網(wǎng)絡(luò)中的病毒營銷問題,融合用戶的主題偏好以及地理位置偏好,提出了一種位置感知的定向影響力最大化方法。針對(duì)一個(gè)包含主題信息以及地理位置信息的在線查詢,基于R樹,設(shè)計(jì)了融合主題信息的TR樹索引結(jié)構(gòu),以快速找到查詢的目標(biāo)用戶以及計(jì)算用戶對(duì)查詢的偏好值。根據(jù)位置感知的特定查詢,基于獲取的用戶偏好,定義了融入用戶偏好的種子集合影響范圍函數(shù)。為了找到種子用戶集合,設(shè)計(jì)了高效的近似求解算法。其中,通過利用線下構(gòu)造的用戶影響力索引結(jié)構(gòu)以及快速的線上影響力估計(jì)方法,近似算法能夠高效且準(zhǔn)確的找到種子用戶集合。為了進(jìn)一步提高查詢的效率,基于對(duì)用戶影響力的快速估算,設(shè)計(jì)了快速的啟發(fā)式求解算法。最后,基于真實(shí)的社交網(wǎng)絡(luò)數(shù)據(jù)集開展了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,針對(duì)位置感知的在線查詢,所提的近似算法和啟發(fā)式算法不僅能夠得到高精度的查詢結(jié)果,而且具有很高的查詢效率。(3)針對(duì)社交網(wǎng)絡(luò)中的社區(qū)發(fā)現(xiàn)問題,考慮基于活動(dòng)的社交網(wǎng)絡(luò)中的異構(gòu)信息,提出了一種基于用戶影響力的社區(qū)發(fā)現(xiàn)方法。首先,根據(jù)線上的社交關(guān)系網(wǎng)絡(luò)以及線下的用戶參與活動(dòng)網(wǎng)絡(luò),提出了融合網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)以及用戶行為信息的社交影響力度量方法。在該方法中,利用線上網(wǎng)絡(luò)中相鄰用戶間的共同鄰居信息,度量了基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的社交影響力;利用用戶的歷史行為信息以及社交活動(dòng)的多元屬性,計(jì)算用戶在三個(gè)方面的偏好(即活動(dòng)主題、活動(dòng)區(qū)域以及活動(dòng)組織者)的相似度,度量了基于用戶行為的社交影響力。其次,基于度量的社交影響力,設(shè)計(jì)了融入近鄰約束的深度自編碼器以獲取用戶社區(qū)導(dǎo)向的潛在多維表達(dá)。再次,利用用戶的潛在表達(dá),基于k-means聚類算法,挖掘基于活動(dòng)的社交網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)。最后,基于真實(shí)的社交網(wǎng)絡(luò)數(shù)據(jù)集開展了實(shí)驗(yàn)分析,實(shí)驗(yàn)結(jié)果表明,所提的社區(qū)發(fā)現(xiàn)算法能夠有效地發(fā)現(xiàn)基于活動(dòng)的社交網(wǎng)絡(luò)中緊密的社區(qū)結(jié)構(gòu)。
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP393.09
【圖文】:
處于非激活態(tài)。在每一次迭代中,激活態(tài)的節(jié)點(diǎn)以激活態(tài)的鄰居節(jié)點(diǎn),并且,每個(gè)節(jié)點(diǎn)累加其鄰居節(jié)點(diǎn)活態(tài)的節(jié)點(diǎn)累加所有鄰居節(jié)點(diǎn)的影響力(即所有處之和)大于其自身的閾值時(shí),該節(jié)點(diǎn)被激活,并且其鄰居節(jié)點(diǎn);否則,該節(jié)點(diǎn)仍然處于非激活態(tài)。重新的節(jié)點(diǎn)被激活。與獨(dú)立級(jí)聯(lián)模型相同,該模型也響概率/?(/,_/)是已知的。逡逑染病模型逡逑染病模型SIR是由William邋Kermack等人提出的動(dòng)絡(luò)中的節(jié)點(diǎn)可能處于S、八i?三種狀態(tài)。其中S),也就是節(jié)點(diǎn)目前處于健康狀態(tài),但是有可能被其(Infected),也就是節(jié)點(diǎn)目前處于患病狀態(tài),其有除狀態(tài)(Recovered),也就是患病后被治愈的狀態(tài),,不可能被再次感染。網(wǎng)絡(luò)中節(jié)點(diǎn)狀態(tài)間的轉(zhuǎn)化順序
a)生成文檔-主題概率分布&?且0;—般也是稀疏b)生成單詞個(gè)數(shù)其中,尸0/觀3/2(()是參泊松分布;逡逑c)對(duì)文檔m中的每個(gè)單詞《邋e邋[1,2,...,,逡逑i生成主題分布 ̄邋Mw/?),其中,)為參多項(xiàng)式分布;逡逑ii邋生成單詞邋w,?邋?邋 ̄邐J。逡逑圖2-3是LDA的圖模型表示。基于以上生成過程,可以得到整個(gè)布:逡逑Nm逡逑{^ZmAn^\(X^)邋=邋Y{p{Wm,n\(P,m)p{Zm,n\ei,)p{em\a)p(^\P)-7=1逡逑LDA最初的參數(shù)推斷方式為變分推斷(Variational邋Inference)邋[84],采用更為簡單的吉布斯采樣(Gibbs邋Sampling)對(duì)參數(shù)進(jìn)行推斷。逡逑
圖3-1基于活動(dòng)的社交網(wǎng)絡(luò)的表示逡逑3.2.問題描述以及模型框架逡逑圖3-1表示一個(gè)基于活動(dòng)的社交網(wǎng)絡(luò)。在該社交網(wǎng)絡(luò)中,用戶和活動(dòng)是兩個(gè)逡逑重要的組成部分,用戶是社交活動(dòng)的參與者,他們之間通過線上的社交關(guān)系組成逡逑一個(gè)線上社交網(wǎng)絡(luò)。每個(gè)社交活動(dòng)具有多種信息,包括文本內(nèi)容、地理位置以及逡逑活動(dòng)組織者等。其中,文本內(nèi)容信息描述了活動(dòng)的主題以及具體內(nèi)容,地理位置逡逑信息描述了活動(dòng)的具體舉辦地點(diǎn),通常用經(jīng)煒度表示,組織者信息描述了活動(dòng)的逡逑舉辦者。值得注意的是,不同的社交活動(dòng)可能在同一個(gè)地理位置舉辦,同一個(gè)組逡逑織者也可能組織過多個(gè)社交活動(dòng)。在基于活動(dòng)的社交網(wǎng)絡(luò)中,用戶可以主動(dòng)搜索逡逑活動(dòng),也可以看到好友分享的活動(dòng),同時(shí)在每個(gè)社交活動(dòng)頁面,用戶可以看到線逡逑上報(bào)名參加該活動(dòng)的所有參與者。在看到感興趣的活動(dòng)后
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP393.09
【圖文】:
處于非激活態(tài)。在每一次迭代中,激活態(tài)的節(jié)點(diǎn)以激活態(tài)的鄰居節(jié)點(diǎn),并且,每個(gè)節(jié)點(diǎn)累加其鄰居節(jié)點(diǎn)活態(tài)的節(jié)點(diǎn)累加所有鄰居節(jié)點(diǎn)的影響力(即所有處之和)大于其自身的閾值時(shí),該節(jié)點(diǎn)被激活,并且其鄰居節(jié)點(diǎn);否則,該節(jié)點(diǎn)仍然處于非激活態(tài)。重新的節(jié)點(diǎn)被激活。與獨(dú)立級(jí)聯(lián)模型相同,該模型也響概率/?(/,_/)是已知的。逡逑染病模型逡逑染病模型SIR是由William邋Kermack等人提出的動(dòng)絡(luò)中的節(jié)點(diǎn)可能處于S、八i?三種狀態(tài)。其中S),也就是節(jié)點(diǎn)目前處于健康狀態(tài),但是有可能被其(Infected),也就是節(jié)點(diǎn)目前處于患病狀態(tài),其有除狀態(tài)(Recovered),也就是患病后被治愈的狀態(tài),,不可能被再次感染。網(wǎng)絡(luò)中節(jié)點(diǎn)狀態(tài)間的轉(zhuǎn)化順序
a)生成文檔-主題概率分布&?且0;—般也是稀疏b)生成單詞個(gè)數(shù)其中,尸0/觀3/2(()是參泊松分布;逡逑c)對(duì)文檔m中的每個(gè)單詞《邋e邋[1,2,...,,逡逑i生成主題分布 ̄邋Mw/?),其中,)為參多項(xiàng)式分布;逡逑ii邋生成單詞邋w,?邋?邋 ̄邐J。逡逑圖2-3是LDA的圖模型表示。基于以上生成過程,可以得到整個(gè)布:逡逑Nm逡逑{^ZmAn^\(X^)邋=邋Y{p{Wm,n\(P,m)p{Zm,n\ei,)p{em\a)p(^\P)-7=1逡逑LDA最初的參數(shù)推斷方式為變分推斷(Variational邋Inference)邋[84],采用更為簡單的吉布斯采樣(Gibbs邋Sampling)對(duì)參數(shù)進(jìn)行推斷。逡逑
圖3-1基于活動(dòng)的社交網(wǎng)絡(luò)的表示逡逑3.2.問題描述以及模型框架逡逑圖3-1表示一個(gè)基于活動(dòng)的社交網(wǎng)絡(luò)。在該社交網(wǎng)絡(luò)中,用戶和活動(dòng)是兩個(gè)逡逑重要的組成部分,用戶是社交活動(dòng)的參與者,他們之間通過線上的社交關(guān)系組成逡逑一個(gè)線上社交網(wǎng)絡(luò)。每個(gè)社交活動(dòng)具有多種信息,包括文本內(nèi)容、地理位置以及逡逑活動(dòng)組織者等。其中,文本內(nèi)容信息描述了活動(dòng)的主題以及具體內(nèi)容,地理位置逡逑信息描述了活動(dòng)的具體舉辦地點(diǎn),通常用經(jīng)煒度表示,組織者信息描述了活動(dòng)的逡逑舉辦者。值得注意的是,不同的社交活動(dòng)可能在同一個(gè)地理位置舉辦,同一個(gè)組逡逑織者也可能組織過多個(gè)社交活動(dòng)。在基于活動(dòng)的社交網(wǎng)絡(luò)中,用戶可以主動(dòng)搜索逡逑活動(dòng),也可以看到好友分享的活動(dòng),同時(shí)在每個(gè)社交活動(dòng)頁面,用戶可以看到線逡逑上報(bào)名參加該活動(dòng)的所有參與者。在看到感興趣的活動(dòng)后
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王超瓊;陳s
本文編號(hào):2757560
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/2757560.html
最近更新
教材專著