社會網(wǎng)絡(luò)中用戶影響力分析技術(shù)研究
發(fā)布時間:2018-01-02 08:07
本文關(guān)鍵詞:社會網(wǎng)絡(luò)中用戶影響力分析技術(shù)研究 出處:《哈爾濱工業(yè)大學(xué)》2015年博士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 社會網(wǎng)絡(luò) 影響力分析 結(jié)構(gòu)洞 社區(qū) 度分布 話題演化
【摘要】:互聯(lián)網(wǎng)上社會性媒體迅速發(fā)展。社會性網(wǎng)絡(luò)媒體具有話題多變且演化特性,用戶海量性,人們交互過程中所形成的關(guān)聯(lián)網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜且動態(tài)變化。由于社會性網(wǎng)絡(luò)媒體的開放性和低門檻性,以及人群素質(zhì)的巨大差異以及群眾訴求表達(dá)方式的多面性,信息傳播的快速性,傳播范圍的不可控性都給社會化網(wǎng)絡(luò)媒體的管理帶來了新問題。媒體中的高影響力用戶非;钴S且傳播正面信息。識別社會化媒體中的高影響力用戶,利用其對社會輿論進(jìn)行正面宣傳引導(dǎo),對維護(hù)社會安定、管理社會秩序、使網(wǎng)絡(luò)信息走向健康發(fā)展具有重要作用和價值。本文研究社會性網(wǎng)絡(luò)中影響力分析的關(guān)鍵技術(shù),主要內(nèi)容包括:(1)分析影響力的多維屬性及演化規(guī)律。在社會化網(wǎng)絡(luò)中影響力具有社會性、網(wǎng)絡(luò)性以及動態(tài)變化特征。提出影響廣度、影響深度和影響持續(xù)程度三維量化指標(biāo),在社會性和網(wǎng)絡(luò)性兩個角度分析基礎(chǔ)上綜合量化影響力。綜合用戶在網(wǎng)絡(luò)中關(guān)聯(lián)性、用戶間交互強(qiáng)度和文章質(zhì)量所決定的交互深刻程度三種行為特征,多角度評價用戶影響力。本文改進(jìn)Page Rank算法,先從整體角度建立用戶間關(guān)聯(lián)矩陣,再從局部角度分析用戶行為,建立用戶影響力綜合分析模型。改進(jìn)個性化指向增強(qiáng)關(guān)系,改進(jìn)后提高了用戶間關(guān)聯(lián)緊密度。在影響力動態(tài)變化特性上,從長期性和穩(wěn)定性角度分析影響力演化模式。對天涯網(wǎng)絡(luò)論壇數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,部分高影響力用戶是論壇中的活躍用戶,并且長期具有高影響力用戶實(shí)際引導(dǎo)網(wǎng)絡(luò)論壇輿論走向。(2)研究影響機(jī)理與網(wǎng)絡(luò)結(jié)構(gòu)間的關(guān)系。處于網(wǎng)絡(luò)中關(guān)鍵位置的節(jié)點(diǎn)產(chǎn)生重要作用,研究結(jié)構(gòu)洞用戶的識別和影響力分析算法。結(jié)構(gòu)洞是不同社區(qū)間的關(guān)聯(lián)區(qū)域,網(wǎng)絡(luò)社區(qū)和結(jié)構(gòu)洞是從兩個不同角度表示網(wǎng)絡(luò)的宏觀屬性,在劃分社區(qū)的同時考察節(jié)點(diǎn)的結(jié)構(gòu)洞特性。結(jié)構(gòu)洞用戶在網(wǎng)絡(luò)中的關(guān)聯(lián)作用不同于社區(qū)內(nèi)高影響力用戶。采用多級劃分思想識別社區(qū),為了快速合并局部關(guān)聯(lián)緊密區(qū)域,提出多種節(jié)點(diǎn)合并模式進(jìn)行圖壓縮并采用導(dǎo)率函數(shù)確定社區(qū)邊界,在壓縮圖進(jìn)行精確劃分基礎(chǔ)上再進(jìn)行回溯識別社區(qū),算法復(fù)雜度低且能實(shí)現(xiàn)大規(guī)模圖的有效劃分。依據(jù)結(jié)構(gòu)洞用戶在社區(qū)內(nèi)外關(guān)聯(lián)性,提出結(jié)構(gòu)洞用戶影響力分析算法。(3)社會化網(wǎng)絡(luò)的大規(guī)模性給影響力分析帶來了挑戰(zhàn),研究影響力和網(wǎng)絡(luò)結(jié)構(gòu)特征的關(guān)聯(lián)關(guān)系,提出快速影響力分析方法。對天涯網(wǎng)絡(luò)論壇真實(shí)數(shù)據(jù)集的統(tǒng)計結(jié)果表明,入度和出度分布具有冪律性,且入度為0的用戶日平均比例86.16%,出度為1的用戶日平均比例64.98%。本文從降低數(shù)據(jù)存儲空間和提高運(yùn)行效率出發(fā),在真實(shí)的網(wǎng)絡(luò)關(guān)聯(lián)圖上,利用度關(guān)聯(lián)的偏斜特性,提出基于集合劃分的數(shù)據(jù)高效節(jié)約存儲及快速用戶排序算法SD-Rank。SD-Rank根據(jù)入度是否為0劃分為兩個集合。對入度為0集合按出度構(gòu)造鏈接表改進(jìn)Page Rank算法。SD-Rank時空復(fù)雜性為O(V’),V’為入度非0節(jié)點(diǎn)集。SD-Rank排序效率比Page Rank算法提高了39%,并且SD-Rank算法運(yùn)算速度高于基于矩陣的非冗余正交基計算的Colibri算法運(yùn)算速度。(4)研究影響力與演化信息間的關(guān)系。針對影響力隨事件的動態(tài)變化特性,分析用戶在共同參與主題中的顯式和隱式關(guān)聯(lián)、用戶在事件不同發(fā)展階段的影響強(qiáng)度,在事件演化分析過程中從這兩個方面分析用戶的動態(tài)影響;谟脩粼谠掝}上具有隱式關(guān)聯(lián)的前提,首先提出多種距離度量方法,并在此基礎(chǔ)上提出全局性事件和子事件識別方法。在主題擴(kuò)散和演化過程中,分析事件的擴(kuò)散過程和演化趨勢,區(qū)分即時影響和延遲影響,延遲影響隨時間呈指數(shù)衰減。最后,在用戶間交互所產(chǎn)生的直接影響和話題內(nèi)間接影響基礎(chǔ)上,分析話題和用戶影響力的波動性以及二者的峰值共現(xiàn)性,提出基于熱點(diǎn)事件演化的用戶影響力計算模型。在論壇和微博數(shù)據(jù)集上,基于演化的熱點(diǎn)話題發(fā)現(xiàn)算法精確率和召回率高于靜態(tài)視圖的識別率。本文算法很好地利用了用戶在網(wǎng)絡(luò)中的全局關(guān)聯(lián)關(guān)系、有機(jī)結(jié)合了熱點(diǎn)事件與用戶影響的峰值性,在多種比較算法中獲得了最好的影響力排序結(jié)果。
[Abstract]:This paper studies the relationship between the influence mechanism and the network structure . The key technology of the influence analysis in the social network is analyzed . The key technology of the influence analysis in the social network is analyzed . ( 3 ) The large scale of social network brings challenges , influence and network structure characteristics , and proposes a fast impact analysis method . The results show that the accuracy rate and recall rate of user ' s influence are higher than that of the static view . The results show that the accuracy rate and recall rate of the user are higher than that of the static view .
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:G206;TP393.07
,
本文編號:1368367
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1368367.html
最近更新
教材專著