基于動(dòng)態(tài)權(quán)重社交屬性網(wǎng)的鏈接預(yù)測(cè)
發(fā)布時(shí)間:2017-05-13 05:28
本文關(guān)鍵詞:基于動(dòng)態(tài)權(quán)重社交屬性網(wǎng)的鏈接預(yù)測(cè),由筆耕文化傳播整理發(fā)布。
【摘要】:社交網(wǎng)站為用戶提供了一個(gè)溝通、交流、自我展示的平臺(tái),人們的溝通交流越來越依賴社交網(wǎng)絡(luò)。社交網(wǎng)絡(luò)中的鏈接預(yù)測(cè)不僅有助于研究人員了解網(wǎng)絡(luò)的演化過程,還可以為社交網(wǎng)站的用戶提供好友推薦功能,增加社交網(wǎng)絡(luò)的稠密性,提高用戶對(duì)網(wǎng)站的粘性。社交網(wǎng)絡(luò)是一個(gè)隨時(shí)間而動(dòng)態(tài)變化的網(wǎng)絡(luò),社交網(wǎng)絡(luò)中有用戶實(shí)體之間的關(guān)系數(shù)據(jù),還有用戶實(shí)體的各種屬性信息包括性別、年齡、興趣等,鏈接預(yù)測(cè)應(yīng)充分利用這些數(shù)據(jù)進(jìn)行建模。本課題將鏈接預(yù)測(cè)問題視為一個(gè)二分類的機(jī)器學(xué)習(xí)問題,構(gòu)建動(dòng)態(tài)權(quán)重社交屬性網(wǎng),可以充分利用社交網(wǎng)絡(luò)提供的各種數(shù)據(jù)。提取網(wǎng)絡(luò)的時(shí)間特征、結(jié)構(gòu)信息特征、屬性信息特征,得到樣本的特征向量后,利用機(jī)器學(xué)習(xí)算法進(jìn)行鏈接預(yù)測(cè)。相對(duì)于規(guī)模龐大的社交網(wǎng)絡(luò),大多數(shù)用戶只會(huì)和網(wǎng)絡(luò)中的很少一部分用戶產(chǎn)生交互,建立朋友關(guān)系,本課題利用過濾器進(jìn)行樣本過濾,避免計(jì)算無關(guān)聯(lián)節(jié)點(diǎn)對(duì)的特征向量,從而提高預(yù)測(cè)算法的實(shí)時(shí)性,減少了訓(xùn)練過程和預(yù)測(cè)過程的時(shí)間。鏈接預(yù)測(cè)問題中存在大量的隱性負(fù)樣本,只有少量的顯性正樣本,鏈接預(yù)測(cè)問題中負(fù)樣本數(shù)量遠(yuǎn)遠(yuǎn)超出正樣本的數(shù)量,本課題使用負(fù)樣本欠抽樣的方法保持正負(fù)樣本數(shù)量均衡,提高監(jiān)督分類器的性能。社交網(wǎng)絡(luò)中的每個(gè)實(shí)體節(jié)點(diǎn)、每條鏈接都存在個(gè)體差異性,這是對(duì)網(wǎng)絡(luò)的節(jié)點(diǎn)和邊進(jìn)行加權(quán)的理論基礎(chǔ)。本課題在社交網(wǎng)絡(luò)上實(shí)驗(yàn)了多種節(jié)點(diǎn)加權(quán)和邊加權(quán)方案,在Google+數(shù)據(jù)集上實(shí)驗(yàn)結(jié)果表明在基于鄰域的共同鄰居的相似性特征計(jì)算方法中,當(dāng)節(jié)點(diǎn)的權(quán)重和節(jié)點(diǎn)中心性成反比時(shí),相比無權(quán)的網(wǎng)絡(luò)特征預(yù)測(cè)性能會(huì)提升;邊加權(quán)采用相似權(quán)也取得了預(yù)測(cè)性能的提升。社交網(wǎng)絡(luò)隨時(shí)間而動(dòng)態(tài)變化,提取動(dòng)態(tài)網(wǎng)絡(luò)的時(shí)間特征相比無時(shí)間特征,鏈接預(yù)測(cè)性能要好。
【關(guān)鍵詞】:鏈接預(yù)測(cè) 社交網(wǎng)絡(luò) 社交屬性網(wǎng) 加權(quán)網(wǎng)絡(luò) 動(dòng)態(tài)網(wǎng)絡(luò)
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP393.092
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第1章 緒論9-15
- 1.1 研究背景和意義9-10
- 1.1.1 課題研究背景9
- 1.1.2 課題研究的意義9-10
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-13
- 1.2.1 國(guó)內(nèi)外相關(guān)研究現(xiàn)狀10-12
- 1.2.2 存在的問題及挑戰(zhàn)12-13
- 1.3 本文主要研究?jī)?nèi)容13
- 1.4 本文組織結(jié)構(gòu)13-15
- 第2章 社交網(wǎng)絡(luò)鏈接預(yù)測(cè)方法介紹15-26
- 2.1 社交網(wǎng)絡(luò)問題相關(guān)定義15-19
- 2.1.1 社交網(wǎng)絡(luò)基礎(chǔ)15-16
- 2.1.2 社交網(wǎng)絡(luò)分析概述16-18
- 2.1.3 鏈接預(yù)測(cè)問題定義18-19
- 2.2 社交網(wǎng)絡(luò)鏈接預(yù)測(cè)方法19-25
- 2.2.1 基于節(jié)點(diǎn)對(duì)相似度的鏈接預(yù)測(cè)方法19-23
- 2.2.2 基于分類的鏈接預(yù)測(cè)方法23-25
- 2.3 本章小結(jié)25-26
- 第3章 動(dòng)態(tài)權(quán)重社交屬性網(wǎng)的特征提取26-45
- 3.1 動(dòng)態(tài)權(quán)重社交屬性網(wǎng)26-28
- 3.2 節(jié)點(diǎn)和邊的加權(quán)方法28-30
- 3.3 動(dòng)態(tài)權(quán)重社交屬性網(wǎng)的特征提取30-44
- 3.3.1 實(shí)驗(yàn)數(shù)據(jù)集31-33
- 3.3.2 實(shí)驗(yàn)評(píng)價(jià)標(biāo)準(zhǔn)33-34
- 3.3.3 局部相似度特征34-38
- 3.3.4 局部相似度指標(biāo)分析38-39
- 3.3.5 全局相似度特征39-41
- 3.3.6 時(shí)間特征41-42
- 3.3.7 特征總結(jié)42-43
- 3.3.8 動(dòng)態(tài)權(quán)重社交屬性網(wǎng)對(duì)鏈接預(yù)測(cè)的作用和意義43-44
- 3.4 本章小結(jié)44-45
- 第4章 鏈接預(yù)測(cè)及實(shí)驗(yàn)結(jié)果與分析45-54
- 4.1 鏈接預(yù)測(cè)步驟45-48
- 4.1.1 鏈接預(yù)測(cè)系統(tǒng)步驟45-46
- 4.1.2 樣本的抽取與過濾46-48
- 4.2 實(shí)驗(yàn)設(shè)計(jì)48-49
- 4.2.1 參數(shù)選擇49
- 4.3 實(shí)驗(yàn)結(jié)果及分析49-53
- 4.3.1 權(quán)重網(wǎng)絡(luò)和無權(quán)網(wǎng)絡(luò)對(duì)比50-52
- 4.3.2 動(dòng)態(tài)權(quán)重網(wǎng)和權(quán)重網(wǎng)對(duì)比52-53
- 4.4 本章小結(jié)53-54
- 結(jié)論54-56
- 參考文獻(xiàn)56-60
- 附錄60-62
- 致謝62
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫 前1條
1 張珊靚;周晏;;基于隨機(jī)游走的時(shí)間加權(quán)社會(huì)網(wǎng)絡(luò)鏈接預(yù)測(cè)算法[J];計(jì)算機(jī)應(yīng)用與軟件;2014年07期
本文關(guān)鍵詞:基于動(dòng)態(tài)權(quán)重社交屬性網(wǎng)的鏈接預(yù)測(cè),,由筆耕文化傳播整理發(fā)布。
本文編號(hào):361698
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/361698.html
最近更新
教材專著