基于PU學(xué)習(xí)的鏈接預(yù)測方法研究
發(fā)布時間:2023-08-03 18:43
隨著以互聯(lián)網(wǎng)為代表的網(wǎng)絡(luò)信息技術(shù)的迅速發(fā)展,人們獲得了多種多樣的復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)。鏈接預(yù)測作為復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)分析和挖掘的重要問題,一直受到各領(lǐng)域研究者的廣泛關(guān)注。鏈接預(yù)測利用數(shù)據(jù)挖掘的理論與技術(shù)輔助分析網(wǎng)絡(luò)的結(jié)構(gòu)變化情況,研究未來兩個節(jié)點之間是否會形成鏈接的問題。傳統(tǒng)的鏈接預(yù)測方法主要是針對節(jié)點和鏈接類型單一的同質(zhì)網(wǎng)絡(luò)設(shè)計的。然而,現(xiàn)實的網(wǎng)絡(luò)大多是異質(zhì)的,網(wǎng)絡(luò)中有多種類型的節(jié)點和鏈接,導(dǎo)致網(wǎng)絡(luò)節(jié)點對間的關(guān)系更加復(fù)雜。節(jié)點對間的關(guān)系可以是一條直接的鏈接,也可以是一條包含多種類型節(jié)點和鏈接的路徑。因此,在異質(zhì)網(wǎng)絡(luò)中鏈接預(yù)測問題就擴展為關(guān)系預(yù)測問題。鏈接預(yù)測常常被視為監(jiān)督學(xué)習(xí)框架下的二分類問題,網(wǎng)絡(luò)中存在目標(biāo)鏈接的節(jié)點對視為正例,否則視為反例。實際上,這些反例可能是不可信的(即部分節(jié)點對在未來可能會形成目標(biāo)鏈接),直接將這些節(jié)點對視為反例進(jìn)行訓(xùn)練將會降低預(yù)測模型的性能。本課題嘗試從PU學(xué)習(xí)的角度研究復(fù)雜信息網(wǎng)絡(luò)中的鏈接/關(guān)系預(yù)測問題,將信息網(wǎng)絡(luò)中存在目標(biāo)鏈接/關(guān)系的節(jié)點對視為正例,將暫不存在目標(biāo)鏈接/關(guān)系的節(jié)點對視為未標(biāo)記例而非反例。針對正例集合P和未標(biāo)記集合U之間樣本數(shù)量嚴(yán)重不平衡的問題,研究如...
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.2 研究現(xiàn)狀
1.3 論文的研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第二章 復(fù)雜網(wǎng)絡(luò)鏈接預(yù)測方法調(diào)研
2.1 復(fù)雜網(wǎng)絡(luò)簡介
2.1.1 復(fù)雜網(wǎng)絡(luò)的定義
2.1.2 異質(zhì)信息網(wǎng)絡(luò)
2.2 鏈接預(yù)測問題
2.2.1 定義與形式化描述
2.2.2 鏈接預(yù)測的主要方法
2.2.3 鏈接預(yù)測問題面臨的挑戰(zhàn)
2.3 關(guān)系預(yù)測問題
2.4 基于PU學(xué)習(xí)的鏈接/關(guān)系預(yù)測問題
2.4.1 PU學(xué)習(xí)及其主要方法
2.4.2 PU學(xué)習(xí)與鏈接預(yù)測
2.4.3 PU學(xué)習(xí)與關(guān)系預(yù)測
2.5 本章小結(jié)
第三章 基于PU學(xué)習(xí)的同質(zhì)信息網(wǎng)絡(luò)鏈接預(yù)測框架PULP
3.1 同質(zhì)信息網(wǎng)絡(luò)的拓?fù)涮卣鞅硎?br> 3.2 基于PU學(xué)習(xí)的同質(zhì)信息網(wǎng)絡(luò)鏈接預(yù)測方法
3.2.1 可靠反例選取算法——SemiPUclus
3.2.2 PULP學(xué)習(xí)框架及其偽代碼描述
3.3 實驗環(huán)境與數(shù)據(jù)
3.3.1 數(shù)據(jù)集分析與預(yù)處理
3.3.2 實驗環(huán)境
3.4 對比實驗設(shè)置
3.4.1 對比方法介紹
3.4.2 實驗設(shè)置
3.5 實驗評估標(biāo)準(zhǔn)
3.5.1 準(zhǔn)確率與F1值
3.5.2 ROC曲線與AUC值
3.5.3 運行時間
3.6 實驗結(jié)果和分析
3.7 本章小結(jié)
第四章 基于PU學(xué)習(xí)的異質(zhì)信息網(wǎng)絡(luò)關(guān)系預(yù)測框架PURP
4.1 異質(zhì)信息網(wǎng)絡(luò)的拓?fù)涮卣鞅硎?br> 4.2 PURP學(xué)習(xí)框架及其偽代碼描述
4.3 實驗數(shù)據(jù)
4.3.1 異質(zhì)信息網(wǎng)絡(luò)數(shù)據(jù)集簡介
4.3.2 數(shù)據(jù)分析與預(yù)處理
4.4 對比實驗設(shè)置
4.5 實驗結(jié)果和分析
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文工作總結(jié)
5.2 未來研究內(nèi)容和方向
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間撰寫的論文
附錄2 攻讀碩士學(xué)位期間參加的科研項目
致謝
本文編號:3838608
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 研究背景和意義
1.2 研究現(xiàn)狀
1.3 論文的研究內(nèi)容
1.4 論文的組織結(jié)構(gòu)
第二章 復(fù)雜網(wǎng)絡(luò)鏈接預(yù)測方法調(diào)研
2.1 復(fù)雜網(wǎng)絡(luò)簡介
2.1.1 復(fù)雜網(wǎng)絡(luò)的定義
2.1.2 異質(zhì)信息網(wǎng)絡(luò)
2.2 鏈接預(yù)測問題
2.2.1 定義與形式化描述
2.2.2 鏈接預(yù)測的主要方法
2.2.3 鏈接預(yù)測問題面臨的挑戰(zhàn)
2.3 關(guān)系預(yù)測問題
2.4 基于PU學(xué)習(xí)的鏈接/關(guān)系預(yù)測問題
2.4.1 PU學(xué)習(xí)及其主要方法
2.4.2 PU學(xué)習(xí)與鏈接預(yù)測
2.4.3 PU學(xué)習(xí)與關(guān)系預(yù)測
2.5 本章小結(jié)
第三章 基于PU學(xué)習(xí)的同質(zhì)信息網(wǎng)絡(luò)鏈接預(yù)測框架PULP
3.1 同質(zhì)信息網(wǎng)絡(luò)的拓?fù)涮卣鞅硎?br> 3.2 基于PU學(xué)習(xí)的同質(zhì)信息網(wǎng)絡(luò)鏈接預(yù)測方法
3.2.1 可靠反例選取算法——SemiPUclus
3.2.2 PULP學(xué)習(xí)框架及其偽代碼描述
3.3 實驗環(huán)境與數(shù)據(jù)
3.3.1 數(shù)據(jù)集分析與預(yù)處理
3.3.2 實驗環(huán)境
3.4 對比實驗設(shè)置
3.4.1 對比方法介紹
3.4.2 實驗設(shè)置
3.5 實驗評估標(biāo)準(zhǔn)
3.5.1 準(zhǔn)確率與F1值
3.5.2 ROC曲線與AUC值
3.5.3 運行時間
3.6 實驗結(jié)果和分析
3.7 本章小結(jié)
第四章 基于PU學(xué)習(xí)的異質(zhì)信息網(wǎng)絡(luò)關(guān)系預(yù)測框架PURP
4.1 異質(zhì)信息網(wǎng)絡(luò)的拓?fù)涮卣鞅硎?br> 4.2 PURP學(xué)習(xí)框架及其偽代碼描述
4.3 實驗數(shù)據(jù)
4.3.1 異質(zhì)信息網(wǎng)絡(luò)數(shù)據(jù)集簡介
4.3.2 數(shù)據(jù)分析與預(yù)處理
4.4 對比實驗設(shè)置
4.5 實驗結(jié)果和分析
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文工作總結(jié)
5.2 未來研究內(nèi)容和方向
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間撰寫的論文
附錄2 攻讀碩士學(xué)位期間參加的科研項目
致謝
本文編號:3838608
本文鏈接:http://sikaile.net/kejilunwen/yysx/3838608.html
最近更新
教材專著