基于全局信息的圖結(jié)點特征向量學習算法
本文關(guān)鍵詞:基于全局信息的圖結(jié)點特征向量學習算法
更多相關(guān)文章: 圖結(jié)點特征向量 全局結(jié)構(gòu)信息 矩陣分解 特征 學習 降維算法
【摘要】:隨著互聯(lián)網(wǎng)+時代的到來,數(shù)據(jù)的產(chǎn)生日益增多,如何從海量的數(shù)據(jù)中獲取有價值的信息,已成為數(shù)據(jù)挖掘的使命。在實際中,數(shù)據(jù)經(jīng)常會以圖結(jié)構(gòu)來組織,圖挖掘便成為重要的研究課題。在諸多算法思路中,近兩年新提出的圖結(jié)點特征向量生成算法實現(xiàn)了業(yè)界最優(yōu)水平,受到了眾多學者的關(guān)注。本文提出了GraRep,一種新的算法可以利用圖的結(jié)構(gòu)信息生成具有語義、拓撲特性的圖結(jié)點特征向量表示。與其他已有工作不同,本文提出的算法充分利用了圖上的互補的局部結(jié)構(gòu)信息,并綜合在一起構(gòu)成全局結(jié)構(gòu)信息。本文從數(shù)學上形式化的證明了該算法相較于一些文獻已有算法的優(yōu)勢所在,包括Perozzi et al.提出的DeepWalk模型,以及Mikolov et al.提出的skip-gram模型。從真實的實驗數(shù)據(jù)中,本文再次驗證了GraRe p在實驗結(jié)果上達到業(yè)界最優(yōu)水平。為了充分體現(xiàn)該算法的性能,本文的實驗數(shù)據(jù)分別來自新聞文本網(wǎng)絡,社交網(wǎng)絡和文獻引用網(wǎng)絡三種不同性質(zhì)的數(shù)據(jù),包括有有權(quán)圖與無權(quán)圖、稀疏圖與稠密圖,圖的結(jié)點數(shù)目差異也很大。同時,在三種不同的任務中進行測試,分別是聚類任務、分類任務以及可視化任務。在所有實驗中,本文提出的GraRep算法在準確度上相對于若干已有的業(yè)界最優(yōu)算法有顯著的提升。然而,本文仍然存在不足之處。由于矩陣乘法和奇異值分解的高時間復雜程度,導致算法在數(shù)據(jù)規(guī)模較大時耗時較高。未來的工作中,會繼續(xù)探究矩陣乘方的近似算法,以及將算法改為在線算法,用更好的方法去替代奇異值分解做數(shù)據(jù)降維等。
【關(guān)鍵詞】:圖結(jié)點特征向量 全局結(jié)構(gòu)信息 矩陣分解 特征 學習 降維算法
【學位授予單位】:西安電子科技大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP181
【目錄】:
- 摘要5-6
- ABSTRACT6-9
- 符號對照表9-10
- 縮略語對照表10-13
- 第一章 緒論13-21
- 1.1 研究背景及意義13-14
- 1.2 研究現(xiàn)狀14-17
- 1.2.1 中心性度量14-15
- 1.2.2 圖結(jié)點特征向量15-17
- 1.3 本文工作概述及論文結(jié)構(gòu)17-21
- 第二章 數(shù)學模型建立21-33
- 2.1 問題抽象及符號定義21-23
- 2.1.1 圖的概念21-22
- 2.1.2 問題的定義22-23
- 2.2 相關(guān)算法分析23-27
- 2.2.1 線性結(jié)構(gòu)特征向量生成算法23-26
- 2.2.2 圖結(jié)構(gòu)特征向量生成算法26-27
- 2.3 全局結(jié)構(gòu)信息提取策略27-29
- 2.3.1 各階局部信息提取27-28
- 2.3.2 各階局部信息保留28-29
- 2.4 綜合各階結(jié)構(gòu)信息29-33
- 2.4.1 衰退函數(shù)29-30
- 2.4.2 衰減隨機沖浪模型30-33
- 第三章 算法設(shè)計33-45
- 3.1 優(yōu)化目標函數(shù)建立33-35
- 3.1.1 局部優(yōu)化目標函數(shù)33-34
- 3.1.2 數(shù)值優(yōu)化算法34-35
- 3.2 解析求解方法35-37
- 3.2.1 解析解矩陣35-36
- 3.2.2 基于矩陣分解的優(yōu)化方法36-37
- 3.3 深度神經(jīng)網(wǎng)絡與數(shù)據(jù)降維37-39
- 3.3.1 深度學習37-38
- 3.3.2 棧式降噪自動編碼器38-39
- 3.4 算法流程39-40
- 3.5 GraRep數(shù)學本質(zhì)40-45
- 3.5.1 SGNS算法與GraRep的聯(lián)系40-42
- 3.5.2 采樣方法與轉(zhuǎn)移概率42-45
- 第四章 實驗驗證45-55
- 4.1 數(shù)據(jù)集45-46
- 4.2 基線算法46-47
- 4.3 參數(shù)設(shè)定47-48
- 4.4 實驗結(jié)果分析48-51
- 4.4.1 20-Newsgroup網(wǎng)絡48-49
- 4.4.2 Blogcatalog網(wǎng)絡49-50
- 4.4.3 DBLP網(wǎng)絡50-51
- 4.5 參數(shù)敏感性分析51-55
- 第五章 總結(jié)與展望55-57
- 參考文獻57-61
- 致謝61-63
- 作者簡介63-64
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 許錫春,胡運發(fā),施伯樂;特征向量的獲取[J];計算機應用;2000年09期
2 葛新;趙海;張昕;李超;;基于多維特征向量的網(wǎng)絡社團劃分方法[J];東北大學學報(自然科學版);2008年07期
3 高靈霞;李國敏;孫鳳蘭;;方陣廣義特征向量的一種相似迭代算法[J];計算機應用與軟件;2014年02期
4 夏慧明;周永權(quán);;求解矩陣特征值及特征向量的新方法[J];計算機工程;2008年11期
5 鄧廣宏;曹萬華;夏奕;蔡斌;池志強;程雄;;基于特征向量的基本口型分類[J];計算機應用與軟件;2010年10期
6 劉青光,鄒理和;信號特征向量分解與到達波方向估計[J];電子學報;1993年01期
7 張霖;吳麒;;設(shè)計魯棒控制器的主導特征向量配正方法[J];自動化學報;1991年01期
8 鄧曉剛;田學民;;基于特征向量提取的核回歸建模方法研究[J];控制工程;2010年04期
9 李博濤;王之琪;王秀彩;;分支界定法在特征向量提取中的應用[J];山西電子技術(shù);2011年02期
10 劉俊;黃秀玲;張智光;;基于產(chǎn)品特征向量的產(chǎn)品配置研究[J];制造業(yè)自動化;2008年12期
中國重要會議論文全文數(shù)據(jù)庫 前5條
1 陳力奮;宋漢文;王文亮;;確定退化模態(tài)可導特征向量轉(zhuǎn)換矩陣的一種新方法[A];振動工程學報(工程應用專輯)[C];2001年
2 戴琨;汪小帆;;根據(jù)特征向量判據(jù)優(yōu)化網(wǎng)絡的同步能力[A];第四屆全國網(wǎng)絡科學學術(shù)論壇暨研究生暑期學校論文集[C];2008年
3 劉增武;蔡悅斌;;基于K-L變換的船舶噪聲特征向量的降維處理[A];中國聲學學會1999年青年學術(shù)會議[CYCA'99]論文集[C];1999年
4 張新培;曹策慧;;隨機結(jié)構(gòu)特征值和特征向量統(tǒng)計特性的研究[A];第五屆全國結(jié)構(gòu)工程學術(shù)會議論文集(第二卷)[C];1996年
5 曹玉娟;牛振東;彭學平;江鵬;;一個基于特征向量的近似網(wǎng)頁去重算法[A];中國索引學會第三次全國會員代表大會暨學術(shù)論壇論文集[C];2008年
中國博士學位論文全文數(shù)據(jù)庫 前2條
1 陳曉s,
本文編號:1114050
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1114050.html