非負(fù)矩陣分解與網(wǎng)絡(luò)數(shù)據(jù)降維
發(fā)布時(shí)間:2022-02-18 21:41
隨著現(xiàn)代科技的飛速發(fā)展,在社會(huì)生產(chǎn)生活的實(shí)踐中,有越來(lái)越多的數(shù)據(jù)信息日復(fù)一日地被積累起來(lái)。網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)作為一類重要的數(shù)據(jù)存儲(chǔ)方式,在互聯(lián)網(wǎng)等科技領(lǐng)域中發(fā)揮著重要的作用。如何準(zhǔn)確高效地從網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)中提取信息是擺在我們面前的一大挑戰(zhàn)。本文選擇了一類特殊的網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)——學(xué)術(shù)期刊的引用網(wǎng)絡(luò)作為研究對(duì)象,該網(wǎng)絡(luò)具有兩個(gè)值得研究的性質(zhì):一是有向性;二是高度稀疏性。有向網(wǎng)絡(luò)相比無(wú)向網(wǎng)絡(luò)更具立體的結(jié)構(gòu),不僅可能含有分類結(jié)構(gòu)信息(學(xué)術(shù)期刊的類別劃分問(wèn)題),在局部上節(jié)點(diǎn)間還可能有序的關(guān)系(研究方向相近的學(xué)術(shù)期刊的排序問(wèn)題);稀疏性在一定程度上降低了期刊引用網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度,適合作為一個(gè)初步的模型算法的試驗(yàn)對(duì)象。本文從考察這類網(wǎng)絡(luò)數(shù)據(jù)的結(jié)構(gòu)特征出發(fā),建立起新的模型并通過(guò)合適的數(shù)據(jù)處理算法對(duì)數(shù)據(jù)進(jìn)行降維處理,從而獲得對(duì)復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)的直觀認(rèn)識(shí)。傳統(tǒng)的網(wǎng)絡(luò)數(shù)據(jù)降維算法的流程一般是將網(wǎng)絡(luò)數(shù)據(jù)視為高維數(shù)據(jù),通過(guò)一定的處理方法導(dǎo)出數(shù)據(jù)節(jié)點(diǎn)間的對(duì)稱(類)度量矩陣,然后使用譜方法進(jìn)行低維嵌入。而本文將從統(tǒng)計(jì)學(xué)的角度出發(fā),設(shè)計(jì)一個(gè)以離散概率分布為基礎(chǔ)的模型,使用該模型可以從雜志引用網(wǎng)絡(luò)中提取出雜志的一個(gè)類似于概率分布...
【文章來(lái)源】:清華大學(xué)北京市211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:41 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
主要符號(hào)對(duì)照表
第1章 引言
1.1 問(wèn)題背景
1.2 具體問(wèn)題與研究現(xiàn)狀
1.3 論文組織
第2章 基本方法介紹
2.1 基于特征值分解的降維算法
2.1.1 多維尺度度量-MDS
2.1.1.1 原理
2.1.1.2 算法實(shí)現(xiàn)
2.2 非負(fù)矩陣分解-NMF
2.2.1 原理
2.2.2 算法實(shí)現(xiàn)
第3章 數(shù)據(jù)與模型構(gòu)建
3.1 數(shù)據(jù)
3.1.1 數(shù)據(jù)概述
3.1.2 預(yù)處理方法
3.2 模型
3.2.1 模型提出與假設(shè)
3.3 算法與模型改進(jìn)
3.3.1 算法調(diào)整
3.3.2 模型改進(jìn)
第4章 數(shù)值試驗(yàn)與結(jié)果
4.1 數(shù)據(jù)選取
4.2 小規(guī)模數(shù)值試驗(yàn)
4.2.1 數(shù)據(jù)概覽
4.2.2 NMF與MDS算法結(jié)果比較
4.3 較大規(guī)模數(shù)值試驗(yàn)
4.3.1 數(shù)據(jù)準(zhǔn)備
4.3.2 統(tǒng)計(jì)方法與NMF算法效果比較
4.3.3 弱先驗(yàn)信息下NMF算法的效果
第5章 總結(jié)
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果
本文編號(hào):3631600
【文章來(lái)源】:清華大學(xué)北京市211工程院校985工程院校教育部直屬院校
【文章頁(yè)數(shù)】:41 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
主要符號(hào)對(duì)照表
第1章 引言
1.1 問(wèn)題背景
1.2 具體問(wèn)題與研究現(xiàn)狀
1.3 論文組織
第2章 基本方法介紹
2.1 基于特征值分解的降維算法
2.1.1 多維尺度度量-MDS
2.1.1.1 原理
2.1.1.2 算法實(shí)現(xiàn)
2.2 非負(fù)矩陣分解-NMF
2.2.1 原理
2.2.2 算法實(shí)現(xiàn)
第3章 數(shù)據(jù)與模型構(gòu)建
3.1 數(shù)據(jù)
3.1.1 數(shù)據(jù)概述
3.1.2 預(yù)處理方法
3.2 模型
3.2.1 模型提出與假設(shè)
3.3 算法與模型改進(jìn)
3.3.1 算法調(diào)整
3.3.2 模型改進(jìn)
第4章 數(shù)值試驗(yàn)與結(jié)果
4.1 數(shù)據(jù)選取
4.2 小規(guī)模數(shù)值試驗(yàn)
4.2.1 數(shù)據(jù)概覽
4.2.2 NMF與MDS算法結(jié)果比較
4.3 較大規(guī)模數(shù)值試驗(yàn)
4.3.1 數(shù)據(jù)準(zhǔn)備
4.3.2 統(tǒng)計(jì)方法與NMF算法效果比較
4.3.3 弱先驗(yàn)信息下NMF算法的效果
第5章 總結(jié)
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果
本文編號(hào):3631600
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3631600.html
最近更新
教材專著