學(xué)習(xí)驅(qū)動(dòng)的概率重構(gòu)與數(shù)據(jù)可視化
發(fā)布時(shí)間:2022-12-17 10:54
在這個(gè)信息爆炸的時(shí)代,處理與分析大規(guī)模的高維數(shù)據(jù)已經(jīng)成為數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)領(lǐng)域的重大挑戰(zhàn)之一。為了獲取以及直觀理解隱藏在大數(shù)據(jù)下的潛在信息,一種有效的數(shù)據(jù)可視化技術(shù)是不可或缺的。數(shù)據(jù)可視化技術(shù)能夠?qū)?fù)雜的高維數(shù)據(jù)信息展示在低維的圖表上。根據(jù)低維的數(shù)據(jù)圖表,我們能夠?qū)υ紨?shù)據(jù)的結(jié)構(gòu)信息有一個(gè)直觀地理解,而且有助于后續(xù)的數(shù)據(jù)探索與模式識(shí)別。在一些傳統(tǒng)的數(shù)據(jù)可視化算法的基礎(chǔ)上,本文做了如下工作:(1)提出了基于ANNOY的快速近鄰搜索算法。該算法在隨機(jī)投影樹的基礎(chǔ)上通過近鄰?fù)卣沟姆椒ㄟM(jìn)行近鄰點(diǎn)的搜索,在保證近鄰搜索準(zhǔn)確率的基礎(chǔ)上大大提升了近鄰搜索的速度。(2)提出了基于近鄰關(guān)系與類別信息的概率重構(gòu)算法。該算法首先通過近鄰?fù)卣沟姆椒?gòu)建近鄰關(guān)系圖,然后基于近鄰關(guān)系與類別信息對(duì)原始數(shù)據(jù)樣本之間的相似性進(jìn)行概率重構(gòu)。該算法可以更為準(zhǔn)確的描述高維數(shù)據(jù)樣本之間的相似關(guān)系。(3)提出了基于P-BGLL的可視化算法。該算法在BGLL算法的基礎(chǔ)上,使用概率作為空間中樣本之間的連接權(quán)值,從而提出了P-BGLL算法,并基于P-BGLL算法進(jìn)行可視化操作。相比于傳統(tǒng)的數(shù)據(jù)可視化算法,基于P-BGLL的數(shù)據(jù)可視化算...
【文章頁(yè)數(shù)】:105 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題的研究背景和意義
1.2 國(guó)內(nèi)外研究的現(xiàn)狀
1.2.1 線性降維可視化算法
1.2.2 非線性降維可視化算法
1.2.3 數(shù)據(jù)可視化的應(yīng)用
1.2.4 算法小結(jié)
1.3 相關(guān)工作回顧
1.3.1 聚類算法
1.3.2 復(fù)雜網(wǎng)絡(luò)聚類
1.3.3 卷積神經(jīng)網(wǎng)絡(luò)
1.4 主要工作與章節(jié)安排
第二章 基于樹結(jié)構(gòu)的隨機(jī)近鄰嵌入算法
2.1 基于學(xué)生T分布的隨機(jī)近鄰嵌入算法(t-SNE)
2.2 基于樹結(jié)構(gòu)的隨機(jī)近鄰嵌入算法(Accelerating t-SNE)
2.2.1 高維空間中概率矩陣的近似求解
2.2.2 基于樹結(jié)構(gòu)的梯度優(yōu)化
2.3 Accelerating t-SNE算法的不足
2.4 本章小結(jié)
第三章 基于ANNOY的快速近鄰搜索與概率重構(gòu)算法
3.1 近鄰搜索
3.1.1 ANNOY搜索算法
3.1.2 基于ANNOY的快速近鄰搜索
3.2 概率重構(gòu)
3.2.1 基于近鄰關(guān)系的概率重構(gòu)
3.2.2 基于類別信息的概率重構(gòu)
3.2.3 概率重構(gòu)具體計(jì)算方法
3.2.4 概率重構(gòu)的總結(jié)
3.3 算法總結(jié)
3.4 本章小結(jié)
第四章 基于無監(jiān)督學(xué)習(xí)的概率重構(gòu)與數(shù)據(jù)可視化
4.1 聚類算法的選擇
4.2 P-BGLL聚類算法
4.3 基于P-BGLL的數(shù)據(jù)可視化算法
4.4 本章小結(jié)
第五章 基于有監(jiān)督學(xué)習(xí)的概率重構(gòu)與數(shù)據(jù)可視化
5.1 特征提取
5.2 Feature-Net
5.2.1 Feature-Net網(wǎng)絡(luò)
5.2.2 基于分類結(jié)果進(jìn)行概率重構(gòu)
5.3 基于Feature-Net的數(shù)據(jù)可視化算法
5.4 本章小結(jié)
第六章 實(shí)驗(yàn)結(jié)果與分析
6.1 實(shí)驗(yàn)相關(guān)數(shù)據(jù)集
6.1.1 MNIST數(shù)據(jù)集
6.1.2 CIFAR-10 數(shù)據(jù)集
6.1.3 SVHN數(shù)據(jù)集
6.2 實(shí)驗(yàn)設(shè)置與評(píng)價(jià)標(biāo)準(zhǔn)
6.2.1 實(shí)驗(yàn)設(shè)置
6.2.2 評(píng)價(jià)標(biāo)準(zhǔn)
6.3 基于ANNOY的快速近鄰搜索的實(shí)驗(yàn)結(jié)果與分析
6.4 P-BGLL算法與BGLL算法的可視化實(shí)驗(yàn)結(jié)果對(duì)比與分析
6.5 基于P-BGLL的可視化算法的實(shí)驗(yàn)結(jié)果與分析
6.5.1 MNIST數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.5.2 CIFAR-10 數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.5.3 SVHN數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.6 基于Feature-Net的可視化算法的實(shí)驗(yàn)結(jié)果與分析
6.6.1 MNIST數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.6.2 CIFAR-10 數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.6.3 SVHN數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.6.4 Feature-Net網(wǎng)絡(luò)與常見網(wǎng)絡(luò)結(jié)構(gòu)的實(shí)驗(yàn)對(duì)比與分析
6.7 實(shí)驗(yàn)結(jié)果總結(jié)
6.8 本章小結(jié)
第七章 總結(jié)與展望
7.1 全文總結(jié)
7.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文
【參考文獻(xiàn)】:
期刊論文
[1]基于t-SNE的電力系統(tǒng)電氣距離可視化方法研究[J]. 史東宇,胡文強(qiáng),李剛,嚴(yán)劍峰,臧德春. 電力工程技術(shù). 2018(02)
[2]DEEPEYE: An Automatic Big Data Visualization Framework[J]. Xuedi Qin,Yuyu Luo,Nan Tang,Guoliang Li. Big Data Mining and Analytics. 2018(01)
[3]大數(shù)據(jù)可視分析綜述[J]. 任磊,杜一,馬帥,張小龍,戴國(guó)忠. 軟件學(xué)報(bào). 2014(09)
[4]復(fù)雜網(wǎng)絡(luò)中的社團(tuán)結(jié)構(gòu)算法綜述[J]. 汪小帆,劉亞冰. 電子科技大學(xué)學(xué)報(bào). 2009(05)
本文編號(hào):3719801
【文章頁(yè)數(shù)】:105 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題的研究背景和意義
1.2 國(guó)內(nèi)外研究的現(xiàn)狀
1.2.1 線性降維可視化算法
1.2.2 非線性降維可視化算法
1.2.3 數(shù)據(jù)可視化的應(yīng)用
1.2.4 算法小結(jié)
1.3 相關(guān)工作回顧
1.3.1 聚類算法
1.3.2 復(fù)雜網(wǎng)絡(luò)聚類
1.3.3 卷積神經(jīng)網(wǎng)絡(luò)
1.4 主要工作與章節(jié)安排
第二章 基于樹結(jié)構(gòu)的隨機(jī)近鄰嵌入算法
2.1 基于學(xué)生T分布的隨機(jī)近鄰嵌入算法(t-SNE)
2.2 基于樹結(jié)構(gòu)的隨機(jī)近鄰嵌入算法(Accelerating t-SNE)
2.2.1 高維空間中概率矩陣的近似求解
2.2.2 基于樹結(jié)構(gòu)的梯度優(yōu)化
2.3 Accelerating t-SNE算法的不足
2.4 本章小結(jié)
第三章 基于ANNOY的快速近鄰搜索與概率重構(gòu)算法
3.1 近鄰搜索
3.1.1 ANNOY搜索算法
3.1.2 基于ANNOY的快速近鄰搜索
3.2 概率重構(gòu)
3.2.1 基于近鄰關(guān)系的概率重構(gòu)
3.2.2 基于類別信息的概率重構(gòu)
3.2.3 概率重構(gòu)具體計(jì)算方法
3.2.4 概率重構(gòu)的總結(jié)
3.3 算法總結(jié)
3.4 本章小結(jié)
第四章 基于無監(jiān)督學(xué)習(xí)的概率重構(gòu)與數(shù)據(jù)可視化
4.1 聚類算法的選擇
4.2 P-BGLL聚類算法
4.3 基于P-BGLL的數(shù)據(jù)可視化算法
4.4 本章小結(jié)
第五章 基于有監(jiān)督學(xué)習(xí)的概率重構(gòu)與數(shù)據(jù)可視化
5.1 特征提取
5.2 Feature-Net
5.2.1 Feature-Net網(wǎng)絡(luò)
5.2.2 基于分類結(jié)果進(jìn)行概率重構(gòu)
5.3 基于Feature-Net的數(shù)據(jù)可視化算法
5.4 本章小結(jié)
第六章 實(shí)驗(yàn)結(jié)果與分析
6.1 實(shí)驗(yàn)相關(guān)數(shù)據(jù)集
6.1.1 MNIST數(shù)據(jù)集
6.1.2 CIFAR-10 數(shù)據(jù)集
6.1.3 SVHN數(shù)據(jù)集
6.2 實(shí)驗(yàn)設(shè)置與評(píng)價(jià)標(biāo)準(zhǔn)
6.2.1 實(shí)驗(yàn)設(shè)置
6.2.2 評(píng)價(jià)標(biāo)準(zhǔn)
6.3 基于ANNOY的快速近鄰搜索的實(shí)驗(yàn)結(jié)果與分析
6.4 P-BGLL算法與BGLL算法的可視化實(shí)驗(yàn)結(jié)果對(duì)比與分析
6.5 基于P-BGLL的可視化算法的實(shí)驗(yàn)結(jié)果與分析
6.5.1 MNIST數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.5.2 CIFAR-10 數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.5.3 SVHN數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.6 基于Feature-Net的可視化算法的實(shí)驗(yàn)結(jié)果與分析
6.6.1 MNIST數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.6.2 CIFAR-10 數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.6.3 SVHN數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析
6.6.4 Feature-Net網(wǎng)絡(luò)與常見網(wǎng)絡(luò)結(jié)構(gòu)的實(shí)驗(yàn)對(duì)比與分析
6.7 實(shí)驗(yàn)結(jié)果總結(jié)
6.8 本章小結(jié)
第七章 總結(jié)與展望
7.1 全文總結(jié)
7.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間已發(fā)表或錄用的論文
【參考文獻(xiàn)】:
期刊論文
[1]基于t-SNE的電力系統(tǒng)電氣距離可視化方法研究[J]. 史東宇,胡文強(qiáng),李剛,嚴(yán)劍峰,臧德春. 電力工程技術(shù). 2018(02)
[2]DEEPEYE: An Automatic Big Data Visualization Framework[J]. Xuedi Qin,Yuyu Luo,Nan Tang,Guoliang Li. Big Data Mining and Analytics. 2018(01)
[3]大數(shù)據(jù)可視分析綜述[J]. 任磊,杜一,馬帥,張小龍,戴國(guó)忠. 軟件學(xué)報(bào). 2014(09)
[4]復(fù)雜網(wǎng)絡(luò)中的社團(tuán)結(jié)構(gòu)算法綜述[J]. 汪小帆,劉亞冰. 電子科技大學(xué)學(xué)報(bào). 2009(05)
本文編號(hào):3719801
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3719801.html
最近更新
教材專著