基于Canopy的高維樣本相似性度量及分組加權(quán)t-SNE改進(jìn)算法
發(fā)布時(shí)間:2021-03-11 20:41
隨著數(shù)據(jù)規(guī)模的增大和數(shù)據(jù)復(fù)雜度的增加,高維數(shù)據(jù)的處理技術(shù)要求越來(lái)越高。其中高維數(shù)據(jù)的降維對(duì)于實(shí)現(xiàn)分類聚類、時(shí)序預(yù)測(cè)和關(guān)聯(lián)性分析等有著重要意義。高維降維技術(shù)一般包括線性降維和非線性降維兩種,其中t分布隨機(jī)鄰域嵌入(t-distributed stochastic neighbor embedding,t-SNE)算法是一種應(yīng)用較為廣泛的非線性降維方法,它的原理是計(jì)算高維空間內(nèi)樣本對(duì)之間的聯(lián)合概率并與低維空間內(nèi)樣本對(duì)的聯(lián)合概率進(jìn)行匹配,從而實(shí)現(xiàn)數(shù)據(jù)從高維空間到低維空間的映射。在目前的研究中,由于在該算法的實(shí)現(xiàn)過(guò)程中研究人員較少考慮高維空間內(nèi)樣本間的實(shí)際分布狀態(tài),即無(wú)論高維空間內(nèi)樣本相似程度如何,都采用同一種概率算法,這影響了低維映射結(jié)果的區(qū)分度,使得聚類效果結(jié)果不夠理想。針對(duì)這一問(wèn)題,本文提出了一種基于Canopy的分組加權(quán)t-SNE算法,該算法首先對(duì)高維空間內(nèi)樣本的分布情況進(jìn)行分析,使用Canopy算法進(jìn)行高維樣本相似程度的度量,在此基礎(chǔ)上將高維空間樣本的相似程度分為高相似程度、適中相似程度和低相似程度三組,并分別進(jìn)行自適應(yīng)加權(quán)后再計(jì)算高維空間內(nèi)樣本點(diǎn)之間的高維聯(lián)合概率,從而更準(zhǔn)確地反映...
【文章來(lái)源】:昆明理工大學(xué)云南省
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Canopy算法原理
Canopy算法步驟圖
高維空間中距離映射及Canopy分組結(jié)果圖
【參考文獻(xiàn)】:
期刊論文
[1]基于t分布鄰域嵌入算法的流式數(shù)據(jù)自動(dòng)分群方法[J]. 孟曉辰,王玥,祝連慶. 生物醫(yī)學(xué)工程學(xué)雜志. 2018(05)
[2]t-SNE+LDA算法在仿生嗅覺(jué)中的應(yīng)用研究[J]. 鄭首易,駱德漢,溫騰騰,何家峰. 計(jì)算機(jī)應(yīng)用研究. 2018(11)
[3]Canopy-Kmeans聚類和組合優(yōu)化的鐵礦預(yù)配料智能調(diào)度[J]. 曹躍,王雅琳,何海明,楊卜菘,桂衛(wèi)華. 控制理論與應(yīng)用. 2017(07)
[4]稀疏保持典型相關(guān)分析特征選擇與模式識(shí)別[J]. 許潔,吳秦,梁久禎,王念兵,張淮. 小型微型計(jì)算機(jī)系統(tǒng). 2017(08)
[5]基于t-SNE的腦網(wǎng)絡(luò)狀態(tài)觀測(cè)矩陣降維方法研究[J]. 董迎朝,王彬,馬灑灑,劉輝,熊新,薛潔. 計(jì)算機(jī)工程與應(yīng)用. 2018(01)
[6]自適應(yīng)鄰域值選取的LLE算法研究[J]. 高潔,吳立鋒,關(guān)永,王洪民. 小型微型計(jì)算機(jī)系統(tǒng). 2017(02)
[7]基于同步多維數(shù)據(jù)流的腦網(wǎng)絡(luò)動(dòng)態(tài)特征辨識(shí)方法研究[J]. 馬灑灑,王彬,薛潔,董迎朝,劉輝,熊新. 計(jì)算機(jī)應(yīng)用研究. 2017(11)
[8]基于t分布隨機(jī)鄰域嵌入的阿爾茨海默癥診斷模型[J]. 成超,楊晨暉. 廈門大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)
[9]基于最近鄰的隨機(jī)非線性降維[J]. 田守財(cái),孫喜利,路永鋼. 計(jì)算機(jī)應(yīng)用. 2016(02)
[10]基于子圖選擇和圖核降維的腦網(wǎng)絡(luò)分類方法[J]. 王立鵬,費(fèi)飛,接標(biāo),張道強(qiáng). 計(jì)算機(jī)科學(xué)與探索. 2014(10)
博士論文
[1]面向高維數(shù)據(jù)的特征學(xué)習(xí)理論與應(yīng)用研究[D]. 路梅.蘇州大學(xué) 2016
[2]基于磁共振成像的腦連接方法學(xué)及應(yīng)用研究[D]. 廖偉.電子科技大學(xué) 2011
碩士論文
[1]基于隨機(jī)初始化的非線性降維算法的研究[D]. 田守財(cái).蘭州大學(xué) 2016
[2]基于復(fù)雜網(wǎng)絡(luò)的腦功能研究與分析[D]. 喬赫元.中國(guó)科學(xué)技術(shù)大學(xué) 2011
本文編號(hào):3077061
【文章來(lái)源】:昆明理工大學(xué)云南省
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Canopy算法原理
Canopy算法步驟圖
高維空間中距離映射及Canopy分組結(jié)果圖
【參考文獻(xiàn)】:
期刊論文
[1]基于t分布鄰域嵌入算法的流式數(shù)據(jù)自動(dòng)分群方法[J]. 孟曉辰,王玥,祝連慶. 生物醫(yī)學(xué)工程學(xué)雜志. 2018(05)
[2]t-SNE+LDA算法在仿生嗅覺(jué)中的應(yīng)用研究[J]. 鄭首易,駱德漢,溫騰騰,何家峰. 計(jì)算機(jī)應(yīng)用研究. 2018(11)
[3]Canopy-Kmeans聚類和組合優(yōu)化的鐵礦預(yù)配料智能調(diào)度[J]. 曹躍,王雅琳,何海明,楊卜菘,桂衛(wèi)華. 控制理論與應(yīng)用. 2017(07)
[4]稀疏保持典型相關(guān)分析特征選擇與模式識(shí)別[J]. 許潔,吳秦,梁久禎,王念兵,張淮. 小型微型計(jì)算機(jī)系統(tǒng). 2017(08)
[5]基于t-SNE的腦網(wǎng)絡(luò)狀態(tài)觀測(cè)矩陣降維方法研究[J]. 董迎朝,王彬,馬灑灑,劉輝,熊新,薛潔. 計(jì)算機(jī)工程與應(yīng)用. 2018(01)
[6]自適應(yīng)鄰域值選取的LLE算法研究[J]. 高潔,吳立鋒,關(guān)永,王洪民. 小型微型計(jì)算機(jī)系統(tǒng). 2017(02)
[7]基于同步多維數(shù)據(jù)流的腦網(wǎng)絡(luò)動(dòng)態(tài)特征辨識(shí)方法研究[J]. 馬灑灑,王彬,薛潔,董迎朝,劉輝,熊新. 計(jì)算機(jī)應(yīng)用研究. 2017(11)
[8]基于t分布隨機(jī)鄰域嵌入的阿爾茨海默癥診斷模型[J]. 成超,楊晨暉. 廈門大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)
[9]基于最近鄰的隨機(jī)非線性降維[J]. 田守財(cái),孫喜利,路永鋼. 計(jì)算機(jī)應(yīng)用. 2016(02)
[10]基于子圖選擇和圖核降維的腦網(wǎng)絡(luò)分類方法[J]. 王立鵬,費(fèi)飛,接標(biāo),張道強(qiáng). 計(jì)算機(jī)科學(xué)與探索. 2014(10)
博士論文
[1]面向高維數(shù)據(jù)的特征學(xué)習(xí)理論與應(yīng)用研究[D]. 路梅.蘇州大學(xué) 2016
[2]基于磁共振成像的腦連接方法學(xué)及應(yīng)用研究[D]. 廖偉.電子科技大學(xué) 2011
碩士論文
[1]基于隨機(jī)初始化的非線性降維算法的研究[D]. 田守財(cái).蘭州大學(xué) 2016
[2]基于復(fù)雜網(wǎng)絡(luò)的腦功能研究與分析[D]. 喬赫元.中國(guó)科學(xué)技術(shù)大學(xué) 2011
本文編號(hào):3077061
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3077061.html
最近更新
教材專著