多視圖的子空間學(xué)習(xí)及在圖像分類(lèi)中的應(yīng)用研究
發(fā)布時(shí)間:2021-03-23 19:21
在模式識(shí)別、計(jì)算機(jī)視覺(jué)和數(shù)據(jù)可視化等領(lǐng)域的實(shí)際應(yīng)用中,同一個(gè)物體通常被表示為多個(gè)高維特征空間中的數(shù)據(jù),即多視圖數(shù)據(jù)。多視圖數(shù)據(jù)往往比單視圖數(shù)據(jù)包含更多的互補(bǔ)信息,更有利于分類(lèi),因此,近年來(lái)多視圖學(xué)習(xí)技術(shù)得到了越來(lái)越多的研究者們的關(guān)注。本文主要針對(duì)多視圖學(xué)習(xí)技術(shù)中的子空間學(xué)習(xí)方法進(jìn)行研究,并將主要研究?jī)?nèi)容總結(jié)如下:一、提出了一種多視圖局部鑒別學(xué)習(xí)方法——基于隨機(jī)子空間的多視圖局部鑒別投影(RSMLDP)。一方面,RSMLDP解決了直接使用原始高維數(shù)據(jù)構(gòu)造近鄰圖易受噪聲的影響從而影響分類(lèi)性能的穩(wěn)定性;另一方面,RSMLDP充分利用了樣本的標(biāo)記信息和局部信息,有效地挖掘了多視圖樣本的鑒別特征和內(nèi)在的局部結(jié)構(gòu)信息。首先,RSMLDP利用隨機(jī)子空間技術(shù),對(duì)原始數(shù)據(jù)進(jìn)行隨機(jī)特征選擇,將多次隨機(jī)特征選擇后的特征子集進(jìn)行融合后,在融合后的低維特征子空間中為每個(gè)視圖構(gòu)造近鄰圖;接著為每個(gè)視圖學(xué)習(xí)一個(gè)鑒別的投影變換,使得在該變換空間上,每個(gè)視圖的同類(lèi)近鄰樣本相互靠近,異類(lèi)近鄰樣本相互遠(yuǎn)離,同時(shí)樣本的總體局部結(jié)構(gòu)信息能夠得到保持。在MNIST手寫(xiě)體數(shù)字圖片數(shù)據(jù)庫(kù)、COIL-20物體數(shù)據(jù)庫(kù)、Multi-PIE...
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:130 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
原始空間上的樣本分布示例
13圖 2.2 LPP 投影后的特征分布述,在訓(xùn)練樣本集中選取三類(lèi)樣本,分別用符號(hào)□、○和。圖 2.1 為通過(guò)k NN標(biāo)準(zhǔn)對(duì)原始空間中的部分示例樣本據(jù)流形,左圖中的數(shù)據(jù)流形中的樣本能很好的聚在一起,由于兩類(lèi)樣本距離較近,使得同一數(shù)據(jù)流形中同時(shí)存在兩到的特征分布情況?梢钥闯,左圖中投影后的特征聚集于保持?jǐn)?shù)據(jù)的近鄰關(guān)系發(fā)生了部分重疊。LMMDE 方法通
3.3.1 數(shù)據(jù)庫(kù)介紹本章采用如下四個(gè)著名數(shù)據(jù)庫(kù)進(jìn)行實(shí)驗(yàn):MNIST 手寫(xiě)體數(shù)字圖片數(shù)據(jù)庫(kù)[157]、COIL-20 物體數(shù)據(jù)庫(kù)[158]、Multi-PIE 人臉數(shù)據(jù)庫(kù)[159]和 Caltech-101 大規(guī)模物體數(shù)據(jù)庫(kù)[160]。下面對(duì)這四個(gè)數(shù)據(jù)庫(kù)分別進(jìn)行介紹:MNIST 手寫(xiě)體數(shù)字圖片數(shù)據(jù)庫(kù)是由 0~9 的數(shù)字圖片組成,數(shù)據(jù)庫(kù)中的圖片來(lái)源于 NIST的專(zhuān)題數(shù)據(jù)庫(kù) 3 和專(zhuān)題數(shù)據(jù)庫(kù) 1。該數(shù)據(jù)庫(kù)中,每個(gè)數(shù)字(類(lèi)別)包含 100 張大小為28 28像素的數(shù)字圖片。圖 3.1 顯示了 MNIST 數(shù)據(jù)庫(kù)中 0~9 的部分示例圖片。為了構(gòu)建實(shí)驗(yàn)所需的多視圖特征集,分別對(duì)原始圖片提取以下三類(lèi)特征:1)Gabor 變換特征[161];2)Karhunen-Loeve(KL)變換特征[162];3)Local binary patterns(LBP)[163]特征。為了使每類(lèi)特征集樣本的維數(shù)保持一致,這里使用 PCA 變換[17]方法將三類(lèi)特征集數(shù)據(jù)的維數(shù)都降到 100 維。
【參考文獻(xiàn)】:
期刊論文
[1]一種多流形正則化的多視圖非負(fù)矩陣分解算法[J]. 宗林林,張憲超,趙乾利,于紅,劉馨月. 南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2017(03)
[2]基于弱匹配概率典型相關(guān)性分析的圖像自動(dòng)標(biāo)注[J]. 張博,郝杰,馬剛,史忠植. 軟件學(xué)報(bào). 2017(02)
[3]改進(jìn)的協(xié)同訓(xùn)練框架下壓縮跟蹤[J]. 鄭超,陳杰,殷松峰,楊星,馮云松,凌永順. 電子與信息學(xué)報(bào). 2016(07)
本文編號(hào):3096295
【文章來(lái)源】:南京郵電大學(xué)江蘇省
【文章頁(yè)數(shù)】:130 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
原始空間上的樣本分布示例
13圖 2.2 LPP 投影后的特征分布述,在訓(xùn)練樣本集中選取三類(lèi)樣本,分別用符號(hào)□、○和。圖 2.1 為通過(guò)k NN標(biāo)準(zhǔn)對(duì)原始空間中的部分示例樣本據(jù)流形,左圖中的數(shù)據(jù)流形中的樣本能很好的聚在一起,由于兩類(lèi)樣本距離較近,使得同一數(shù)據(jù)流形中同時(shí)存在兩到的特征分布情況?梢钥闯,左圖中投影后的特征聚集于保持?jǐn)?shù)據(jù)的近鄰關(guān)系發(fā)生了部分重疊。LMMDE 方法通
3.3.1 數(shù)據(jù)庫(kù)介紹本章采用如下四個(gè)著名數(shù)據(jù)庫(kù)進(jìn)行實(shí)驗(yàn):MNIST 手寫(xiě)體數(shù)字圖片數(shù)據(jù)庫(kù)[157]、COIL-20 物體數(shù)據(jù)庫(kù)[158]、Multi-PIE 人臉數(shù)據(jù)庫(kù)[159]和 Caltech-101 大規(guī)模物體數(shù)據(jù)庫(kù)[160]。下面對(duì)這四個(gè)數(shù)據(jù)庫(kù)分別進(jìn)行介紹:MNIST 手寫(xiě)體數(shù)字圖片數(shù)據(jù)庫(kù)是由 0~9 的數(shù)字圖片組成,數(shù)據(jù)庫(kù)中的圖片來(lái)源于 NIST的專(zhuān)題數(shù)據(jù)庫(kù) 3 和專(zhuān)題數(shù)據(jù)庫(kù) 1。該數(shù)據(jù)庫(kù)中,每個(gè)數(shù)字(類(lèi)別)包含 100 張大小為28 28像素的數(shù)字圖片。圖 3.1 顯示了 MNIST 數(shù)據(jù)庫(kù)中 0~9 的部分示例圖片。為了構(gòu)建實(shí)驗(yàn)所需的多視圖特征集,分別對(duì)原始圖片提取以下三類(lèi)特征:1)Gabor 變換特征[161];2)Karhunen-Loeve(KL)變換特征[162];3)Local binary patterns(LBP)[163]特征。為了使每類(lèi)特征集樣本的維數(shù)保持一致,這里使用 PCA 變換[17]方法將三類(lèi)特征集數(shù)據(jù)的維數(shù)都降到 100 維。
【參考文獻(xiàn)】:
期刊論文
[1]一種多流形正則化的多視圖非負(fù)矩陣分解算法[J]. 宗林林,張憲超,趙乾利,于紅,劉馨月. 南京大學(xué)學(xué)報(bào)(自然科學(xué)). 2017(03)
[2]基于弱匹配概率典型相關(guān)性分析的圖像自動(dòng)標(biāo)注[J]. 張博,郝杰,馬剛,史忠植. 軟件學(xué)報(bào). 2017(02)
[3]改進(jìn)的協(xié)同訓(xùn)練框架下壓縮跟蹤[J]. 鄭超,陳杰,殷松峰,楊星,馮云松,凌永順. 電子與信息學(xué)報(bào). 2016(07)
本文編號(hào):3096295
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3096295.html
最近更新
教材專(zhuān)著