基于對抗自編碼網(wǎng)絡(luò)的開集識別研究
發(fā)布時間:2021-03-20 21:16
圖像識別是計算機(jī)視覺領(lǐng)域一個典型的任務(wù)。相對于閉集假設(shè)下的圖像識別任務(wù),開集識別不僅能夠識別訓(xùn)練數(shù)據(jù)集中的已知類別,而且能夠?qū)τ?xùn)練數(shù)據(jù)集中沒有出現(xiàn)的未知類別對象,做出拒絕響應(yīng)或標(biāo)注為“未知”。在真實世界的識別或分類任務(wù)中,對識別器或分類器進(jìn)行訓(xùn)練時,由于受到各種客觀因素的限制,通常很難收集到窮盡所有類別的訓(xùn)練樣本。更普遍的情況是開集識別(Open Set Recognition,OSR),訓(xùn)練時存在對世界的不完備類別知識,測試時允許將未知的類別實例提交給算法。要求分類器不僅準(zhǔn)確對訓(xùn)練數(shù)據(jù)集中已有的類別進(jìn)行分類,而且還要有效地處理那些在訓(xùn)練數(shù)據(jù)集中沒有出現(xiàn)的類別。近年來隨著深度學(xué)習(xí)的興起,針對圖像識別的深度學(xué)習(xí)在很大程度上依賴于卷積神經(jīng)網(wǎng)絡(luò)模型。雖然卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNNs)識別模型很有效,但是良好的效果很少能被理論解釋。最近解決開集識別任務(wù)的方法包括兩個主要部分:在屬于同一類別的對象上引入距離度量,使其具有較低的類內(nèi)距離;然后建立了一個緊湊的衰減概率模型。對于某一測試對象實例,當(dāng)概率低于已知類的閾值時,就確定該對象屬于訓(xùn)練數(shù)據(jù)集...
【文章來源】:中原工學(xué)院河南省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
傳統(tǒng)的識別和開集識別的比較
中原工學(xué)院碩士學(xué)位論文4圖1.2訓(xùn)練數(shù)據(jù)的樣例分布及生成概率的示意圖[8]在一個共同的閉集或靜態(tài)環(huán)境的假設(shè)下,訓(xùn)練和測試數(shù)據(jù)來自相同的分布。傳統(tǒng)的識別和分類算法已經(jīng)在各種閉集假設(shè)環(huán)境下的機(jī)器學(xué)習(xí)任務(wù)中取得了顯著的效果。然而,更現(xiàn)實的場景通常是開放的、非靜態(tài)的,如無人駕駛、工業(yè)故障檢測、醫(yī)療診斷等。在這些場景中,可能會出現(xiàn)未知的意外情況,這大大削弱了這些現(xiàn)有方法的魯棒性。為迎接這一挑戰(zhàn),近幾年研究人員實際探索了終身學(xué)習(xí)(LifelongLearning)[9]、轉(zhuǎn)移學(xué)習(xí)(TransferLearning)[10]、領(lǐng)域適應(yīng)(DomainAdaption)[11]、零樣本(Zero-shotLearning,ZSL)[12]、單樣本(少樣本)學(xué)習(xí)識別(One-shotLearning&Few-shotLearning)[13]、開集識別(OpenSetRecognition,OSR)等相關(guān)研究領(lǐng)域。開集識別的研究進(jìn)展對機(jī)器人視覺系統(tǒng)、工異常檢測、新藥物的發(fā)現(xiàn)、開集人臉識別等領(lǐng)域有著重大的應(yīng)用意義和實際經(jīng)濟(jì)效益。1.2研究現(xiàn)狀2013年,Scheirer[14]等首次將開集識別問題形式化,提出了一種1-vs-Set機(jī)器的初步解決方案。模型中包含一個開集風(fēng)險項,考慮超出訓(xùn)練數(shù)據(jù)集中已知類別合理支持的范圍空間。具體來說,他們在特征空間中加入了一個與支持向量機(jī)得到的分離超平面平行的超平面,在特征空間中形成了一個夾板。進(jìn)一步,定義線性核平板模型的開集風(fēng)險。在這種情況下,出現(xiàn)在兩個超平面之間的測試樣本將被標(biāo)記為適當(dāng)?shù)念。其他的測試樣本將被視為非目標(biāo)類或被拒絕。從那時起,開集識別就引
中原工學(xué)院碩士學(xué)位論文13征向量距離流形面的距離小于閾值時,可以認(rèn)為測試圖像是一個正常的數(shù)據(jù)。圖1.3對訓(xùn)練數(shù)據(jù)集標(biāo)簽的不同處理的模型對比當(dāng)然,也可以如圖1.4右圖所示設(shè)置一個距離拒絕域。圖像測試樣例生成的圖像特征向量距離流形面的距離大于距離拒絕域的上界,才會被認(rèn)為是異常數(shù)據(jù)。當(dāng)測試圖像生成的圖像特征向量距離流形面的距離落在距離拒絕域中,可以讓人工決策是否為異常類別。同樣地,在概率生成模型中,可以設(shè)置一個概率閾值或概率拒絕域。在圖1.3中的第三行子圖中,將圖像數(shù)據(jù)標(biāo)簽和圖像數(shù)據(jù)融合,通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到數(shù)據(jù)特征的流形分布,這樣會學(xué)習(xí)到更有區(qū)分性的圖像特征。使得內(nèi)類圖像特征更緊湊,類間圖像特征更分散。從而達(dá)到更好的開集識別效果。圖1.4二分類的閾值判別和拒絕域判別由于訓(xùn)練圖像數(shù)據(jù)標(biāo)簽的引入。在訓(xùn)練開集圖像識別的過程中,考慮到訓(xùn)練數(shù)據(jù)標(biāo)簽信息,所以損失函數(shù)也需要考慮標(biāo)簽信息。
本文編號:3091681
【文章來源】:中原工學(xué)院河南省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
傳統(tǒng)的識別和開集識別的比較
中原工學(xué)院碩士學(xué)位論文4圖1.2訓(xùn)練數(shù)據(jù)的樣例分布及生成概率的示意圖[8]在一個共同的閉集或靜態(tài)環(huán)境的假設(shè)下,訓(xùn)練和測試數(shù)據(jù)來自相同的分布。傳統(tǒng)的識別和分類算法已經(jīng)在各種閉集假設(shè)環(huán)境下的機(jī)器學(xué)習(xí)任務(wù)中取得了顯著的效果。然而,更現(xiàn)實的場景通常是開放的、非靜態(tài)的,如無人駕駛、工業(yè)故障檢測、醫(yī)療診斷等。在這些場景中,可能會出現(xiàn)未知的意外情況,這大大削弱了這些現(xiàn)有方法的魯棒性。為迎接這一挑戰(zhàn),近幾年研究人員實際探索了終身學(xué)習(xí)(LifelongLearning)[9]、轉(zhuǎn)移學(xué)習(xí)(TransferLearning)[10]、領(lǐng)域適應(yīng)(DomainAdaption)[11]、零樣本(Zero-shotLearning,ZSL)[12]、單樣本(少樣本)學(xué)習(xí)識別(One-shotLearning&Few-shotLearning)[13]、開集識別(OpenSetRecognition,OSR)等相關(guān)研究領(lǐng)域。開集識別的研究進(jìn)展對機(jī)器人視覺系統(tǒng)、工異常檢測、新藥物的發(fā)現(xiàn)、開集人臉識別等領(lǐng)域有著重大的應(yīng)用意義和實際經(jīng)濟(jì)效益。1.2研究現(xiàn)狀2013年,Scheirer[14]等首次將開集識別問題形式化,提出了一種1-vs-Set機(jī)器的初步解決方案。模型中包含一個開集風(fēng)險項,考慮超出訓(xùn)練數(shù)據(jù)集中已知類別合理支持的范圍空間。具體來說,他們在特征空間中加入了一個與支持向量機(jī)得到的分離超平面平行的超平面,在特征空間中形成了一個夾板。進(jìn)一步,定義線性核平板模型的開集風(fēng)險。在這種情況下,出現(xiàn)在兩個超平面之間的測試樣本將被標(biāo)記為適當(dāng)?shù)念。其他的測試樣本將被視為非目標(biāo)類或被拒絕。從那時起,開集識別就引
中原工學(xué)院碩士學(xué)位論文13征向量距離流形面的距離小于閾值時,可以認(rèn)為測試圖像是一個正常的數(shù)據(jù)。圖1.3對訓(xùn)練數(shù)據(jù)集標(biāo)簽的不同處理的模型對比當(dāng)然,也可以如圖1.4右圖所示設(shè)置一個距離拒絕域。圖像測試樣例生成的圖像特征向量距離流形面的距離大于距離拒絕域的上界,才會被認(rèn)為是異常數(shù)據(jù)。當(dāng)測試圖像生成的圖像特征向量距離流形面的距離落在距離拒絕域中,可以讓人工決策是否為異常類別。同樣地,在概率生成模型中,可以設(shè)置一個概率閾值或概率拒絕域。在圖1.3中的第三行子圖中,將圖像數(shù)據(jù)標(biāo)簽和圖像數(shù)據(jù)融合,通過神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到數(shù)據(jù)特征的流形分布,這樣會學(xué)習(xí)到更有區(qū)分性的圖像特征。使得內(nèi)類圖像特征更緊湊,類間圖像特征更分散。從而達(dá)到更好的開集識別效果。圖1.4二分類的閾值判別和拒絕域判別由于訓(xùn)練圖像數(shù)據(jù)標(biāo)簽的引入。在訓(xùn)練開集圖像識別的過程中,考慮到訓(xùn)練數(shù)據(jù)標(biāo)簽信息,所以損失函數(shù)也需要考慮標(biāo)簽信息。
本文編號:3091681
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3091681.html
最近更新
教材專著