圖像物體的精細(xì)化分類(lèi)方法研究
發(fā)布時(shí)間:2021-11-23 16:14
圖像分類(lèi)是計(jì)算機(jī)視覺(jué)的基礎(chǔ)任務(wù),在實(shí)際場(chǎng)景中具有廣泛的應(yīng)用價(jià)值。當(dāng)前的圖像分類(lèi)大多基于深度學(xué)習(xí),特別是深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Network,DCNN)。雖然相對(duì)于傳統(tǒng)方法取得了顯著提升,基于DCNN的圖像分類(lèi)仍存在很多不足,分類(lèi)準(zhǔn)確率不能滿(mǎn)足實(shí)際應(yīng)用的需求。本文工作圍繞圖像分類(lèi)中的四個(gè)子任務(wù),包括通用圖像分類(lèi)、細(xì)粒度圖像分類(lèi)、多任務(wù)增量學(xué)習(xí)和多類(lèi)別增量學(xué)習(xí),由淺入深地研究圖像分類(lèi)在實(shí)際應(yīng)用中面臨的挑戰(zhàn)。其中通用圖像分類(lèi)是圖像分類(lèi)的基礎(chǔ)任務(wù),細(xì)粒度圖像分類(lèi)的類(lèi)別劃分更為精細(xì),多任務(wù)和多類(lèi)別增量學(xué)習(xí)致力于解決實(shí)際應(yīng)用中不同任務(wù)和類(lèi)別的數(shù)據(jù)分批次可見(jiàn)所帶來(lái)的問(wèn)題。本文的主要貢獻(xiàn)包括:(1)圍繞通用圖像分類(lèi)提出一種基于互補(bǔ)特征學(xué)習(xí)的學(xué)習(xí)框架DualNet。特征提取通常被視為圖像分類(lèi)中最重要的步驟,單個(gè)DCNN不能學(xué)習(xí)輸入圖像的所有細(xì)節(jié)特征。DualNet通過(guò)在訓(xùn)練過(guò)程中添加互補(bǔ)性約束協(xié)同兩個(gè)子網(wǎng)絡(luò)進(jìn)行互補(bǔ)學(xué)習(xí),融合不同子網(wǎng)絡(luò)提取的特征后得到關(guān)于輸入圖像更為準(zhǔn)確的特征描述。在多個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)表明DualNet可以取得比單個(gè)網(wǎng)絡(luò)以及模型集成方法更高...
【文章來(lái)源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:114 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.2細(xì)粒度圖像分類(lèi)示例:(a)黑腳信天翁(b)黑背信天翁(c)冠毛小海雀(d)溝咀犀鵑??
?(c)?(d)??圖1.2細(xì)粒度圖像分類(lèi)示例:(a)黑腳信天翁(b)黑背信天翁(c)冠毛小海雀(d)溝咀犀鵑??的26.2%降到了?15.3%,2017年SENet1"1將這一數(shù)字進(jìn)一步降到了?2.3%。DCNN??通過(guò)輸入和輸出之間的多個(gè)隱藏層實(shí)現(xiàn)了特征的分層抽象和組合,且隨著網(wǎng)絡(luò)加??深其非線(xiàn)性建模能力變得愈來(lái)愈強(qiáng)1121。DCNN的成功一方面得益于大規(guī)模帶標(biāo)簽??的數(shù)據(jù)集如ImageNet等,另一方面是由于它自身端到端的學(xué)習(xí)能力,目前DCNN??己成為包括圖像分類(lèi)在內(nèi)的多個(gè)視覺(jué)任務(wù)的主流方法。因此,本文在DCNN模??型下研宄圖像物體的分類(lèi)任務(wù)。??雖然DCNN相較于傳統(tǒng)圖像分類(lèi)方法取得了顯著的提升,但是模型本身還??存在一些不足,在實(shí)際場(chǎng)景中類(lèi)別總數(shù)固定、樣本充足的條件很難滿(mǎn)足,圖像分??類(lèi)任務(wù)的性能仍不能滿(mǎn)足實(shí)際應(yīng)用的要求,存在許多未解決的問(wèn)題。例如:??(a)
(^)??Target?model??圖1.3增量學(xué)習(xí)類(lèi)似于人的學(xué)習(xí)模式,允許模型在持續(xù)到來(lái)的新數(shù)據(jù)上進(jìn)行更新,當(dāng)每個(gè)??階段的新數(shù)據(jù)到來(lái)時(shí),由于隱私或存儲(chǔ)代價(jià)等因素,舊數(shù)據(jù)通常是不可見(jiàn)的??性的研宄課題。如何將DCNN更好地應(yīng)用于細(xì)粒度圖像分類(lèi),使得網(wǎng)絡(luò)能??夠自動(dòng)學(xué)習(xí)不同子類(lèi)之間細(xì)微的差別,值得進(jìn)一步探索。??(c)?DCNN訓(xùn)練過(guò)程通常要求所有數(shù)據(jù)同時(shí)可見(jiàn),而在實(shí)際場(chǎng)景中不同任務(wù)或??者類(lèi)別的數(shù)據(jù)往往是分批次可見(jiàn)的。當(dāng)把DCNN直接在新數(shù)據(jù)上進(jìn)行訓(xùn)練??時(shí),它在舊數(shù)據(jù)上學(xué)到的知識(shí)會(huì)很快被遺忘,這種現(xiàn)象被稱(chēng)為災(zāi)難性忘記??(Catastrophic?Forgetting)。因此需要設(shè)計(jì)一種學(xué)習(xí)方法,能夠訓(xùn)練得到一個(gè)??DCNN在分批次可見(jiàn)的不同任務(wù)或類(lèi)別上表現(xiàn)良好。??綜上所述,作為計(jì)算機(jī)視覺(jué)的基礎(chǔ)任務(wù),圖像分類(lèi)具有重要的研宄意義,然??而目前基于DCNN的圖像分類(lèi)方法存在很多不足。本文針對(duì)上述提到的問(wèn)題進(jìn)??行了深入的探索
本文編號(hào):3514239
【文章來(lái)源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:114 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.2細(xì)粒度圖像分類(lèi)示例:(a)黑腳信天翁(b)黑背信天翁(c)冠毛小海雀(d)溝咀犀鵑??
?(c)?(d)??圖1.2細(xì)粒度圖像分類(lèi)示例:(a)黑腳信天翁(b)黑背信天翁(c)冠毛小海雀(d)溝咀犀鵑??的26.2%降到了?15.3%,2017年SENet1"1將這一數(shù)字進(jìn)一步降到了?2.3%。DCNN??通過(guò)輸入和輸出之間的多個(gè)隱藏層實(shí)現(xiàn)了特征的分層抽象和組合,且隨著網(wǎng)絡(luò)加??深其非線(xiàn)性建模能力變得愈來(lái)愈強(qiáng)1121。DCNN的成功一方面得益于大規(guī)模帶標(biāo)簽??的數(shù)據(jù)集如ImageNet等,另一方面是由于它自身端到端的學(xué)習(xí)能力,目前DCNN??己成為包括圖像分類(lèi)在內(nèi)的多個(gè)視覺(jué)任務(wù)的主流方法。因此,本文在DCNN模??型下研宄圖像物體的分類(lèi)任務(wù)。??雖然DCNN相較于傳統(tǒng)圖像分類(lèi)方法取得了顯著的提升,但是模型本身還??存在一些不足,在實(shí)際場(chǎng)景中類(lèi)別總數(shù)固定、樣本充足的條件很難滿(mǎn)足,圖像分??類(lèi)任務(wù)的性能仍不能滿(mǎn)足實(shí)際應(yīng)用的要求,存在許多未解決的問(wèn)題。例如:??(a)
(^)??Target?model??圖1.3增量學(xué)習(xí)類(lèi)似于人的學(xué)習(xí)模式,允許模型在持續(xù)到來(lái)的新數(shù)據(jù)上進(jìn)行更新,當(dāng)每個(gè)??階段的新數(shù)據(jù)到來(lái)時(shí),由于隱私或存儲(chǔ)代價(jià)等因素,舊數(shù)據(jù)通常是不可見(jiàn)的??性的研宄課題。如何將DCNN更好地應(yīng)用于細(xì)粒度圖像分類(lèi),使得網(wǎng)絡(luò)能??夠自動(dòng)學(xué)習(xí)不同子類(lèi)之間細(xì)微的差別,值得進(jìn)一步探索。??(c)?DCNN訓(xùn)練過(guò)程通常要求所有數(shù)據(jù)同時(shí)可見(jiàn),而在實(shí)際場(chǎng)景中不同任務(wù)或??者類(lèi)別的數(shù)據(jù)往往是分批次可見(jiàn)的。當(dāng)把DCNN直接在新數(shù)據(jù)上進(jìn)行訓(xùn)練??時(shí),它在舊數(shù)據(jù)上學(xué)到的知識(shí)會(huì)很快被遺忘,這種現(xiàn)象被稱(chēng)為災(zāi)難性忘記??(Catastrophic?Forgetting)。因此需要設(shè)計(jì)一種學(xué)習(xí)方法,能夠訓(xùn)練得到一個(gè)??DCNN在分批次可見(jiàn)的不同任務(wù)或類(lèi)別上表現(xiàn)良好。??綜上所述,作為計(jì)算機(jī)視覺(jué)的基礎(chǔ)任務(wù),圖像分類(lèi)具有重要的研宄意義,然??而目前基于DCNN的圖像分類(lèi)方法存在很多不足。本文針對(duì)上述提到的問(wèn)題進(jìn)??行了深入的探索
本文編號(hào):3514239
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3514239.html
最近更新
教材專(zhuān)著