基于深度模型遷移學(xué)習(xí)的花卉圖像分類方法
發(fā)布時(shí)間:2021-06-22 16:38
圖像分類是目前人工智能、模式識(shí)別領(lǐng)域的重要研究方向之一;ɑ軋D像分類,是以花卉為目標(biāo),對(duì)圖像中的花卉進(jìn)行生物學(xué)分類;其在植物物種研究與保護(hù)、園林花圃智能化管理中具有重要應(yīng)用價(jià)值。花卉圖像類別數(shù)量多、類間差異小、類內(nèi)差異大、背景復(fù)雜、樣本數(shù)量少,對(duì)其準(zhǔn)確分類往往難度較大。針對(duì)花卉圖像數(shù)據(jù)的這些特點(diǎn),本文以深度模型、遷移學(xué)習(xí)和多任務(wù)學(xué)習(xí)為理論指導(dǎo),進(jìn)行花卉圖像分類研究。主要工作內(nèi)容如下:(1)針對(duì)特征描述算子設(shè)計(jì)難度大、特征提取能力弱,以及深度模型結(jié)構(gòu)復(fù)雜、參數(shù)規(guī)模大、難以擬合小數(shù)據(jù)集的問(wèn)題,提出基于深度模型遷移學(xué)習(xí)的細(xì)粒度圖像分類方法。首先,通過(guò)在粗粒度圖像數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,使深度模型參數(shù)分布具備自然圖像特征提取能力;然后,對(duì)深度模型進(jìn)行局部訓(xùn)練,使其在細(xì)粒度圖像數(shù)據(jù)集上進(jìn)行遷移。實(shí)驗(yàn)結(jié)果表明,在102類花卉圖像數(shù)據(jù)集上,分類準(zhǔn)確率達(dá)到96.27%;此外,在120類狗、200類鳥(niǎo)、37類貓和狗、196類汽車圖像數(shù)據(jù)集上,該方法亦分別得到72.23%、73.33%、86.00%、89.72%的圖像分類準(zhǔn)確率,具有較好的準(zhǔn)確性與泛化性能。(2)深度模型的訓(xùn)練往往需要非常大的數(shù)據(jù)規(guī)模、非常多...
【文章來(lái)源】:河南師范大學(xué)河南省
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
深度模型訓(xùn)練示意圖
圖 2-2 LeNet 模型網(wǎng)絡(luò)結(jié)構(gòu)圖 2-2 中結(jié)構(gòu)主要分為 3部分:輸入層、卷積層、全連接層,輸入層輸入的為32 32 的灰度圖像,經(jīng)過(guò)卷積以及全連接后,降至 10 維的向量,即,該圖像為 0-9 數(shù)字的率組合。該結(jié)構(gòu)雖然僅有 4 層卷積,但與同期其他算法相比,對(duì)手寫字符的識(shí)別準(zhǔn)確為最優(yōu)。隨著計(jì)算能力的提高以及大數(shù)據(jù)的發(fā)展,出現(xiàn) AlexNet(AN)模型[15]。該模型網(wǎng)結(jié)構(gòu),如圖 2-3 所示。
圖 2-2 LeNet 模型網(wǎng)絡(luò)結(jié)構(gòu)圖 2-2 中結(jié)構(gòu)主要分為 3部分:輸入層、卷積層、全連接層,輸入層輸入的為32 32 的灰度圖像,經(jīng)過(guò)卷積以及全連接后,降至 10 維的向量,即,該圖像為 0-9 數(shù)字的率組合。該結(jié)構(gòu)雖然僅有 4 層卷積,但與同期其他算法相比,對(duì)手寫字符的識(shí)別準(zhǔn)確為最優(yōu)。隨著計(jì)算能力的提高以及大數(shù)據(jù)的發(fā)展,出現(xiàn) AlexNet(AN)模型[15]。該模型網(wǎng)結(jié)構(gòu),如圖 2-3 所示。
【參考文獻(xiàn)】:
期刊論文
[1]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou. National Science Review. 2018(01)
[2]A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation[J]. Bo Zhao,Jiashi Feng,Xiao Wu,Shuicheng Yan. International Journal of Automation and Computing. 2017(02)
[3]基于視覺(jué)的目標(biāo)檢測(cè)與跟蹤綜述[J]. 尹宏鵬,陳波,柴毅,劉兆棟. 自動(dòng)化學(xué)報(bào). 2016(10)
[4]神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計(jì)算機(jī)學(xué)報(bào). 2016(08)
[5]遷移學(xué)習(xí)研究進(jìn)展[J]. 莊福振,羅平,何清,史忠植. 軟件學(xué)報(bào). 2015(01)
[6]圖像物體分類與檢測(cè)算法綜述[J]. 黃凱奇,任偉強(qiáng),譚鐵牛. 計(jì)算機(jī)學(xué)報(bào). 2014(06)
本文編號(hào):3243177
【文章來(lái)源】:河南師范大學(xué)河南省
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
深度模型訓(xùn)練示意圖
圖 2-2 LeNet 模型網(wǎng)絡(luò)結(jié)構(gòu)圖 2-2 中結(jié)構(gòu)主要分為 3部分:輸入層、卷積層、全連接層,輸入層輸入的為32 32 的灰度圖像,經(jīng)過(guò)卷積以及全連接后,降至 10 維的向量,即,該圖像為 0-9 數(shù)字的率組合。該結(jié)構(gòu)雖然僅有 4 層卷積,但與同期其他算法相比,對(duì)手寫字符的識(shí)別準(zhǔn)確為最優(yōu)。隨著計(jì)算能力的提高以及大數(shù)據(jù)的發(fā)展,出現(xiàn) AlexNet(AN)模型[15]。該模型網(wǎng)結(jié)構(gòu),如圖 2-3 所示。
圖 2-2 LeNet 模型網(wǎng)絡(luò)結(jié)構(gòu)圖 2-2 中結(jié)構(gòu)主要分為 3部分:輸入層、卷積層、全連接層,輸入層輸入的為32 32 的灰度圖像,經(jīng)過(guò)卷積以及全連接后,降至 10 維的向量,即,該圖像為 0-9 數(shù)字的率組合。該結(jié)構(gòu)雖然僅有 4 層卷積,但與同期其他算法相比,對(duì)手寫字符的識(shí)別準(zhǔn)確為最優(yōu)。隨著計(jì)算能力的提高以及大數(shù)據(jù)的發(fā)展,出現(xiàn) AlexNet(AN)模型[15]。該模型網(wǎng)結(jié)構(gòu),如圖 2-3 所示。
【參考文獻(xiàn)】:
期刊論文
[1]A brief introduction to weakly supervised learning[J]. Zhi-Hua Zhou. National Science Review. 2018(01)
[2]A Survey on Deep Learning-based Fine-grained Object Classification and Semantic Segmentation[J]. Bo Zhao,Jiashi Feng,Xiao Wu,Shuicheng Yan. International Journal of Automation and Computing. 2017(02)
[3]基于視覺(jué)的目標(biāo)檢測(cè)與跟蹤綜述[J]. 尹宏鵬,陳波,柴毅,劉兆棟. 自動(dòng)化學(xué)報(bào). 2016(10)
[4]神經(jīng)網(wǎng)絡(luò)七十年:回顧與展望[J]. 焦李成,楊淑媛,劉芳,王士剛,馮志璽. 計(jì)算機(jī)學(xué)報(bào). 2016(08)
[5]遷移學(xué)習(xí)研究進(jìn)展[J]. 莊福振,羅平,何清,史忠植. 軟件學(xué)報(bào). 2015(01)
[6]圖像物體分類與檢測(cè)算法綜述[J]. 黃凱奇,任偉強(qiáng),譚鐵牛. 計(jì)算機(jī)學(xué)報(bào). 2014(06)
本文編號(hào):3243177
本文鏈接:http://sikaile.net/nykjlw/yylw/3243177.html
最近更新
教材專著