基于深度學(xué)習(xí)的細(xì)粒度圖像分類方法研究
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2 人臉細(xì)粒度圖像分類識(shí)別結(jié)果
為了驗(yàn)證所研究方法的分類識(shí)別的效果,隨機(jī)選取上文數(shù)據(jù)庫(kù)中的三幅不同人臉、不同表情的人臉圖像。將所研究方法與文獻(xiàn)[3](基于深度遷移學(xué)習(xí)的微型細(xì)粒度圖像分類)和文獻(xiàn)[4](基于文本與視覺(jué)信息的細(xì)粒度圖像分類)進(jìn)行對(duì)比仿真,測(cè)試三種方法的分類如圖2所示。由圖2可知,文獻(xiàn)[3]方法的分....
圖1.1總體技術(shù)方案
基于深度學(xué)習(xí)的細(xì)粒度圖像分類方法研究6使用多尺度特征采樣方法對(duì)特征區(qū)域進(jìn)行采樣,在兼顧巖石樣本整體特征信息的同時(shí),挖掘樣本多種尺度細(xì)節(jié)信息;最后,使用超圖的特征融合方法統(tǒng)籌樣本的整體和細(xì)節(jié)特征信息。該識(shí)別方法為大規(guī)模的巖石圖像標(biāo)注和識(shí)別提供了一種新方法,有效提高了細(xì)粒度巖石圖像的....
圖2.1ResNet構(gòu)建單元(Heetal.,2016)
判愕奶卣魈崛∧芰Γ??綺閌?蕉啾澩錟芰υ角浚?深層網(wǎng)絡(luò)提取的特征更抽象,更具有語(yǔ)義信息。但隨著網(wǎng)絡(luò)深度的增加,模型的精度會(huì)逐漸增加到飽和并迅速下降,這就是深層網(wǎng)絡(luò)的“退化(degradation)”問(wèn)題。雖然許多深度網(wǎng)絡(luò)采取了ReLU激活函數(shù)、批量歸一化(BN)等操作緩解梯度消失....
圖2.2RetinaNet基礎(chǔ)結(jié)構(gòu)(Linetal.,2017b)
由于受制于類別失衡(classimbalance),算法的檢測(cè)精度偏低。為了解決類別失衡這一問(wèn)題,Lin等人(2017b)提出使用focalloss替代交叉熵?fù)p失,通過(guò)調(diào)整損失函數(shù)的計(jì)算公式使一階段目標(biāo)檢測(cè)算法達(dá)到和FasterR-CNN同樣的準(zhǔn)確度。focalloss的計(jì)算方式....
本文編號(hào):4033722
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4033722.html