基于深度學(xué)習(xí)的多標(biāo)簽圖像分類方法研究
發(fā)布時(shí)間:2022-01-14 06:29
隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,圖像信息在爆發(fā)式增長(zhǎng)的各類數(shù)據(jù)信息資源中占據(jù)著重大的比例。面對(duì)海量的數(shù)據(jù),人們?nèi)绾握、分析、獲取到自己需要的信息就變得格外重要。在現(xiàn)實(shí)生活中,圖像信息大多包含豐富的語義信息,如多個(gè)目標(biāo),場(chǎng)景,行為等。因此,多標(biāo)簽圖像分類方法的研究有著更為實(shí)際的意義。深度學(xué)習(xí)的發(fā)展將人們對(duì)計(jì)算機(jī)視覺領(lǐng)域的研究帶入了一個(gè)新紀(jì)元,卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)中的典型模型被成功的大量用于計(jì)算機(jī)視覺的各個(gè)領(lǐng)域。本文針對(duì)多標(biāo)簽圖像分類問題,基于深度學(xué)習(xí)理論,詳細(xì)分析和深入研究多種多標(biāo)簽圖像分類模型,并提出了基于深度學(xué)習(xí)模型的多標(biāo)簽圖像分類方法。全文主要研究?jī)?nèi)容如下:1.介紹了多標(biāo)簽圖像分類方法和深度學(xué)習(xí)的研究背景及意義和研究現(xiàn)狀。針對(duì)多標(biāo)簽圖像分類研究課題進(jìn)行了深入的研究分析,包括傳統(tǒng)的多標(biāo)簽圖像分類方法和基于深度學(xué)習(xí)的多標(biāo)簽圖像分類方法的基本理論。同時(shí),詳細(xì)介紹了多標(biāo)簽圖像分類方法的基本架構(gòu)和思路,并對(duì)典型的分類模型進(jìn)行了詳細(xì)的分析。2.針對(duì)多標(biāo)簽圖像分類方法中捕獲語義關(guān)聯(lián)信息的難點(diǎn),提出一種基于卷積神經(jīng)網(wǎng)絡(luò)并融合注意力機(jī)制和語義關(guān)聯(lián)性的多標(biāo)簽圖像分類方法。首先,利用卷積神經(jīng)網(wǎng)絡(luò)來提取特...
【文章來源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
一個(gè)三層金字塔模型舉例Fig2.3Anexampleofathree-layerpyramidmodel
NeocognitronHuel&WieselLeCun1989LeNetAlexNetDropoutReLUFast R-CNNSPP-NetR-CNNInception V3Inception V4NINGoogleNetVGG16VGG19MSRANetFaster R-CNN早期嘗試ResNet Densenet網(wǎng)絡(luò)加深增強(qiáng)卷積模塊功能從分類任務(wù)到檢測(cè)任務(wù)兩條路線的集成,訓(xùn)練更深的網(wǎng)絡(luò)結(jié)構(gòu),加速收斂歷史突破圖 2. 4 卷積神經(jīng)網(wǎng)絡(luò)發(fā)展趨勢(shì)Fig 2. 4 The development trend of convolutional neural networks雖然不同卷積網(wǎng)絡(luò)模型之間存在著一定的差異性,但 ALexNet 網(wǎng)絡(luò)模型的框架是大多網(wǎng)絡(luò)模型的基礎(chǔ),因此,如圖 2.5 所示,以 ALexNet 模型為例,介紹卷積神經(jīng)網(wǎng)絡(luò)的主要結(jié)構(gòu)。
損失函數(shù)L(Y, f(x))評(píng)價(jià)預(yù)測(cè)函數(shù)f(x)的準(zhǔn)確程度損失函數(shù)越小,模型越好圖 2. 8 損失函數(shù)定義Fig 2. 8 Definition of the loss function類型有很多,圖像分類中基于支持向量機(jī)的二元支持向量機(jī)[40,41](SVM)一種二分類器,其關(guān)鍵樣本之間間隔最大的超平面,通常采用間隔最大。線性支持向量機(jī)是支持向量機(jī)的一種,線性的分,如圖 2.9 所示,可以直接通過一個(gè)超平面直接
本文編號(hào):3587994
【文章來源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
一個(gè)三層金字塔模型舉例Fig2.3Anexampleofathree-layerpyramidmodel
NeocognitronHuel&WieselLeCun1989LeNetAlexNetDropoutReLUFast R-CNNSPP-NetR-CNNInception V3Inception V4NINGoogleNetVGG16VGG19MSRANetFaster R-CNN早期嘗試ResNet Densenet網(wǎng)絡(luò)加深增強(qiáng)卷積模塊功能從分類任務(wù)到檢測(cè)任務(wù)兩條路線的集成,訓(xùn)練更深的網(wǎng)絡(luò)結(jié)構(gòu),加速收斂歷史突破圖 2. 4 卷積神經(jīng)網(wǎng)絡(luò)發(fā)展趨勢(shì)Fig 2. 4 The development trend of convolutional neural networks雖然不同卷積網(wǎng)絡(luò)模型之間存在著一定的差異性,但 ALexNet 網(wǎng)絡(luò)模型的框架是大多網(wǎng)絡(luò)模型的基礎(chǔ),因此,如圖 2.5 所示,以 ALexNet 模型為例,介紹卷積神經(jīng)網(wǎng)絡(luò)的主要結(jié)構(gòu)。
損失函數(shù)L(Y, f(x))評(píng)價(jià)預(yù)測(cè)函數(shù)f(x)的準(zhǔn)確程度損失函數(shù)越小,模型越好圖 2. 8 損失函數(shù)定義Fig 2. 8 Definition of the loss function類型有很多,圖像分類中基于支持向量機(jī)的二元支持向量機(jī)[40,41](SVM)一種二分類器,其關(guān)鍵樣本之間間隔最大的超平面,通常采用間隔最大。線性支持向量機(jī)是支持向量機(jī)的一種,線性的分,如圖 2.9 所示,可以直接通過一個(gè)超平面直接
本文編號(hào):3587994
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3587994.html
最近更新
教材專著