基于深度學(xué)習(xí)的多尺度目標(biāo)檢測與分割算法研究
發(fā)布時間:2021-06-15 18:37
深度學(xué)習(xí)技術(shù)得益于算力的提升和大數(shù)據(jù)時代的到來,取得了重大突破,尤其是以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的計(jì)算機(jī)視覺領(lǐng)域得到迅猛地發(fā)展,并在目標(biāo)檢測,目標(biāo)分割等多個任務(wù)上取得了遠(yuǎn)超傳統(tǒng)算法的效果。但是由于深度學(xué)習(xí)算法需要海量的數(shù)據(jù)進(jìn)行訓(xùn)練,待檢測目標(biāo)的多尺度變化帶來了新的挑戰(zhàn)。通常情況下,研究人員從卷積網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì),數(shù)據(jù)處理,卷積操作三個方面來解決多尺度問題。在卷積網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)方面,并行設(shè)計(jì)讓網(wǎng)絡(luò)使用盡量少的參數(shù)的同時提取到目標(biāo)的多尺度特征,串行設(shè)計(jì)使得不同尺度的特征信息得以融合,多尺度預(yù)測在不同尺度的特征圖上進(jìn)行預(yù)測。本文以此為基礎(chǔ),設(shè)計(jì)了一種輕量級的多尺度目標(biāo)檢測網(wǎng)絡(luò)結(jié)構(gòu),該網(wǎng)絡(luò)同時考量計(jì)算復(fù)雜度和模型效果,在尺度變化較大的COCO數(shù)據(jù)集上得到了雙贏的結(jié)果。在數(shù)據(jù)處理方面,基于裁剪和縮放的算法使得不同尺度的目標(biāo)在相同尺度下進(jìn)行預(yù)測。在面對極小目標(biāo)和“超大圖像”時,通過有效的切片操作,使得圖像不需要經(jīng)過下采樣直接進(jìn)行預(yù)測。本文在切片算法的基礎(chǔ)上提出了一種切片融合算法,可以將被切分的目標(biāo)融合為完整的目標(biāo),解決了原本算法不可以有效檢測“超大圖像”中尺度變化目標(biāo)的問題。在卷積操作方面,可變形卷積通過對卷...
【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
目標(biāo)檢
江南大學(xué)碩士學(xué)位論文2(a)(b)圖1-2語義分割任務(wù)示意圖實(shí)例分割的目的是判斷在單張圖片或者連續(xù)圖片(視頻)中,感興趣的單個或者多個物體是否存在,如果存在,需要將感興趣的單個或者多個物體的具體像素位置在圖片中標(biāo)注出來。通常情況下我們使用一個同原圖像長寬相同的單通道二值矩陣對一個感興趣物體的實(shí)例分割結(jié)果進(jìn)行標(biāo)注,未出現(xiàn)感興趣物體的像素使用0表示,出現(xiàn)感興趣物體的像素用1表示。若有若干個感興趣物體,則需要若干個單通道二值矩陣表示實(shí)例分割的結(jié)果。如圖1-3所示,圖[1]中包含多個感興趣的物體,如人,自行車,道路,草地,天等,當(dāng)我們感興趣的目標(biāo)為人和自行車時,語義分割的任務(wù)就是將不同個體的人和自行車所在的像素點(diǎn)位置識別出來,并用單通道二值矩陣表示。(a)(b)圖1-3語義分割任務(wù)示意圖目標(biāo)檢測和實(shí)例分割這兩項(xiàng)任務(wù)所需要識別的對象都是單獨(dú)的個體,需要算法不僅要識別出來感興趣的物體是什么類別,而且要把相同類別的不同個體分隔開來。語義分割和實(shí)例分割這兩項(xiàng)任務(wù)對于被識別的對象來說,對于位置的識別比檢測中用矩形框表示的“大概的位置”更加嚴(yán)格,需要得到被識別對象的確切邊緣信息?梢哉f實(shí)例分割是目標(biāo)檢測和語義分割這兩項(xiàng)任務(wù)綜合起來得到的一個任務(wù),事實(shí)上,深度學(xué)習(xí)中語義分割算法也是由目標(biāo)檢測算法和語義分割算法發(fā)展而來。通常把計(jì)算機(jī)及信息技術(shù)革命稱之為第三次工業(yè)革命,在信息技術(shù)的浪潮下,人們的生活發(fā)生翻天覆地的變化。擁有視覺能力是人類賴以生存的技能,將信息技術(shù)應(yīng)
江南大學(xué)碩士學(xué)位論文2(a)(b)圖1-2語義分割任務(wù)示意圖實(shí)例分割的目的是判斷在單張圖片或者連續(xù)圖片(視頻)中,感興趣的單個或者多個物體是否存在,如果存在,需要將感興趣的單個或者多個物體的具體像素位置在圖片中標(biāo)注出來。通常情況下我們使用一個同原圖像長寬相同的單通道二值矩陣對一個感興趣物體的實(shí)例分割結(jié)果進(jìn)行標(biāo)注,未出現(xiàn)感興趣物體的像素使用0表示,出現(xiàn)感興趣物體的像素用1表示。若有若干個感興趣物體,則需要若干個單通道二值矩陣表示實(shí)例分割的結(jié)果。如圖1-3所示,圖[1]中包含多個感興趣的物體,如人,自行車,道路,草地,天等,當(dāng)我們感興趣的目標(biāo)為人和自行車時,語義分割的任務(wù)就是將不同個體的人和自行車所在的像素點(diǎn)位置識別出來,并用單通道二值矩陣表示。(a)(b)圖1-3語義分割任務(wù)示意圖目標(biāo)檢測和實(shí)例分割這兩項(xiàng)任務(wù)所需要識別的對象都是單獨(dú)的個體,需要算法不僅要識別出來感興趣的物體是什么類別,而且要把相同類別的不同個體分隔開來。語義分割和實(shí)例分割這兩項(xiàng)任務(wù)對于被識別的對象來說,對于位置的識別比檢測中用矩形框表示的“大概的位置”更加嚴(yán)格,需要得到被識別對象的確切邊緣信息?梢哉f實(shí)例分割是目標(biāo)檢測和語義分割這兩項(xiàng)任務(wù)綜合起來得到的一個任務(wù),事實(shí)上,深度學(xué)習(xí)中語義分割算法也是由目標(biāo)檢測算法和語義分割算法發(fā)展而來。通常把計(jì)算機(jī)及信息技術(shù)革命稱之為第三次工業(yè)革命,在信息技術(shù)的浪潮下,人們的生活發(fā)生翻天覆地的變化。擁有視覺能力是人類賴以生存的技能,將信息技術(shù)應(yīng)
本文編號:3231569
【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【部分圖文】:
目標(biāo)檢
江南大學(xué)碩士學(xué)位論文2(a)(b)圖1-2語義分割任務(wù)示意圖實(shí)例分割的目的是判斷在單張圖片或者連續(xù)圖片(視頻)中,感興趣的單個或者多個物體是否存在,如果存在,需要將感興趣的單個或者多個物體的具體像素位置在圖片中標(biāo)注出來。通常情況下我們使用一個同原圖像長寬相同的單通道二值矩陣對一個感興趣物體的實(shí)例分割結(jié)果進(jìn)行標(biāo)注,未出現(xiàn)感興趣物體的像素使用0表示,出現(xiàn)感興趣物體的像素用1表示。若有若干個感興趣物體,則需要若干個單通道二值矩陣表示實(shí)例分割的結(jié)果。如圖1-3所示,圖[1]中包含多個感興趣的物體,如人,自行車,道路,草地,天等,當(dāng)我們感興趣的目標(biāo)為人和自行車時,語義分割的任務(wù)就是將不同個體的人和自行車所在的像素點(diǎn)位置識別出來,并用單通道二值矩陣表示。(a)(b)圖1-3語義分割任務(wù)示意圖目標(biāo)檢測和實(shí)例分割這兩項(xiàng)任務(wù)所需要識別的對象都是單獨(dú)的個體,需要算法不僅要識別出來感興趣的物體是什么類別,而且要把相同類別的不同個體分隔開來。語義分割和實(shí)例分割這兩項(xiàng)任務(wù)對于被識別的對象來說,對于位置的識別比檢測中用矩形框表示的“大概的位置”更加嚴(yán)格,需要得到被識別對象的確切邊緣信息?梢哉f實(shí)例分割是目標(biāo)檢測和語義分割這兩項(xiàng)任務(wù)綜合起來得到的一個任務(wù),事實(shí)上,深度學(xué)習(xí)中語義分割算法也是由目標(biāo)檢測算法和語義分割算法發(fā)展而來。通常把計(jì)算機(jī)及信息技術(shù)革命稱之為第三次工業(yè)革命,在信息技術(shù)的浪潮下,人們的生活發(fā)生翻天覆地的變化。擁有視覺能力是人類賴以生存的技能,將信息技術(shù)應(yīng)
江南大學(xué)碩士學(xué)位論文2(a)(b)圖1-2語義分割任務(wù)示意圖實(shí)例分割的目的是判斷在單張圖片或者連續(xù)圖片(視頻)中,感興趣的單個或者多個物體是否存在,如果存在,需要將感興趣的單個或者多個物體的具體像素位置在圖片中標(biāo)注出來。通常情況下我們使用一個同原圖像長寬相同的單通道二值矩陣對一個感興趣物體的實(shí)例分割結(jié)果進(jìn)行標(biāo)注,未出現(xiàn)感興趣物體的像素使用0表示,出現(xiàn)感興趣物體的像素用1表示。若有若干個感興趣物體,則需要若干個單通道二值矩陣表示實(shí)例分割的結(jié)果。如圖1-3所示,圖[1]中包含多個感興趣的物體,如人,自行車,道路,草地,天等,當(dāng)我們感興趣的目標(biāo)為人和自行車時,語義分割的任務(wù)就是將不同個體的人和自行車所在的像素點(diǎn)位置識別出來,并用單通道二值矩陣表示。(a)(b)圖1-3語義分割任務(wù)示意圖目標(biāo)檢測和實(shí)例分割這兩項(xiàng)任務(wù)所需要識別的對象都是單獨(dú)的個體,需要算法不僅要識別出來感興趣的物體是什么類別,而且要把相同類別的不同個體分隔開來。語義分割和實(shí)例分割這兩項(xiàng)任務(wù)對于被識別的對象來說,對于位置的識別比檢測中用矩形框表示的“大概的位置”更加嚴(yán)格,需要得到被識別對象的確切邊緣信息?梢哉f實(shí)例分割是目標(biāo)檢測和語義分割這兩項(xiàng)任務(wù)綜合起來得到的一個任務(wù),事實(shí)上,深度學(xué)習(xí)中語義分割算法也是由目標(biāo)檢測算法和語義分割算法發(fā)展而來。通常把計(jì)算機(jī)及信息技術(shù)革命稱之為第三次工業(yè)革命,在信息技術(shù)的浪潮下,人們的生活發(fā)生翻天覆地的變化。擁有視覺能力是人類賴以生存的技能,將信息技術(shù)應(yīng)
本文編號:3231569
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3231569.html
最近更新
教材專著