基于深度學(xué)習(xí)的通用目標(biāo)檢測方法研究
發(fā)布時間:2021-07-10 14:26
目標(biāo)檢測技術(shù)作為計算機視覺領(lǐng)域的核心研究課題之一,是重要的計算機視覺任務(wù)。近些年來,伴隨著硬件計算能力的提升、大數(shù)據(jù)集的誕生以及深度學(xué)習(xí)技術(shù)的發(fā)展,目標(biāo)檢測性能得到極大提升。其中,深度卷積神經(jīng)網(wǎng)絡(luò)由于其結(jié)構(gòu)優(yōu)勢,在圖像特征提取方面有著傳統(tǒng)目標(biāo)檢測難以比擬的優(yōu)勢,具有強大的特征提取能力和可學(xué)習(xí)性,能夠有效地提取圖像特征信息,F(xiàn)有的目標(biāo)檢測方法中,檢測精度和檢測速度始終無法兼顧,如何又好又快地實現(xiàn)目標(biāo)的精準(zhǔn)檢測仍然是廣大研究人員的一大難題。本文針對現(xiàn)有的目標(biāo)檢測框架中存在的精度和速度不能兼顧以及對小目標(biāo)檢測效果不佳等問題,在基于候選區(qū)域思想的目標(biāo)檢測算法基礎(chǔ)上,提出了一種新型的基于卷積神經(jīng)網(wǎng)絡(luò)的方法,主要研究內(nèi)容如下:(1)由于傳統(tǒng)CNN網(wǎng)絡(luò)模型的參數(shù)較多,特征圖維度較高,導(dǎo)致內(nèi)存占用大,數(shù)據(jù)量多,計算成本高,檢測花費時間較長,同時也很難部署在內(nèi)存資源有限的移動設(shè)備上。因此為了降低在特征提取階段的參數(shù),本文在用于提取特征的主干網(wǎng)絡(luò)上,加上深度可分離卷積層,對特征圖進行壓縮,從而減小數(shù)據(jù)量,降低計算成本。深度可分離卷積通過將標(biāo)準(zhǔn)卷積分解為深度卷積與逐點卷積,分兩步完成對圖像特征的提取與合并,...
【文章來源】:浙江理工大學(xué)浙江省
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.2?ZF-Net結(jié)構(gòu)示意圖??(3)?VGGNet??2014年,牛津大學(xué)的karen?Simonyan和Andrew?Zisserman在之前的基礎(chǔ)上建立了新??
shortcut”模塊的殘差映射關(guān)系描述是為(F(x)=H(X)-x),而并非是一個學(xué)習(xí)的卷積層??函數(shù)F(x)。如果運用ResNet對“shortcut”進行濾波處理,并能夠量模塊中的兩層結(jié)構(gòu)??轉(zhuǎn)換為(1x1,3x3,14)的三層結(jié)構(gòu),進而使參數(shù)的權(quán)重數(shù)量得到優(yōu)化,當(dāng)濾波器的結(jié)構(gòu)??為lxl時,模塊中的參數(shù)權(quán)重數(shù)量會顯著減少。ResNet結(jié)構(gòu)的優(yōu)化詳情見圖。??F(X?1?relU?\?identity??Weight?layer?J??F(x)+x??”?relu??圖2.3殘差塊示意圖??2.2目標(biāo)檢測算法的發(fā)展歷程??目標(biāo)檢測算法是一種使用較早的方法,其中包含了?HOG算法、SIFT算法、SURF算法。??隨著學(xué)者們在檢測方法上的不斷探索,最終提出了深度學(xué)習(xí)算法,并通過對深度學(xué)習(xí)算法??的不斷完善,使其逐漸在目標(biāo)檢測領(lǐng)域獲得了廣泛的使用。目標(biāo)檢測算法能夠通過對網(wǎng)絡(luò)??堆疊的特征來計算網(wǎng)絡(luò)結(jié)構(gòu)的函數(shù)損失數(shù)量,并結(jié)合特定公式來計算出目標(biāo)所在的聚類特??征與最佳點位(Loss?Function)。雖然傳統(tǒng)目標(biāo)檢測方法和基于深度學(xué)習(xí)的目標(biāo)檢測方法在??計算的原理上存在較大區(qū)別,但兩者都集成了對函數(shù)特征的類別劃分、函數(shù)位置的最優(yōu)解。??基于此,這兩種方法在目標(biāo)檢測中需要研究的問題主要為以下三種:???目標(biāo)會隨即出現(xiàn)在圖像的任意點位上???不同目標(biāo)的形狀存在較大差異???不同目標(biāo)的幾何尺寸也不盡相同??10??
jr.|?H?GCNN?1? ̄啲視?|??4?g化學(xué)習(xí)?|?H?YOLO?H?YOLO9C0C?H?Y〇l〇*3?j?一》|?外[????—6ridKNK?|??*\SD""""f-? ̄ ̄DSSO|?????????,?.?更大fimini3atdi|???|?Meg3et?|??^?DSM?I????Lfiir]?U[wii}-^C^D??,?,?—H?A-Fast-RCNK?I??j?ESSD?I?1?1??'一?—?|?OHEV?|??圖2.4目標(biāo)檢測算法的發(fā)展歷程??2.3深度學(xué)習(xí)目標(biāo)檢測法??隨著學(xué)術(shù)界對圖像分類檢測算法研究的不斷深入,深度學(xué)習(xí)算法對目標(biāo)檢測的質(zhì)量不??斷提高,并逐漸成為當(dāng)前最具實用性的自動特征學(xué)習(xí)法。相較于傳統(tǒng)目標(biāo)檢測算法,深度??學(xué)習(xí)算法能夠通過對目標(biāo)特征的預(yù)設(shè),來優(yōu)化學(xué)習(xí)的能力,并構(gòu)建出具有豐富信息量的模??型特征。首先,深度學(xué)習(xí)算法能夠通過兩端的對接來實現(xiàn)端與端之間的學(xué)習(xí),并實現(xiàn)對函??數(shù)的訓(xùn)練;其次在多層非線性變換處理的過程中,深度學(xué)習(xí)法能夠通過圖像的構(gòu)建來描述??不同目標(biāo)函數(shù)之間的慣性,從而免除了手工設(shè)計環(huán)節(jié)。上世紀(jì)90年代,CNN方法逐漸在??目標(biāo)檢測領(lǐng)域和目標(biāo)定位領(lǐng)域獲得了試驗性應(yīng)用,雖然初期獲得了一定效果,但由于數(shù)據(jù)??訓(xùn)練能力非常有限,導(dǎo)致計算的結(jié)果存在較大偏差。2012年之前,CNN算法的發(fā)展速度??較慢。但在2012之后,學(xué)術(shù)界對CNN算法的研宄興趣不斷增加,并在ImageNet1531計算的??過程中發(fā)揮出了良好效用,使目標(biāo)檢測算法的計算準(zhǔn)確性大幅提升。??深度學(xué)習(xí)算法在不同檢測階段產(chǎn)生效用也不盡相同,計算的機制存在較大區(qū)別,由
【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的圖像檢索研究[J]. 楊馥溢,何嘉. 計算機與數(shù)字工程. 2019(09)
[2]人工智能在汽車自動駕駛中的應(yīng)用[J]. 張美芳,王羽,鄭碧琪,張凱帆. 汽車工業(yè)研究. 2019(03)
[3]人工智能在安防領(lǐng)域的應(yīng)用研究[J]. 張加良. 自動化應(yīng)用. 2019(08)
[4]深度學(xué)習(xí)在圖像識別中的應(yīng)用研究綜述[J]. 鄭遠攀,李廣陽,李曄. 計算機工程與應(yīng)用. 2019(12)
[5]深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計算機視覺領(lǐng)域的應(yīng)用[J]. 張順,龔怡宏,王進軍. 計算機學(xué)報. 2019(03)
[6]現(xiàn)代智能視頻監(jiān)控研究綜述[J]. 吳群,王田,王漢武,賴永炫,鐘必能,陳永紅. 計算機應(yīng)用研究. 2016(06)
本文編號:3276085
【文章來源】:浙江理工大學(xué)浙江省
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.2?ZF-Net結(jié)構(gòu)示意圖??(3)?VGGNet??2014年,牛津大學(xué)的karen?Simonyan和Andrew?Zisserman在之前的基礎(chǔ)上建立了新??
shortcut”模塊的殘差映射關(guān)系描述是為(F(x)=H(X)-x),而并非是一個學(xué)習(xí)的卷積層??函數(shù)F(x)。如果運用ResNet對“shortcut”進行濾波處理,并能夠量模塊中的兩層結(jié)構(gòu)??轉(zhuǎn)換為(1x1,3x3,14)的三層結(jié)構(gòu),進而使參數(shù)的權(quán)重數(shù)量得到優(yōu)化,當(dāng)濾波器的結(jié)構(gòu)??為lxl時,模塊中的參數(shù)權(quán)重數(shù)量會顯著減少。ResNet結(jié)構(gòu)的優(yōu)化詳情見圖。??F(X?1?relU?\?identity??Weight?layer?J??F(x)+x??”?relu??圖2.3殘差塊示意圖??2.2目標(biāo)檢測算法的發(fā)展歷程??目標(biāo)檢測算法是一種使用較早的方法,其中包含了?HOG算法、SIFT算法、SURF算法。??隨著學(xué)者們在檢測方法上的不斷探索,最終提出了深度學(xué)習(xí)算法,并通過對深度學(xué)習(xí)算法??的不斷完善,使其逐漸在目標(biāo)檢測領(lǐng)域獲得了廣泛的使用。目標(biāo)檢測算法能夠通過對網(wǎng)絡(luò)??堆疊的特征來計算網(wǎng)絡(luò)結(jié)構(gòu)的函數(shù)損失數(shù)量,并結(jié)合特定公式來計算出目標(biāo)所在的聚類特??征與最佳點位(Loss?Function)。雖然傳統(tǒng)目標(biāo)檢測方法和基于深度學(xué)習(xí)的目標(biāo)檢測方法在??計算的原理上存在較大區(qū)別,但兩者都集成了對函數(shù)特征的類別劃分、函數(shù)位置的最優(yōu)解。??基于此,這兩種方法在目標(biāo)檢測中需要研究的問題主要為以下三種:???目標(biāo)會隨即出現(xiàn)在圖像的任意點位上???不同目標(biāo)的形狀存在較大差異???不同目標(biāo)的幾何尺寸也不盡相同??10??
jr.|?H?GCNN?1? ̄啲視?|??4?g化學(xué)習(xí)?|?H?YOLO?H?YOLO9C0C?H?Y〇l〇*3?j?一》|?外[????—6ridKNK?|??*\SD""""f-? ̄ ̄DSSO|?????????,?.?更大fimini3atdi|???|?Meg3et?|??^?DSM?I????Lfiir]?U[wii}-^C^D??,?,?—H?A-Fast-RCNK?I??j?ESSD?I?1?1??'一?—?|?OHEV?|??圖2.4目標(biāo)檢測算法的發(fā)展歷程??2.3深度學(xué)習(xí)目標(biāo)檢測法??隨著學(xué)術(shù)界對圖像分類檢測算法研究的不斷深入,深度學(xué)習(xí)算法對目標(biāo)檢測的質(zhì)量不??斷提高,并逐漸成為當(dāng)前最具實用性的自動特征學(xué)習(xí)法。相較于傳統(tǒng)目標(biāo)檢測算法,深度??學(xué)習(xí)算法能夠通過對目標(biāo)特征的預(yù)設(shè),來優(yōu)化學(xué)習(xí)的能力,并構(gòu)建出具有豐富信息量的模??型特征。首先,深度學(xué)習(xí)算法能夠通過兩端的對接來實現(xiàn)端與端之間的學(xué)習(xí),并實現(xiàn)對函??數(shù)的訓(xùn)練;其次在多層非線性變換處理的過程中,深度學(xué)習(xí)法能夠通過圖像的構(gòu)建來描述??不同目標(biāo)函數(shù)之間的慣性,從而免除了手工設(shè)計環(huán)節(jié)。上世紀(jì)90年代,CNN方法逐漸在??目標(biāo)檢測領(lǐng)域和目標(biāo)定位領(lǐng)域獲得了試驗性應(yīng)用,雖然初期獲得了一定效果,但由于數(shù)據(jù)??訓(xùn)練能力非常有限,導(dǎo)致計算的結(jié)果存在較大偏差。2012年之前,CNN算法的發(fā)展速度??較慢。但在2012之后,學(xué)術(shù)界對CNN算法的研宄興趣不斷增加,并在ImageNet1531計算的??過程中發(fā)揮出了良好效用,使目標(biāo)檢測算法的計算準(zhǔn)確性大幅提升。??深度學(xué)習(xí)算法在不同檢測階段產(chǎn)生效用也不盡相同,計算的機制存在較大區(qū)別,由
【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的圖像檢索研究[J]. 楊馥溢,何嘉. 計算機與數(shù)字工程. 2019(09)
[2]人工智能在汽車自動駕駛中的應(yīng)用[J]. 張美芳,王羽,鄭碧琪,張凱帆. 汽車工業(yè)研究. 2019(03)
[3]人工智能在安防領(lǐng)域的應(yīng)用研究[J]. 張加良. 自動化應(yīng)用. 2019(08)
[4]深度學(xué)習(xí)在圖像識別中的應(yīng)用研究綜述[J]. 鄭遠攀,李廣陽,李曄. 計算機工程與應(yīng)用. 2019(12)
[5]深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計算機視覺領(lǐng)域的應(yīng)用[J]. 張順,龔怡宏,王進軍. 計算機學(xué)報. 2019(03)
[6]現(xiàn)代智能視頻監(jiān)控研究綜述[J]. 吳群,王田,王漢武,賴永炫,鐘必能,陳永紅. 計算機應(yīng)用研究. 2016(06)
本文編號:3276085
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3276085.html
最近更新
教材專著