基于特征增強的物體檢測分割方法研究
發(fā)布時間:2021-12-12 06:41
人工智能目前是一個比較熱門的領域,在生活中有許多實際的應用場景,發(fā)展空間也是相當大,一些方向比如檢測識別圖像、分割圖像等任務也受到了許多的關注。本文主要通過特征增強的方式來改進檢測和分割網(wǎng)絡的性能。具體來說,通過改進網(wǎng)絡結構來改善檢測分割性能,檢測方面,有通過角點檢測的方式來得到候選框,存在的性能瓶頸主要是角點檢測這塊,通過邊緣檢測的分支,因為角點的確定是通過邊緣,那么通過在訓練時候增加的邊緣檢測分支可以進一步提高角點檢測的準確性。在語義分割方面,一般是通過引入語義信息更強的深層輸出即高層信息來引導底層信息通過跳過連接傳到高層部分的信息,但是仍然存在一些缺陷,沒有考慮到底層和高層信息的域差異問題,本文通過域轉換的方式,在特征融合之前,將底層的特征域向高層的特征域轉換,最后達到去除底層細節(jié)信息帶來的噪聲問題。本論文在公開的COCO數(shù)據(jù)集以及PASCAL VOC和Cityscape上做實驗,驗證了特征增強在上述兩個方向上的有效性。本文深入研究了特征增強在不帶來太多計算量的同時,對性能較好的模型帶來的性能提升。本論文進一步研究了組合檢測和分割進行實例分割的問題,提出了一種加入GRU模塊的簡單...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
圖1-1?Faster?RCNN網(wǎng)絡結構圖??R-CNN?[1]網(wǎng)絡一出.習法進取,??
?.哈爾_:r業(yè)太學謂顆;論丈???器人導航和精準農業(yè)等人工智能領域具有廣泛的應用前景^近年來,快速發(fā)展??的深度卷積神經網(wǎng)絡(CNN)?[2Q_29]大大提高了語義分割的性能。作為開創(chuàng)性的??工作[36],Long等人提出完全卷積網(wǎng)絡(FCN)進行語義分割,如圖1-2所示,??其中FCN通過使用編碼器模型逐步降低空:間分辨率的方法提取語義信息,詞時??通過在解碼器模型中上采樣恢復分辨率的操作。即使FCN的編碼器模型可以學??習高級語義條信息,由于分辨率降低,它丟棄了大量空間細節(jié)宿息,從而導致??不準確的分割結果,尤其是在物體的邊界上。為了解決上述何題,最近提出了??—些方法引入了一個或幾個跳過連接模塊來將編碼器連接到解碼器模型,例如??U-Net—和?DeepLabv3+[?>]。這種跳過連接模塊可以融合編碼器提供的底層特征??和解碼器具有的高層特征,從而提高了分割性能,通過將高分辨率空間細節(jié)引??入低分辨率語義特征。??同時公開了數(shù)據(jù)集如?Mapillary?Vistas[35],PASCAL-Context問,ADE2〇K間,??COCO-Stuff?10K[33],Cityscapes間等進一步推動了語義分割的進展。由于網(wǎng)絡??結構中還有全連接層,仍然有很大的提升空間,AlexNet[37],VGGNet[38]和??GoogLeNet^I通過將分類網(wǎng)絡轉為全卷積的網(wǎng)絡,即網(wǎng)絡結構中無全連接層,??如圖1-2所示,至此將語義分割的問題轉化成為端到端的學習預測問題,基于??卷積神經網(wǎng)絡也就成為分割網(wǎng)絡的主流。??A?forward??圖1-2全卷積網(wǎng)絡??Long等首先成功地將深度卷積應用于語義分割任
?.哈爾_:r業(yè)太學謂顆;論丈???只是跳過連接效果不明M,所以使用語義嵌入分支(SEB)用來提供更多的底戻??信息到高層信息中去。另外,上下文的信息和多尺度的特征也可以用來進一步??提升分割性能。并且為了降低像素級的標注成本,最近提出的網(wǎng)絡結構有的通??過使用弱監(jiān)督的信息,比如通過檢測框或者圖像類別的信息來提升語義分割的??模型的性能。??Encoder-decoder?U-Net??X???—*??*?—*?—?????y?x?*?—?????—??—*???y??????Lzr?????? ̄?Lzr??圖1-3編碼器-解碼器結構??總的來說,檢測和分割的何題不斷有新的研究成果,目前仍然是一個比較??有挑戰(zhàn)的任務,國內外一直有新的論文發(fā)表,所以仍然存在很大的空間可以提??升。.本文的研宄的內容主要可以概括為通過増強特征的方式來改進網(wǎng)絡結構來??改善檢測分割性能,比如Cornernet通過角點檢測的方式來檢測,Exfuse通過引??入語義信息更強的深層輸出來引導底層信息通過跳過連接傳到高層部分的信息。??但是仍然存在一些缺陷,比如角點檢測的準確率仍然是性能的瓶頸,Exfuse沒??有考慮到底層和高層信息的域差異何題。因此本文中將討論如何通過增強邊緣??檢測的能力以及域適應的思路設計研宄方案。??-7?-??
本文編號:3536191
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
圖1-1?Faster?RCNN網(wǎng)絡結構圖??R-CNN?[1]網(wǎng)絡一出.習法進取,??
?.哈爾_:r業(yè)太學謂顆;論丈???器人導航和精準農業(yè)等人工智能領域具有廣泛的應用前景^近年來,快速發(fā)展??的深度卷積神經網(wǎng)絡(CNN)?[2Q_29]大大提高了語義分割的性能。作為開創(chuàng)性的??工作[36],Long等人提出完全卷積網(wǎng)絡(FCN)進行語義分割,如圖1-2所示,??其中FCN通過使用編碼器模型逐步降低空:間分辨率的方法提取語義信息,詞時??通過在解碼器模型中上采樣恢復分辨率的操作。即使FCN的編碼器模型可以學??習高級語義條信息,由于分辨率降低,它丟棄了大量空間細節(jié)宿息,從而導致??不準確的分割結果,尤其是在物體的邊界上。為了解決上述何題,最近提出了??—些方法引入了一個或幾個跳過連接模塊來將編碼器連接到解碼器模型,例如??U-Net—和?DeepLabv3+[?>]。這種跳過連接模塊可以融合編碼器提供的底層特征??和解碼器具有的高層特征,從而提高了分割性能,通過將高分辨率空間細節(jié)引??入低分辨率語義特征。??同時公開了數(shù)據(jù)集如?Mapillary?Vistas[35],PASCAL-Context問,ADE2〇K間,??COCO-Stuff?10K[33],Cityscapes間等進一步推動了語義分割的進展。由于網(wǎng)絡??結構中還有全連接層,仍然有很大的提升空間,AlexNet[37],VGGNet[38]和??GoogLeNet^I通過將分類網(wǎng)絡轉為全卷積的網(wǎng)絡,即網(wǎng)絡結構中無全連接層,??如圖1-2所示,至此將語義分割的問題轉化成為端到端的學習預測問題,基于??卷積神經網(wǎng)絡也就成為分割網(wǎng)絡的主流。??A?forward??圖1-2全卷積網(wǎng)絡??Long等首先成功地將深度卷積應用于語義分割任
?.哈爾_:r業(yè)太學謂顆;論丈???只是跳過連接效果不明M,所以使用語義嵌入分支(SEB)用來提供更多的底戻??信息到高層信息中去。另外,上下文的信息和多尺度的特征也可以用來進一步??提升分割性能。并且為了降低像素級的標注成本,最近提出的網(wǎng)絡結構有的通??過使用弱監(jiān)督的信息,比如通過檢測框或者圖像類別的信息來提升語義分割的??模型的性能。??Encoder-decoder?U-Net??X???—*??*?—*?—?????y?x?*?—?????—??—*???y??????Lzr?????? ̄?Lzr??圖1-3編碼器-解碼器結構??總的來說,檢測和分割的何題不斷有新的研究成果,目前仍然是一個比較??有挑戰(zhàn)的任務,國內外一直有新的論文發(fā)表,所以仍然存在很大的空間可以提??升。.本文的研宄的內容主要可以概括為通過増強特征的方式來改進網(wǎng)絡結構來??改善檢測分割性能,比如Cornernet通過角點檢測的方式來檢測,Exfuse通過引??入語義信息更強的深層輸出來引導底層信息通過跳過連接傳到高層部分的信息。??但是仍然存在一些缺陷,比如角點檢測的準確率仍然是性能的瓶頸,Exfuse沒??有考慮到底層和高層信息的域差異何題。因此本文中將討論如何通過增強邊緣??檢測的能力以及域適應的思路設計研宄方案。??-7?-??
本文編號:3536191
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3536191.html
最近更新
教材專著