深度神經(jīng)網(wǎng)絡(luò)壓縮算法及其在目標(biāo)檢測中的應(yīng)用研究
發(fā)布時間:2021-01-24 07:16
目標(biāo)檢測是計算機(jī)視覺領(lǐng)域中的一個重要研究問題,并被廣泛應(yīng)用到智能化交通系統(tǒng)、智能監(jiān)控系統(tǒng)、人機(jī)互動以及醫(yī)學(xué)導(dǎo)航手術(shù)等眾多領(lǐng)域。近年來,深度學(xué)習(xí)方法在眾多領(lǐng)域中表現(xiàn)出優(yōu)異的效果,尤其是在計算機(jī)視覺領(lǐng)域取得了巨大的突破。目前,在絕大多數(shù)視覺任務(wù)中,基于深度神經(jīng)網(wǎng)絡(luò)的方法都處于領(lǐng)先地位。以Fast R-CNN、Faster R-CNN等為代表的檢測框架開啟了物體自動檢測算法的熱潮。并且,由于多數(shù)研究者側(cè)重于提高檢測算法的精度,因此為了提取更加復(fù)雜的特征,深度網(wǎng)絡(luò)的層數(shù)呈現(xiàn)出指數(shù)級的增長,成百上千層的網(wǎng)絡(luò)應(yīng)運而生。然而,這些基于深度神經(jīng)網(wǎng)絡(luò)的檢測算法對硬件的存儲能力和計算能力都有著較高的要求。因此,盡管基于深度神經(jīng)網(wǎng)絡(luò)的物體檢測算法在精度上顯著超過傳統(tǒng)算法,但其巨大的存儲和計算代價為其在移動端或嵌入式設(shè)備等資源受限平臺上的部署帶來了巨大的挑戰(zhàn)。因此,深度神經(jīng)網(wǎng)絡(luò)模型的壓縮,加速和優(yōu)化成為了學(xué)術(shù)界及工業(yè)界共同關(guān)注的迫切而重要的研究課題;谶@一需求,一些網(wǎng)絡(luò)壓縮算法逐漸被提出。但是目前多數(shù)網(wǎng)絡(luò)壓縮算法會導(dǎo)致原始模型的性能出現(xiàn)明顯的損失,如分類任務(wù)中的精度降低或檢測任務(wù)中的漏檢率升高。本文介紹了目...
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
ImageNet分類比賽冠軍網(wǎng)絡(luò)Fig.1.1ThechampionnetworksinImageNetclassification
描述圖像顏色信息的 LUV 特征[7],[9],描述圖像局部信息的 SIFT 特征[6]等。隨后ChnFtrs[7]、ACF[8]等方法提出使用 10 個通道特征(LUV 三個顏色通道、HOG 梯度幅值通道及 6 個梯度方向通道)來描述目標(biāo)特性。這些工作也充分表明豐富的特征對于提高算法檢測性能有著明顯的幫助,因此檢測算法逐漸從基于單一特征發(fā)展為基于多類特征。然而,基于手工設(shè)計特征的傳統(tǒng)目標(biāo)檢測算法需要工作者具有豐富的特征設(shè)計經(jīng)驗,并且手工設(shè)計的特征表達(dá)能力有限。因此,基于深度學(xué)習(xí)的目標(biāo)檢測算法[10]得到廣泛關(guān)注并取得了巨大的成功。R-CNN Fast R-CNN Faster R-CNN YOLO
縮放等預(yù)處理到統(tǒng)一尺寸,然后使用 VGG 網(wǎng)絡(luò)為候選框提取固定長度的特征向量,最終使用 SVM 分類器對各個候選框的物體進(jìn)行分類及位置回歸。具體的算法流程如下圖 2-2 所示。盡管 R-CNN 算法成功地超越了多數(shù)傳統(tǒng)檢測算法,但整個算法具有重復(fù)計算,多階段訓(xùn)練的問題,步驟繁瑣,訓(xùn)練耗時,占用磁盤空間大。
本文編號:2996830
【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學(xué)位級別】:碩士
【部分圖文】:
ImageNet分類比賽冠軍網(wǎng)絡(luò)Fig.1.1ThechampionnetworksinImageNetclassification
描述圖像顏色信息的 LUV 特征[7],[9],描述圖像局部信息的 SIFT 特征[6]等。隨后ChnFtrs[7]、ACF[8]等方法提出使用 10 個通道特征(LUV 三個顏色通道、HOG 梯度幅值通道及 6 個梯度方向通道)來描述目標(biāo)特性。這些工作也充分表明豐富的特征對于提高算法檢測性能有著明顯的幫助,因此檢測算法逐漸從基于單一特征發(fā)展為基于多類特征。然而,基于手工設(shè)計特征的傳統(tǒng)目標(biāo)檢測算法需要工作者具有豐富的特征設(shè)計經(jīng)驗,并且手工設(shè)計的特征表達(dá)能力有限。因此,基于深度學(xué)習(xí)的目標(biāo)檢測算法[10]得到廣泛關(guān)注并取得了巨大的成功。R-CNN Fast R-CNN Faster R-CNN YOLO
縮放等預(yù)處理到統(tǒng)一尺寸,然后使用 VGG 網(wǎng)絡(luò)為候選框提取固定長度的特征向量,最終使用 SVM 分類器對各個候選框的物體進(jìn)行分類及位置回歸。具體的算法流程如下圖 2-2 所示。盡管 R-CNN 算法成功地超越了多數(shù)傳統(tǒng)檢測算法,但整個算法具有重復(fù)計算,多階段訓(xùn)練的問題,步驟繁瑣,訓(xùn)練耗時,占用磁盤空間大。
本文編號:2996830
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2996830.html
最近更新
教材專著