基于深度學(xué)習(xí)的行人重識(shí)別研究及其FPGA實(shí)現(xiàn)
發(fā)布時(shí)間:2021-07-25 11:25
行人重識(shí)別是指具有不重疊視場的多攝像機(jī)網(wǎng)絡(luò)中的行人匹配,它可以從多個(gè)攝像頭捕獲的行人圖像中識(shí)別出給定的行人目標(biāo)。行人重識(shí)別問題在智能視頻監(jiān)控中有極高的應(yīng)用價(jià)值,具有重要的研究意義。本文提出了一種基于深度學(xué)習(xí)的行人重識(shí)別算法,應(yīng)用于實(shí)驗(yàn)室、教室等需要對(duì)識(shí)別匹配行人目標(biāo)具有一定實(shí)時(shí)性的場所,并在FPGA(Field Programmable Gate Array)上對(duì)該算法進(jìn)行實(shí)現(xiàn)和驗(yàn)證。本文主要研究內(nèi)容和結(jié)論如下:本文首先介紹行人重識(shí)別相關(guān)基礎(chǔ)理論,通過分析各類行人重識(shí)別的算法優(yōu)缺點(diǎn)后,最終選擇基于深度學(xué)習(xí)的方法解決行人重識(shí)別任務(wù);隨后,介紹了深度學(xué)習(xí)中卷積神經(jīng)網(wǎng)絡(luò)的基本原理,并詳細(xì)分析了基于深度學(xué)習(xí)算法的Improved DL網(wǎng)絡(luò)。為使Improved DL網(wǎng)絡(luò)模型結(jié)構(gòu)在本文的應(yīng)用場景下完成對(duì)實(shí)時(shí)性的要求,因此提出了改進(jìn)的基于深度學(xué)習(xí)的行人重識(shí)別算法,在滿足該場景對(duì)行人重識(shí)別算法性能需求的情況下,提升單次行人重識(shí)別速度,減少網(wǎng)絡(luò)運(yùn)算量。本文實(shí)驗(yàn)中對(duì)Market1501數(shù)據(jù)庫訓(xùn)練測試結(jié)果表明,行人重識(shí)別速度優(yōu)于Improved DL網(wǎng)絡(luò)。在完成算法設(shè)計(jì)的基礎(chǔ)上進(jìn)行硬件的實(shí)現(xiàn)與驗(yàn)證。由于F...
【文章來源】:西安理工大學(xué)陜西省
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文內(nèi)容結(jié)構(gòu)圖
疃妊?暗男腥酥厥侗鶩?縋P筒⒔?邢晗傅?分析與說明。2.1行人重識(shí)別基本框架本文主要研究行人重識(shí)別的相關(guān)問題,其整體流程為提供一個(gè)待查詢的行人圖像,基于相關(guān)的模型網(wǎng)絡(luò),并在候選庫圖像中檢索到最有可能為同一個(gè)行人的圖像。由于訓(xùn)練過程中,可以使用標(biāo)簽對(duì)輸入的行人圖像對(duì)進(jìn)行標(biāo)記,這點(diǎn)與驗(yàn)證任務(wù)相似。在測試過程中,測試集中的行人不能與測試集中的行人重復(fù),這點(diǎn)與檢索任務(wù)相似。因此本文將訓(xùn)練過程中的行人重識(shí)別視為驗(yàn)證任務(wù),測試中視為檢索任務(wù),降低了問題的復(fù)雜性,使其具有更好的辨別力。具體流程圖如圖2-1所示。圖2-1行人重識(shí)別過程Figure2-1ProcessofPedestrianre-identification從圖2-1可以看出,行人重識(shí)別的相關(guān)研究一般由兩部分組成:(1)特征提取,即將原始行人圖像數(shù)據(jù)經(jīng)過一定的分析和處理后,再將行人圖像特征以特定的格式輸出。(2)距離度量,即將輸出的行人圖像特征與待對(duì)比的特征進(jìn)行相應(yīng)運(yùn)算比較,根據(jù)相似度預(yù)測兩個(gè)輸入行人圖像是否屬于同一行人標(biāo)簽。2.2基于經(jīng)典算法的行人重識(shí)別在深度學(xué)習(xí)發(fā)展之前,研究人員在處理行人重識(shí)別任務(wù)時(shí)一般使用人工設(shè)計(jì)的特征描述子對(duì)行人圖像進(jìn)行描述,再通過常用的度量函數(shù)對(duì)其進(jìn)行分類達(dá)到行人重識(shí)別的目的。這些較為經(jīng)典的算法大多將行人重識(shí)別中的特征提取和距離度量分立開來,下面對(duì)其進(jìn)行簡要的分析與總結(jié)。
西安理工大學(xué)碩士學(xué)位論文10(3)余弦距離余弦距離是根據(jù)數(shù)學(xué)中余弦夾角的相關(guān)概念得到的,它的取值范圍在[-1,1]之間,它表示的是兩個(gè)樣本向量之間的相似度,對(duì)于離群的孤立點(diǎn),具有較好的魯棒性。假設(shè)樣本與樣本,其余弦距離計(jì)算的表達(dá)式可以表示為公式(2-4):th(2-4)公式(2-4)中n為樣本x和y的維數(shù)。2.2.3經(jīng)典行人重識(shí)別算法特點(diǎn)從對(duì)經(jīng)典算法的舉例分析來看,通常其處理行人重識(shí)別方法的基本思路是固定其單一方面而集中優(yōu)化另一方面的算法,兩者之間沒有協(xié)同優(yōu)化;并且通常使用手動(dòng)設(shè)計(jì)的方式來提取圖像特征,距離度量中的函數(shù)大多采用線性變化得到的,而行人樣本處于非線性空間中,這些方法都不能很好的處理行人重識(shí)別的問題,也不能很好地應(yīng)對(duì)行人圖像受到光照、姿態(tài)、視覺角度、圖像分辨率、相機(jī)的位置、遮擋以及背景混亂等影響。因此采用經(jīng)典的方法處理行人重識(shí)別任務(wù)時(shí)具有一定局限性。2.3基于深度學(xué)習(xí)的行人重識(shí)別隨著深度學(xué)習(xí)技術(shù)的發(fā)展,出現(xiàn)了許多共同學(xué)習(xí)特征表達(dá)和距離函數(shù)的方法。在2015年Ahmed[38]等人提出了一種基于深度卷積架構(gòu)的網(wǎng)絡(luò)ImprovedDL(ImprovedDeepLearning)用來處理行人重識(shí)別這一問題。在一定程度上解決了上述難點(diǎn)。本節(jié)先介紹人工神經(jīng)網(wǎng)絡(luò),再介紹卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn)與構(gòu)成及其網(wǎng)絡(luò)學(xué)習(xí)的相關(guān)知識(shí),最后詳細(xì)說明基于深度學(xué)習(xí)的ImprovedDL網(wǎng)絡(luò)。2.3.1卷積神經(jīng)網(wǎng)絡(luò)原理卷積神經(jīng)網(wǎng)絡(luò)(CNN)[42]是深度學(xué)習(xí)中具有代表性的算法之一,該網(wǎng)絡(luò)為深度結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)同時(shí)包含卷積計(jì)算,通過反向傳播算法參數(shù)達(dá)到訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)中的目的,最終完成深度學(xué)習(xí)的算法。人工神經(jīng)網(wǎng)絡(luò)中基本的處理單元為神經(jīng)元,通常為多輸入單一輸出的非線性單元,其結(jié)構(gòu)模型如圖2-2所示:圖2-2神經(jīng)元模型Figure2-2Neuronalmodel
【參考文獻(xiàn)】:
期刊論文
[1]基于LBP-HSV模型及改進(jìn)SIFT算法的行人再識(shí)別算法[J]. 晉麗榕,王海梅,徐丹萍. 計(jì)算機(jī)測量與控制. 2018(05)
[2]一種基于HOG和顏色自相似性特征的行人檢測方法[J]. 張金慧,吳斌,邵延華. 電腦知識(shí)與技術(shù). 2018(02)
[3]Gabor小波與HOG特征融合的行人識(shí)別算法[J]. 包曉敏,任文靜,呂文濤. 無線電工程. 2017(10)
[4]基于空間顏色特征的行人重識(shí)別方法[J]. 張華. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(S2)
碩士論文
[1]卷積神經(jīng)網(wǎng)絡(luò)圖像分類應(yīng)用研究[D]. 柯小龍.深圳大學(xué) 2017
[2]基于動(dòng)態(tài)度量和多維度表達(dá)的行人重識(shí)別研究[D]. 姚磊.武漢大學(xué) 2017
[3]基于顯著性特征的行人再識(shí)別算法研究[D]. 顧靜.南京郵電大學(xué) 2016
本文編號(hào):3301938
【文章來源】:西安理工大學(xué)陜西省
【文章頁數(shù)】:55 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文內(nèi)容結(jié)構(gòu)圖
疃妊?暗男腥酥厥侗鶩?縋P筒⒔?邢晗傅?分析與說明。2.1行人重識(shí)別基本框架本文主要研究行人重識(shí)別的相關(guān)問題,其整體流程為提供一個(gè)待查詢的行人圖像,基于相關(guān)的模型網(wǎng)絡(luò),并在候選庫圖像中檢索到最有可能為同一個(gè)行人的圖像。由于訓(xùn)練過程中,可以使用標(biāo)簽對(duì)輸入的行人圖像對(duì)進(jìn)行標(biāo)記,這點(diǎn)與驗(yàn)證任務(wù)相似。在測試過程中,測試集中的行人不能與測試集中的行人重復(fù),這點(diǎn)與檢索任務(wù)相似。因此本文將訓(xùn)練過程中的行人重識(shí)別視為驗(yàn)證任務(wù),測試中視為檢索任務(wù),降低了問題的復(fù)雜性,使其具有更好的辨別力。具體流程圖如圖2-1所示。圖2-1行人重識(shí)別過程Figure2-1ProcessofPedestrianre-identification從圖2-1可以看出,行人重識(shí)別的相關(guān)研究一般由兩部分組成:(1)特征提取,即將原始行人圖像數(shù)據(jù)經(jīng)過一定的分析和處理后,再將行人圖像特征以特定的格式輸出。(2)距離度量,即將輸出的行人圖像特征與待對(duì)比的特征進(jìn)行相應(yīng)運(yùn)算比較,根據(jù)相似度預(yù)測兩個(gè)輸入行人圖像是否屬于同一行人標(biāo)簽。2.2基于經(jīng)典算法的行人重識(shí)別在深度學(xué)習(xí)發(fā)展之前,研究人員在處理行人重識(shí)別任務(wù)時(shí)一般使用人工設(shè)計(jì)的特征描述子對(duì)行人圖像進(jìn)行描述,再通過常用的度量函數(shù)對(duì)其進(jìn)行分類達(dá)到行人重識(shí)別的目的。這些較為經(jīng)典的算法大多將行人重識(shí)別中的特征提取和距離度量分立開來,下面對(duì)其進(jìn)行簡要的分析與總結(jié)。
西安理工大學(xué)碩士學(xué)位論文10(3)余弦距離余弦距離是根據(jù)數(shù)學(xué)中余弦夾角的相關(guān)概念得到的,它的取值范圍在[-1,1]之間,它表示的是兩個(gè)樣本向量之間的相似度,對(duì)于離群的孤立點(diǎn),具有較好的魯棒性。假設(shè)樣本與樣本,其余弦距離計(jì)算的表達(dá)式可以表示為公式(2-4):th(2-4)公式(2-4)中n為樣本x和y的維數(shù)。2.2.3經(jīng)典行人重識(shí)別算法特點(diǎn)從對(duì)經(jīng)典算法的舉例分析來看,通常其處理行人重識(shí)別方法的基本思路是固定其單一方面而集中優(yōu)化另一方面的算法,兩者之間沒有協(xié)同優(yōu)化;并且通常使用手動(dòng)設(shè)計(jì)的方式來提取圖像特征,距離度量中的函數(shù)大多采用線性變化得到的,而行人樣本處于非線性空間中,這些方法都不能很好的處理行人重識(shí)別的問題,也不能很好地應(yīng)對(duì)行人圖像受到光照、姿態(tài)、視覺角度、圖像分辨率、相機(jī)的位置、遮擋以及背景混亂等影響。因此采用經(jīng)典的方法處理行人重識(shí)別任務(wù)時(shí)具有一定局限性。2.3基于深度學(xué)習(xí)的行人重識(shí)別隨著深度學(xué)習(xí)技術(shù)的發(fā)展,出現(xiàn)了許多共同學(xué)習(xí)特征表達(dá)和距離函數(shù)的方法。在2015年Ahmed[38]等人提出了一種基于深度卷積架構(gòu)的網(wǎng)絡(luò)ImprovedDL(ImprovedDeepLearning)用來處理行人重識(shí)別這一問題。在一定程度上解決了上述難點(diǎn)。本節(jié)先介紹人工神經(jīng)網(wǎng)絡(luò),再介紹卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn)與構(gòu)成及其網(wǎng)絡(luò)學(xué)習(xí)的相關(guān)知識(shí),最后詳細(xì)說明基于深度學(xué)習(xí)的ImprovedDL網(wǎng)絡(luò)。2.3.1卷積神經(jīng)網(wǎng)絡(luò)原理卷積神經(jīng)網(wǎng)絡(luò)(CNN)[42]是深度學(xué)習(xí)中具有代表性的算法之一,該網(wǎng)絡(luò)為深度結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)同時(shí)包含卷積計(jì)算,通過反向傳播算法參數(shù)達(dá)到訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)中的目的,最終完成深度學(xué)習(xí)的算法。人工神經(jīng)網(wǎng)絡(luò)中基本的處理單元為神經(jīng)元,通常為多輸入單一輸出的非線性單元,其結(jié)構(gòu)模型如圖2-2所示:圖2-2神經(jīng)元模型Figure2-2Neuronalmodel
【參考文獻(xiàn)】:
期刊論文
[1]基于LBP-HSV模型及改進(jìn)SIFT算法的行人再識(shí)別算法[J]. 晉麗榕,王海梅,徐丹萍. 計(jì)算機(jī)測量與控制. 2018(05)
[2]一種基于HOG和顏色自相似性特征的行人檢測方法[J]. 張金慧,吳斌,邵延華. 電腦知識(shí)與技術(shù). 2018(02)
[3]Gabor小波與HOG特征融合的行人識(shí)別算法[J]. 包曉敏,任文靜,呂文濤. 無線電工程. 2017(10)
[4]基于空間顏色特征的行人重識(shí)別方法[J]. 張華. 華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(S2)
碩士論文
[1]卷積神經(jīng)網(wǎng)絡(luò)圖像分類應(yīng)用研究[D]. 柯小龍.深圳大學(xué) 2017
[2]基于動(dòng)態(tài)度量和多維度表達(dá)的行人重識(shí)別研究[D]. 姚磊.武漢大學(xué) 2017
[3]基于顯著性特征的行人再識(shí)別算法研究[D]. 顧靜.南京郵電大學(xué) 2016
本文編號(hào):3301938
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3301938.html
最近更新
教材專著