基于全卷積神經(jīng)網(wǎng)絡(luò)的行人遮擋檢測(cè)研究
發(fā)布時(shí)間:2021-03-06 08:53
行人檢測(cè)作為目標(biāo)檢測(cè)領(lǐng)域的熱點(diǎn)之一,在無人駕駛汽車輔助系統(tǒng)、智能監(jiān)控系統(tǒng)和服務(wù)型智能機(jī)器人等應(yīng)用領(lǐng)域具有非常高的價(jià)值。本文研究的行人遮擋可以被劃分為人對(duì)人的自遮擋與物體對(duì)人的遮擋的兩種遮擋類型。人對(duì)人的遮擋主要是因?yàn)槎鄠(gè)行人間有重疊區(qū)域?qū)е骂A(yù)測(cè)框容易產(chǎn)生偏移至周圍其他行人而產(chǎn)生漏檢;物體對(duì)人的遮擋主要是因?yàn)樾腥吮唤ㄖ、樹木和汽車等非行人物體遮擋導(dǎo)致無法獲得完整的行人信息而產(chǎn)生誤檢或漏檢。為了提高行人檢測(cè)的性能,文中主要對(duì)這兩種遮擋情況進(jìn)行處理。針對(duì)人對(duì)人的遮擋問題,本文設(shè)計(jì)了基于全卷積神經(jīng)網(wǎng)絡(luò)的行人類內(nèi)遮擋模型,該模型由VGG16、特征金字塔和兩個(gè)全卷積子任務(wù)組成。該模型通過引入排斥損失函數(shù),使得候選框遠(yuǎn)離鄰近的非目標(biāo)標(biāo)注框,即最小化預(yù)測(cè)框和其他目標(biāo)標(biāo)注框的重疊區(qū)域,避免預(yù)測(cè)框偏移到其他標(biāo)注框的區(qū)域,從而有效地降低人與人遮擋的誤檢率。針對(duì)物體對(duì)人的遮擋問題,本文提出基于語義注意力模型的行人遮擋檢測(cè)模型,該模型是在行人類內(nèi)遮擋模型的基礎(chǔ)上進(jìn)行優(yōu)化。其主要包括語義分割模塊和檢測(cè)模塊。語義分割模塊利用行人的可見邊界框作為標(biāo)簽來進(jìn)行語義分割,目的是獲得被物體、背景遮擋的行人的注意力熱點(diǎn)圖。檢...
【文章來源】:廣東工業(yè)大學(xué)廣東省
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
行人遮擋類型
隨著深度學(xué)習(xí)在圖像處理領(lǐng)域的廣泛應(yīng)用且取得大量的成果,許多學(xué)者和企中心也逐漸研究采用深度學(xué)習(xí)的方法來解決行人遮擋檢測(cè)問題。下面將具體闡學(xué)習(xí)中常用的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和各部分的計(jì)算過程、語義分割網(wǎng)絡(luò)的語義產(chǎn)生過程以及部分模塊的工作原理和作用。通過對(duì)以下內(nèi)容的了解,將更有助遮擋檢測(cè)系統(tǒng)的設(shè)計(jì)與構(gòu)建。1 行人檢測(cè)的原理基于機(jī)器學(xué)習(xí)的方法是現(xiàn)階段行人檢測(cè)算法的主流,主要運(yùn)用特征提取和分兩個(gè)模塊來進(jìn)行檢測(cè)圖像或視頻幀中的行人。特征提取部分主要是獲得邊緣特色特征、紋理特征等行人外觀特征和深度語義特征信息,然后把這些特征運(yùn)用分類器,將背景和行人目標(biāo)兩個(gè)類別進(jìn)行高效地辨別并輸出分類結(jié)果。最后對(duì)測(cè)試圖像進(jìn)行檢測(cè),若存在行人目標(biāo)則輸出其預(yù)測(cè)框,如圖 2-1 所示。
經(jīng)網(wǎng)絡(luò)利用網(wǎng)絡(luò)層學(xué)習(xí)到的特征具有更好的判別性和泛化性。大量研究表明,這種端到端的學(xué)習(xí)模式更有利于實(shí)現(xiàn)圖像識(shí)別的最佳狀態(tài)。2.2.1 卷積神經(jīng)網(wǎng)絡(luò)如圖 2-2 所示,常見的卷積神經(jīng)網(wǎng)絡(luò)主要把卷積層、池化層和全連接層組合成基本的結(jié)構(gòu)。其中,CNN 的輸入是一些原始數(shù)據(jù),例如 RGB 圖像,原始音頻數(shù)據(jù)等;而輸出是圖像屬于各個(gè)類別的置信度。卷積層的作用是將輸入的數(shù)據(jù)進(jìn)行卷積得到特征圖,即提取特征;池化層主要的作用是進(jìn)行下采樣,以去掉特征圖中不重要的部分的方式,來降低網(wǎng)絡(luò)參數(shù)的數(shù)量;而全連接層的作用是實(shí)現(xiàn)分類。卷積神經(jīng)網(wǎng)絡(luò)的底層是對(duì)圖像局部進(jìn)行感受野操作,然后運(yùn)用卷積運(yùn)算,匯集運(yùn)算和非線性變映射,最后得到分類概率。當(dāng)各卷積層利用卷積核得到后一層的特征圖像,再用激活函數(shù)進(jìn)行非線性變換時(shí),網(wǎng)絡(luò)的表達(dá)和擬合能力得到提升。通過各個(gè)層對(duì)輸入數(shù)據(jù)的逐層抽象和表達(dá),就可以提取到圖像的高級(jí)語義信息,學(xué)到的特征更具有辨別性。
【參考文獻(xiàn)】:
期刊論文
[1]基于激光雷達(dá)的舞蹈機(jī)器人室內(nèi)行人跟蹤方法[J]. 劉召,宋立濱,耿美曉,于濤,王增喜,郭凱. 計(jì)算機(jī)工程. 2017(06)
[2]復(fù)雜場(chǎng)景下的人體行為識(shí)別研究新進(jìn)展[J]. 雷慶,陳鍛生,李紹滋. 計(jì)算機(jī)科學(xué). 2014(12)
[3]行人檢測(cè)技術(shù)研究綜述[J]. 張春鳳,宋加濤,王萬良. 電視技術(shù). 2014(03)
[4]行人檢測(cè)技術(shù)綜述[J]. 蘇松志,李紹滋,陳淑媛,蔡國(guó)榕,吳云東. 電子學(xué)報(bào). 2012(04)
[5]智能車輛安全輔助駕駛技術(shù)研究近況[J]. 王榮本,郭烈,金立生,顧柏園,余天洪. 公路交通科技. 2007(07)
[6]車輛輔助駕駛系統(tǒng)中基于計(jì)算機(jī)視覺的行人檢測(cè)研究綜述[J]. 賈慧星,章毓晉. 自動(dòng)化學(xué)報(bào). 2007(01)
本文編號(hào):3066799
【文章來源】:廣東工業(yè)大學(xué)廣東省
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
行人遮擋類型
隨著深度學(xué)習(xí)在圖像處理領(lǐng)域的廣泛應(yīng)用且取得大量的成果,許多學(xué)者和企中心也逐漸研究采用深度學(xué)習(xí)的方法來解決行人遮擋檢測(cè)問題。下面將具體闡學(xué)習(xí)中常用的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和各部分的計(jì)算過程、語義分割網(wǎng)絡(luò)的語義產(chǎn)生過程以及部分模塊的工作原理和作用。通過對(duì)以下內(nèi)容的了解,將更有助遮擋檢測(cè)系統(tǒng)的設(shè)計(jì)與構(gòu)建。1 行人檢測(cè)的原理基于機(jī)器學(xué)習(xí)的方法是現(xiàn)階段行人檢測(cè)算法的主流,主要運(yùn)用特征提取和分兩個(gè)模塊來進(jìn)行檢測(cè)圖像或視頻幀中的行人。特征提取部分主要是獲得邊緣特色特征、紋理特征等行人外觀特征和深度語義特征信息,然后把這些特征運(yùn)用分類器,將背景和行人目標(biāo)兩個(gè)類別進(jìn)行高效地辨別并輸出分類結(jié)果。最后對(duì)測(cè)試圖像進(jìn)行檢測(cè),若存在行人目標(biāo)則輸出其預(yù)測(cè)框,如圖 2-1 所示。
經(jīng)網(wǎng)絡(luò)利用網(wǎng)絡(luò)層學(xué)習(xí)到的特征具有更好的判別性和泛化性。大量研究表明,這種端到端的學(xué)習(xí)模式更有利于實(shí)現(xiàn)圖像識(shí)別的最佳狀態(tài)。2.2.1 卷積神經(jīng)網(wǎng)絡(luò)如圖 2-2 所示,常見的卷積神經(jīng)網(wǎng)絡(luò)主要把卷積層、池化層和全連接層組合成基本的結(jié)構(gòu)。其中,CNN 的輸入是一些原始數(shù)據(jù),例如 RGB 圖像,原始音頻數(shù)據(jù)等;而輸出是圖像屬于各個(gè)類別的置信度。卷積層的作用是將輸入的數(shù)據(jù)進(jìn)行卷積得到特征圖,即提取特征;池化層主要的作用是進(jìn)行下采樣,以去掉特征圖中不重要的部分的方式,來降低網(wǎng)絡(luò)參數(shù)的數(shù)量;而全連接層的作用是實(shí)現(xiàn)分類。卷積神經(jīng)網(wǎng)絡(luò)的底層是對(duì)圖像局部進(jìn)行感受野操作,然后運(yùn)用卷積運(yùn)算,匯集運(yùn)算和非線性變映射,最后得到分類概率。當(dāng)各卷積層利用卷積核得到后一層的特征圖像,再用激活函數(shù)進(jìn)行非線性變換時(shí),網(wǎng)絡(luò)的表達(dá)和擬合能力得到提升。通過各個(gè)層對(duì)輸入數(shù)據(jù)的逐層抽象和表達(dá),就可以提取到圖像的高級(jí)語義信息,學(xué)到的特征更具有辨別性。
【參考文獻(xiàn)】:
期刊論文
[1]基于激光雷達(dá)的舞蹈機(jī)器人室內(nèi)行人跟蹤方法[J]. 劉召,宋立濱,耿美曉,于濤,王增喜,郭凱. 計(jì)算機(jī)工程. 2017(06)
[2]復(fù)雜場(chǎng)景下的人體行為識(shí)別研究新進(jìn)展[J]. 雷慶,陳鍛生,李紹滋. 計(jì)算機(jī)科學(xué). 2014(12)
[3]行人檢測(cè)技術(shù)研究綜述[J]. 張春鳳,宋加濤,王萬良. 電視技術(shù). 2014(03)
[4]行人檢測(cè)技術(shù)綜述[J]. 蘇松志,李紹滋,陳淑媛,蔡國(guó)榕,吳云東. 電子學(xué)報(bào). 2012(04)
[5]智能車輛安全輔助駕駛技術(shù)研究近況[J]. 王榮本,郭烈,金立生,顧柏園,余天洪. 公路交通科技. 2007(07)
[6]車輛輔助駕駛系統(tǒng)中基于計(jì)算機(jī)視覺的行人檢測(cè)研究綜述[J]. 賈慧星,章毓晉. 自動(dòng)化學(xué)報(bào). 2007(01)
本文編號(hào):3066799
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3066799.html
最近更新
教材專著