基于深度學(xué)習(xí)的交通標(biāo)志檢測(cè)與識(shí)別方法研究
發(fā)布時(shí)間:2020-12-17 07:30
交通標(biāo)志作為一項(xiàng)按照嚴(yán)格標(biāo)準(zhǔn)制定的道路設(shè)施,對(duì)反映當(dāng)?shù)芈窙r、疏散交通、保障安全有序的行車環(huán)境都具有重要的作用。隨著現(xiàn)代智能駕駛技術(shù)的提高,交通標(biāo)志的自動(dòng)檢測(cè)與識(shí)別愈發(fā)成為無(wú)人駕駛領(lǐng)域的熱門探討課題。傳統(tǒng)的機(jī)器學(xué)習(xí)算法往往只能捕捉到交通標(biāo)志單一的特征,且大都依賴于先驗(yàn)處理和經(jīng)驗(yàn)判定,不具有普適性;谏疃葘W(xué)習(xí)的方法則通過(guò)構(gòu)造深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolution Neural Network,DCNN)模型,能夠挖掘到交通標(biāo)志更多層次、更加豐富的語(yǔ)義信息,在實(shí)現(xiàn)智能檢測(cè)與識(shí)別的同時(shí)適應(yīng)了實(shí)時(shí)性和精準(zhǔn)度的要求。本文在充分研究單階和雙階目標(biāo)檢測(cè)網(wǎng)絡(luò)的優(yōu)勢(shì)和劣勢(shì),以及各種多尺度檢測(cè)方法的基礎(chǔ)上,提出了兩種基于深度學(xué)習(xí)的交通標(biāo)志牌檢測(cè)與識(shí)別方法。一種方法通過(guò)構(gòu)建殘差SSD(Single Shot Multibox Detector)網(wǎng)絡(luò),并采用由粗到細(xì)的多尺度分塊策略完成交通標(biāo)志的檢測(cè)與識(shí)別。首先對(duì)高分辨率的交通圖像進(jìn)行多尺度分塊,然后對(duì)中等尺度下的圖像塊進(jìn)行粗檢,接著將與粗檢結(jié)果相關(guān)的其他尺度下的圖像塊放入殘差網(wǎng)絡(luò)進(jìn)行精檢。訓(xùn)練模型時(shí)利用難例挖掘方法保持正負(fù)樣本比例平衡,測(cè)試時(shí)通過(guò)...
【文章來(lái)源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
不同尺寸的交通標(biāo)志實(shí)例數(shù)量分布圖
天津大學(xué)碩士學(xué)位論文6交通圖像,其中600張圖像用于訓(xùn)練,300張圖像用于測(cè)試評(píng)估。BelgiumTS數(shù)據(jù)集包含62種類別的交通標(biāo)志,每個(gè)類別包含幾百?gòu)埥煌?biāo)志圖像,圖上的文字通常為荷蘭語(yǔ)和法語(yǔ),每張圖像拍攝角度和光線條件各有不同,圖像的尺寸大約在128×128左右。中國(guó)相對(duì)大型的公開(kāi)交通標(biāo)志數(shù)據(jù)集則當(dāng)屬清華大學(xué)與騰訊聯(lián)合實(shí)驗(yàn)室在2016年分布的Tsinghua-Tencent-100k。與GTSRB等數(shù)據(jù)集從視頻中提取交通標(biāo)志圖像序列的方式不同,該數(shù)據(jù)集中的圖像是由6臺(tái)單反相機(jī)拍攝的全景圖像裁剪而來(lái),并做了一些曝光調(diào)整。場(chǎng)景取自中國(guó)5個(gè)城市10個(gè)不同地區(qū)的真實(shí)街景,在亮度、對(duì)比度等方面都存在較大差異。裁剪圖像的數(shù)量達(dá)到了100000張,其中有10000張包含標(biāo)志牌,涵蓋了30000個(gè)交通標(biāo)志實(shí)例。圖像分辨率為2048×2048,約為GTSDB數(shù)據(jù)集的32倍。交通標(biāo)志在圖像中占比很小,大多數(shù)只有個(gè)位數(shù)百分比,如圖1-1所示[52]。此外,標(biāo)志牌各類別實(shí)例數(shù)量差異也很大,存在較嚴(yán)重的類別不平衡的問(wèn)題,如圖1-2所示[52]。相比于GTSDB只能檢測(cè)四類標(biāo)志、GTSRB和BelgiumTS中的交通標(biāo)志在整幅圖像中占比超過(guò)80%,Tsinghua-Tencent-100k更能反映真實(shí)的路況信息,具有較高的研究?jī)r(jià)值,這也意味著相關(guān)研究面臨著艱巨的挑戰(zhàn)。圖1-1不同類別的交通標(biāo)志實(shí)例數(shù)量分布圖圖1-2不同尺寸的交通標(biāo)志實(shí)例數(shù)量分布圖
第2章多尺度檢測(cè)方法研究112.3多特征層提取方法多特征層提取方法即利用卷積神經(jīng)網(wǎng)絡(luò)的多尺度特性,將不同層的網(wǎng)絡(luò)特征圖進(jìn)行融合,提取多尺度特征,F(xiàn)有主流的目標(biāo)檢測(cè)網(wǎng)絡(luò),可以分為單階檢測(cè)網(wǎng)絡(luò)和雙階檢測(cè)網(wǎng)絡(luò)兩種,接下來(lái)本文將分別對(duì)它們的多特征層提取方法進(jìn)行介紹。2.3.1單階檢測(cè)網(wǎng)絡(luò)單階檢測(cè)網(wǎng)絡(luò)是指不需要區(qū)域建議,直接產(chǎn)生物體的類別概率和預(yù)測(cè)坐標(biāo)值,單次檢測(cè)即可直接得到最終檢測(cè)結(jié)果的網(wǎng)絡(luò)。單階檢測(cè)網(wǎng)絡(luò)把目標(biāo)檢測(cè)看作一個(gè)回歸問(wèn)題,通過(guò)一個(gè)回歸分支由整張圖片的所有像素得到目標(biāo)包圍框(boundingbox,bbox)的坐標(biāo);把目標(biāo)識(shí)別看作是一個(gè)分類問(wèn)題,通過(guò)一個(gè)分類分支得到包圍框中包含目標(biāo)的置信度和類別概率,從而得到目標(biāo)類別。由于不需要額外的特征提取過(guò)程和階段網(wǎng)絡(luò),實(shí)現(xiàn)了end-to-end的檢測(cè),速度上十分快。比較經(jīng)典的網(wǎng)絡(luò)有YOLO、SSD、RetinaNet等。最初的YOLO網(wǎng)絡(luò)通過(guò)將最后一層特征圖劃分為S×S個(gè)格子,分別以每個(gè)小格為中心在整個(gè)特征圖范圍內(nèi)圈定2個(gè)不同的候選框進(jìn)行預(yù)測(cè)。設(shè)定的候選框具有不同的尺寸,從而達(dá)到多尺度檢測(cè)的目的。YOLO分格與候選框預(yù)測(cè)如圖2-1所示[28]。圖2-1YOLO分格與候選框預(yù)測(cè)示意圖
本文編號(hào):2921650
【文章來(lái)源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
不同尺寸的交通標(biāo)志實(shí)例數(shù)量分布圖
天津大學(xué)碩士學(xué)位論文6交通圖像,其中600張圖像用于訓(xùn)練,300張圖像用于測(cè)試評(píng)估。BelgiumTS數(shù)據(jù)集包含62種類別的交通標(biāo)志,每個(gè)類別包含幾百?gòu)埥煌?biāo)志圖像,圖上的文字通常為荷蘭語(yǔ)和法語(yǔ),每張圖像拍攝角度和光線條件各有不同,圖像的尺寸大約在128×128左右。中國(guó)相對(duì)大型的公開(kāi)交通標(biāo)志數(shù)據(jù)集則當(dāng)屬清華大學(xué)與騰訊聯(lián)合實(shí)驗(yàn)室在2016年分布的Tsinghua-Tencent-100k。與GTSRB等數(shù)據(jù)集從視頻中提取交通標(biāo)志圖像序列的方式不同,該數(shù)據(jù)集中的圖像是由6臺(tái)單反相機(jī)拍攝的全景圖像裁剪而來(lái),并做了一些曝光調(diào)整。場(chǎng)景取自中國(guó)5個(gè)城市10個(gè)不同地區(qū)的真實(shí)街景,在亮度、對(duì)比度等方面都存在較大差異。裁剪圖像的數(shù)量達(dá)到了100000張,其中有10000張包含標(biāo)志牌,涵蓋了30000個(gè)交通標(biāo)志實(shí)例。圖像分辨率為2048×2048,約為GTSDB數(shù)據(jù)集的32倍。交通標(biāo)志在圖像中占比很小,大多數(shù)只有個(gè)位數(shù)百分比,如圖1-1所示[52]。此外,標(biāo)志牌各類別實(shí)例數(shù)量差異也很大,存在較嚴(yán)重的類別不平衡的問(wèn)題,如圖1-2所示[52]。相比于GTSDB只能檢測(cè)四類標(biāo)志、GTSRB和BelgiumTS中的交通標(biāo)志在整幅圖像中占比超過(guò)80%,Tsinghua-Tencent-100k更能反映真實(shí)的路況信息,具有較高的研究?jī)r(jià)值,這也意味著相關(guān)研究面臨著艱巨的挑戰(zhàn)。圖1-1不同類別的交通標(biāo)志實(shí)例數(shù)量分布圖圖1-2不同尺寸的交通標(biāo)志實(shí)例數(shù)量分布圖
第2章多尺度檢測(cè)方法研究112.3多特征層提取方法多特征層提取方法即利用卷積神經(jīng)網(wǎng)絡(luò)的多尺度特性,將不同層的網(wǎng)絡(luò)特征圖進(jìn)行融合,提取多尺度特征,F(xiàn)有主流的目標(biāo)檢測(cè)網(wǎng)絡(luò),可以分為單階檢測(cè)網(wǎng)絡(luò)和雙階檢測(cè)網(wǎng)絡(luò)兩種,接下來(lái)本文將分別對(duì)它們的多特征層提取方法進(jìn)行介紹。2.3.1單階檢測(cè)網(wǎng)絡(luò)單階檢測(cè)網(wǎng)絡(luò)是指不需要區(qū)域建議,直接產(chǎn)生物體的類別概率和預(yù)測(cè)坐標(biāo)值,單次檢測(cè)即可直接得到最終檢測(cè)結(jié)果的網(wǎng)絡(luò)。單階檢測(cè)網(wǎng)絡(luò)把目標(biāo)檢測(cè)看作一個(gè)回歸問(wèn)題,通過(guò)一個(gè)回歸分支由整張圖片的所有像素得到目標(biāo)包圍框(boundingbox,bbox)的坐標(biāo);把目標(biāo)識(shí)別看作是一個(gè)分類問(wèn)題,通過(guò)一個(gè)分類分支得到包圍框中包含目標(biāo)的置信度和類別概率,從而得到目標(biāo)類別。由于不需要額外的特征提取過(guò)程和階段網(wǎng)絡(luò),實(shí)現(xiàn)了end-to-end的檢測(cè),速度上十分快。比較經(jīng)典的網(wǎng)絡(luò)有YOLO、SSD、RetinaNet等。最初的YOLO網(wǎng)絡(luò)通過(guò)將最后一層特征圖劃分為S×S個(gè)格子,分別以每個(gè)小格為中心在整個(gè)特征圖范圍內(nèi)圈定2個(gè)不同的候選框進(jìn)行預(yù)測(cè)。設(shè)定的候選框具有不同的尺寸,從而達(dá)到多尺度檢測(cè)的目的。YOLO分格與候選框預(yù)測(cè)如圖2-1所示[28]。圖2-1YOLO分格與候選框預(yù)測(cè)示意圖
本文編號(hào):2921650
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2921650.html
最近更新
教材專著