基于深度學習的路牌文字識別算法的研究與實現(xiàn)
發(fā)布時間:2022-11-05 00:25
近年來,我國國民經(jīng)濟不斷提高,截止2017年底,我國汽車保有量已突破2億輛,汽車在居民的出行中扮演了極其重要的角色。交通標志牌是一種常見的交通輔助設施,其為駕駛員提供了及其豐富的道路信息,尤其是字符型交通標志,其包含的豐富的高層語義信息對于緩解交通擁堵,提高道路交通安全具有重要的意義。計算機視覺是人工智能中一個極為重要的領域。傳統(tǒng)光學字符識別(OCR)技術(shù)的發(fā)展目前已經(jīng)趨于成熟,相對于OCR識別的規(guī)范文檔圖像,場景文字由于其背景復雜多變,存在光照不均、遮擋、文本方向多變等因素,其識別具有極大的挑戰(zhàn)性,對于自然場景中文本的檢測與識別近年來成為了研究熱點。交通標志文本是場景文本的一種,目前國內(nèi)外關(guān)于交通標志檢測及識別的研究相對較少,尚未形成一個可供研究的公開統(tǒng)一的數(shù)據(jù)集,尤其是中文交通標志文本。研究選取字符型交通標志中的指路標志為研究對象,通過圖像采集和處理建立了一個具有代表性及挑戰(zhàn)性的數(shù)據(jù)集,提出了一種基于深度神經(jīng)網(wǎng)絡的算法對采集到的圖像進行檢測與識別。同時與當前流行的算法進行了比較,該方法通過提出一種全新的四邊形表示回歸模型,直接預測任意方向的文本包圍框。通過對一些常用的文本檢測、詞識...
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 交通標志牌的檢測與識別
1.2.2 場景文字的檢測與識別
1.2.3 研究現(xiàn)狀總結(jié)
1.3 研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 交通標志文字檢測及識別算法
2.1 我國交通路牌分類及其文本特征
2.2 交通指路標志文字檢測與識別算法
2.2.1 傳統(tǒng)文本檢測與識別算法
2.2.2 基于深度學習的文本檢測與識別算法
2.2.3 基于CNN和RNN的文字識別算法
2.2.4 文本檢測與識別結(jié)合方法
2.2.5 基于深度學習的端到端文本檢測與識別網(wǎng)絡
2.3 本章小結(jié)
第3章 中文指路交通標志數(shù)據(jù)集說明
3.1 數(shù)據(jù)采集方法與過程
3.1.1 采集途徑
3.1.2 基于軟件LabelMe的采集數(shù)據(jù)集標注
3.2 數(shù)據(jù)集中指路標志文本的統(tǒng)計特性分類
3.2.1 交通標志文本的位置特性的分類
3.2.2 交通標志文本的尺度特性的分類
3.2.3 數(shù)據(jù)集內(nèi)部特征及組成分布
3.3 建立增廣數(shù)據(jù)集
3.4 本章小結(jié)
第4章 文本檢測識別算法訓練與實驗
4.1 網(wǎng)絡架構(gòu)
4.1.1 文本groundtruth的表示方法
4.1.2 默認框的設置
4.1.3 多輸出層
4.1.4 卷積核設置
4.1.5 損失函數(shù)
4.2 網(wǎng)絡訓練與實驗
4.2.1 實驗環(huán)境
4.2.2 實驗結(jié)果評估方法
4.2.3 預訓練
4.2.4 研究對文本groundtruth的表示
4.2.5 難分樣本挖掘
4.2.6 多尺度訓練
4.2.7 非極大抑制(NMS)
4.2.8 Adam優(yōu)化算法
4.2.9 檢測算法損失函數(shù)
4.2.10 文本檢測實驗與結(jié)果分析
4.2.11 文本識別模型訓練
4.2.12 端到端文本檢測與識別
4.2.13 端到端文本檢測與識別結(jié)果
4.2.14 和其他算法的比較
4.3 本章小結(jié)
結(jié)論
總結(jié)
展望
參考文獻
致謝
本文編號:3701580
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 交通標志牌的檢測與識別
1.2.2 場景文字的檢測與識別
1.2.3 研究現(xiàn)狀總結(jié)
1.3 研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 交通標志文字檢測及識別算法
2.1 我國交通路牌分類及其文本特征
2.2 交通指路標志文字檢測與識別算法
2.2.1 傳統(tǒng)文本檢測與識別算法
2.2.2 基于深度學習的文本檢測與識別算法
2.2.3 基于CNN和RNN的文字識別算法
2.2.4 文本檢測與識別結(jié)合方法
2.2.5 基于深度學習的端到端文本檢測與識別網(wǎng)絡
2.3 本章小結(jié)
第3章 中文指路交通標志數(shù)據(jù)集說明
3.1 數(shù)據(jù)采集方法與過程
3.1.1 采集途徑
3.1.2 基于軟件LabelMe的采集數(shù)據(jù)集標注
3.2 數(shù)據(jù)集中指路標志文本的統(tǒng)計特性分類
3.2.1 交通標志文本的位置特性的分類
3.2.2 交通標志文本的尺度特性的分類
3.2.3 數(shù)據(jù)集內(nèi)部特征及組成分布
3.3 建立增廣數(shù)據(jù)集
3.4 本章小結(jié)
第4章 文本檢測識別算法訓練與實驗
4.1 網(wǎng)絡架構(gòu)
4.1.1 文本groundtruth的表示方法
4.1.2 默認框的設置
4.1.3 多輸出層
4.1.4 卷積核設置
4.1.5 損失函數(shù)
4.2 網(wǎng)絡訓練與實驗
4.2.1 實驗環(huán)境
4.2.2 實驗結(jié)果評估方法
4.2.3 預訓練
4.2.4 研究對文本groundtruth的表示
4.2.5 難分樣本挖掘
4.2.6 多尺度訓練
4.2.7 非極大抑制(NMS)
4.2.8 Adam優(yōu)化算法
4.2.9 檢測算法損失函數(shù)
4.2.10 文本檢測實驗與結(jié)果分析
4.2.11 文本識別模型訓練
4.2.12 端到端文本檢測與識別
4.2.13 端到端文本檢測與識別結(jié)果
4.2.14 和其他算法的比較
4.3 本章小結(jié)
結(jié)論
總結(jié)
展望
參考文獻
致謝
本文編號:3701580
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3701580.html
最近更新
教材專著