自然場景文字檢測方法研究
本文關(guān)鍵詞:自然場景文字檢測方法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:圖像中包含大量的文字信息,對基于內(nèi)容的圖像應(yīng)用而言,準(zhǔn)確高效地從圖像中提取文字信息是一項(xiàng)非常有意義的工作。但是由于圖像中的文字自身的多變性和文字背景的復(fù)雜性,自然場景中的文字檢測仍然是一項(xiàng)極具挑戰(zhàn)的任務(wù)。本文提出了兩個(gè)文字檢測方法:基于筆劃寬度變換和深度信念網(wǎng)絡(luò)的文字檢測方法和基于最大穩(wěn)定極值區(qū)域和卷積神經(jīng)網(wǎng)絡(luò)的文字檢測方法。對于前者,本文首先使用筆劃寬度變換算法對場景圖像做筆劃寬度變換,生成筆劃寬度圖。然后結(jié)合邊緣梯度信息,將筆劃寬度圖中筆劃寬度相似的像素連通起來,組成候選字符。接著使用啟發(fā)式的過濾規(guī)則以及借助深度信念網(wǎng)絡(luò)預(yù)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)分類器,從候選字符中篩選出種子字符。然后使用種子字符生長在筆劃寬度、高度、顏色等屬性上近似的非種子字符,進(jìn)而得到字符集合。最后將字符聚合成文本行,得到最終的文字檢測結(jié)果。對于后者,本文使用最大穩(wěn)定極值區(qū)域算法提取候選字符。然后借助一個(gè)級聯(lián)的卷積神經(jīng)網(wǎng)絡(luò)分類器,從候選字符中提取種子字符。接著,使用一個(gè)迭代的漸進(jìn)的生長算法從種子字符生長周圍的非種子字符。本文設(shè)計(jì)了一個(gè)同時(shí)考慮組件幾何特征和外觀特征的相似度測量方法,用來評價(jià)一個(gè)非種子字符是否可以被一個(gè)種子字符生長。本文在多個(gè)公開數(shù)據(jù)集上測試了提出的兩個(gè)方法。實(shí)驗(yàn)表明,基于筆劃寬度和深度信念網(wǎng)絡(luò)的文字檢測方法,在多個(gè)數(shù)據(jù)集上表現(xiàn)良好。但受限于筆劃寬度變換算法無法在復(fù)雜背景圖像中生成高質(zhì)量的筆劃寬度圖,因此該方法并不能取得最好的效果。而基于最大穩(wěn)定極值區(qū)域和卷積神經(jīng)網(wǎng)絡(luò)的文字檢測方法,在多個(gè)數(shù)據(jù)集上取得了最好的效果,尤其表現(xiàn)在更高的召回率上。這表示使用卷積神經(jīng)網(wǎng)絡(luò)作為種子字符分類模型的文字生長機(jī)制是非常有效的。
【關(guān)鍵詞】:自然場景文字檢測 筆劃寬度變換 最大穩(wěn)定極值區(qū)域 深度信念網(wǎng)絡(luò) 卷積神經(jīng)網(wǎng)絡(luò)
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.41
【目錄】:
- 摘要4-5
- Abstract5-12
- 第一章 緒論12-17
- 1.1 本文研究背景和意義12
- 1.2 現(xiàn)有自然場景文字檢測方法12-16
- 1.2.1 通用對象檢測方法13-14
- 1.2.2 基于窗口的文字檢測方法14
- 1.2.3 基于連通組件的文字檢測方法14-15
- 1.2.4 基于混合方法的文字檢測方法15-16
- 1.3 本文主要工作及安排16-17
- 第二章 相關(guān)工作17-32
- 2.1 筆劃寬度變換17-18
- 2.2 深度信念網(wǎng)絡(luò)18-19
- 2.3 最大穩(wěn)定極值區(qū)域19-22
- 2.4 卷積神經(jīng)網(wǎng)絡(luò)22-32
- 2.4.1 多層感知器22-25
- 2.4.2 卷積運(yùn)算25-27
- 2.4.3 卷積神經(jīng)網(wǎng)絡(luò)27-31
- 2.4.4 本章小結(jié)31-32
- 第三章 基于筆劃寬度變換和深度信念網(wǎng)絡(luò)的文字檢測方法32-42
- 3.1 文字邊緣檢測32-35
- 3.2 候選字符提取35-37
- 3.2.1 增強(qiáng)SWT算法35-36
- 3.2.2 邊緣增強(qiáng)連通組件提取算法36-37
- 3.3 候選字符過濾37-39
- 3.4 種子字符提取及文字生長39-40
- 3.5 文本行聚合40-41
- 3.6 本章小結(jié)41-42
- 第四章 基于最大穩(wěn)定極值區(qū)域和卷積神經(jīng)網(wǎng)絡(luò)的文字檢測方法42-51
- 4.1 種子字符定位42-45
- 4.1.1 基于MSER的組件過濾42-43
- 4.1.2 種子字符過濾43-45
- 4.2 文字生長45-48
- 4.2.1 相似度測量45-48
- 4.2.2 迭代式的文字生長48
- 4.3 文本行驗(yàn)證48-49
- 4.4 本章小結(jié)49-51
- 第五章 實(shí)驗(yàn)結(jié)果與分析51-60
- 5.1 實(shí)驗(yàn)平臺51
- 5.2 數(shù)據(jù)集與評價(jià)協(xié)議51-53
- 5.3 ICDAR數(shù)據(jù)集實(shí)驗(yàn)結(jié)果53-57
- 5.4 SVT數(shù)據(jù)集實(shí)驗(yàn)結(jié)果57-59
- 5.5 本章小結(jié)59-60
- 第六章 總結(jié)與展望60-62
- 6.1 總結(jié)60
- 6.2 展望60-62
- 參考文獻(xiàn)62-67
- 簡歷與科研成果67-68
- 致謝68-69
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 云中客;新的神經(jīng)網(wǎng)絡(luò)來自于仿生學(xué)[J];物理;2001年10期
2 唐春明,高協(xié)平;進(jìn)化神經(jīng)網(wǎng)絡(luò)的研究進(jìn)展[J];系統(tǒng)工程與電子技術(shù);2001年10期
3 李智;一種基于神經(jīng)網(wǎng)絡(luò)的煤炭調(diào)運(yùn)優(yōu)化方法[J];長沙鐵道學(xué)院學(xué)報(bào);2003年02期
4 程科,王士同,楊靜宇;新型模糊形態(tài)神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];計(jì)算機(jī)工程與應(yīng)用;2004年21期
5 王凡,孟立凡;關(guān)于使用神經(jīng)網(wǎng)絡(luò)推定操作者疲勞的研究[J];人類工效學(xué);2004年03期
6 周麗暉;從統(tǒng)計(jì)角度看神經(jīng)網(wǎng)絡(luò)[J];統(tǒng)計(jì)教育;2005年06期
7 趙奇 ,劉開第 ,龐彥軍;灰色補(bǔ)償神經(jīng)網(wǎng)絡(luò)及其應(yīng)用研究[J];微計(jì)算機(jī)信息;2005年14期
8 袁婷;;神經(jīng)網(wǎng)絡(luò)在股票市場預(yù)測中的應(yīng)用[J];軟件導(dǎo)刊;2006年05期
9 尚晉;楊有;;從神經(jīng)網(wǎng)絡(luò)的過去談科學(xué)發(fā)展觀[J];重慶三峽學(xué)院學(xué)報(bào);2006年03期
10 楊鐘瑾;;神經(jīng)網(wǎng)絡(luò)的過去、現(xiàn)在和將來[J];青年探索;2006年04期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 徐春玉;;基于泛集的神經(jīng)網(wǎng)絡(luò)的混沌性[A];1996中國控制與決策學(xué)術(shù)年會(huì)論文集[C];1996年
2 周樹德;王巖;孫增圻;孫富春;;量子神經(jīng)網(wǎng)絡(luò)[A];2003年中國智能自動(dòng)化會(huì)議論文集(上冊)[C];2003年
3 羅山;張琳;范文新;;基于神經(jīng)網(wǎng)絡(luò)和簡單規(guī)劃的識別融合算法[A];2009系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2009年
4 郭愛克;馬盡文;丁康;;序言(二)[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會(huì)議論文集[C];1999年
5 鐘義信;;知識論:神經(jīng)網(wǎng)絡(luò)的新機(jī)遇——紀(jì)念中國神經(jīng)網(wǎng)絡(luò)10周年[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會(huì)議論文集[C];1999年
6 許進(jìn);保錚;;神經(jīng)網(wǎng)絡(luò)與圖論[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會(huì)議論文集[C];1999年
7 金龍;朱詩武;趙成志;陳寧;;數(shù)值預(yù)報(bào)產(chǎn)品的神經(jīng)網(wǎng)絡(luò)釋用預(yù)報(bào)應(yīng)用[A];1999年中國神經(jīng)網(wǎng)絡(luò)與信號處理學(xué)術(shù)會(huì)議論文集[C];1999年
8 田金亭;;神經(jīng)網(wǎng)絡(luò)在中學(xué)生創(chuàng)造力評估中的應(yīng)用[A];第十二屆全國心理學(xué)學(xué)術(shù)大會(huì)論文摘要集[C];2009年
9 唐墨;王科俊;;自發(fā)展神經(jīng)網(wǎng)絡(luò)的混沌特性研究[A];2009年中國智能自動(dòng)化會(huì)議論文集(第七分冊)[南京理工大學(xué)學(xué)報(bào)(增刊)][C];2009年
10 張廣遠(yuǎn);萬強(qiáng);曹海源;田方濤;;基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的故障診斷方法研究[A];第十二屆全國設(shè)備故障診斷學(xué)術(shù)會(huì)議論文集[C];2010年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 美國明尼蘇達(dá)大學(xué)社會(huì)學(xué)博士 密西西比州立大學(xué)國家戰(zhàn)略規(guī)劃與分析研究中心資深助理研究員 陳心想;維護(hù)好創(chuàng)新的“神經(jīng)網(wǎng)絡(luò)硬件”[N];中國教師報(bào);2014年
2 盧業(yè)忠;腦控電腦 驚世駭俗[N];計(jì)算機(jī)世界;2001年
3 葛一鳴 路邊文;人工神經(jīng)網(wǎng)絡(luò)將大顯身手[N];中國紡織報(bào);2003年
4 中國科技大學(xué)計(jì)算機(jī)系 邢方亮;神經(jīng)網(wǎng)絡(luò)挑戰(zhàn)人類大腦[N];計(jì)算機(jī)世界;2003年
5 記者 孫剛;“神經(jīng)網(wǎng)絡(luò)”:打開復(fù)雜工藝“黑箱”[N];解放日報(bào);2007年
6 本報(bào)記者 劉霞;美用DNA制造出首個(gè)人造神經(jīng)網(wǎng)絡(luò)[N];科技日報(bào);2011年
7 健康時(shí)報(bào)特約記者 張獻(xiàn)懷;干細(xì)胞移植:修復(fù)受損的神經(jīng)網(wǎng)絡(luò)[N];健康時(shí)報(bào);2006年
8 劉力;我半導(dǎo)體神經(jīng)網(wǎng)絡(luò)技術(shù)及應(yīng)用研究達(dá)國際先進(jìn)水平[N];中國電子報(bào);2001年
9 ;神經(jīng)網(wǎng)絡(luò)和模糊邏輯[N];世界金屬導(dǎo)報(bào);2002年
10 鄒麗梅 陳耀群;江蘇科大神經(jīng)網(wǎng)絡(luò)應(yīng)用研究通過鑒定[N];中國船舶報(bào);2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 楊旭華;神經(jīng)網(wǎng)絡(luò)及其在控制中的應(yīng)用研究[D];浙江大學(xué);2004年
2 李素芳;基于神經(jīng)網(wǎng)絡(luò)的無線通信算法研究[D];山東大學(xué);2015年
3 石艷超;憶阻神經(jīng)網(wǎng)絡(luò)的混沌性及幾類時(shí)滯神經(jīng)網(wǎng)絡(luò)的同步研究[D];電子科技大學(xué);2014年
4 王新迎;基于隨機(jī)映射神經(jīng)網(wǎng)絡(luò)的多元時(shí)間序列預(yù)測方法研究[D];大連理工大學(xué);2015年
5 付愛民;極速學(xué)習(xí)機(jī)的訓(xùn)練殘差、穩(wěn)定性及泛化能力研究[D];中國農(nóng)業(yè)大學(xué);2015年
6 李輝;基于粒計(jì)算的神經(jīng)網(wǎng)絡(luò)及集成方法研究[D];中國礦業(yè)大學(xué);2015年
7 王衛(wèi)蘋;復(fù)雜網(wǎng)絡(luò)幾類同步控制策略研究及穩(wěn)定性分析[D];北京郵電大學(xué);2015年
8 陳輝;多維超精密定位系統(tǒng)建模與控制關(guān)鍵技術(shù)研究[D];東南大學(xué);2015年
9 閆淑霞;基于神經(jīng)網(wǎng)絡(luò)的微波射頻器件建模[D];天津大學(xué);2015年
10 胡文憑;基于深層神經(jīng)網(wǎng)絡(luò)的口語發(fā)音檢測與錯(cuò)誤分析[D];中國科學(xué)技術(shù)大學(xué);2016年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳少吉;基于神經(jīng)網(wǎng)絡(luò)血壓預(yù)測研究與系統(tǒng)實(shí)現(xiàn)[D];華南理工大學(xué);2015年
2 張韜;幾類時(shí)滯神經(jīng)網(wǎng)絡(luò)穩(wěn)定性分析[D];渤海大學(xué);2015年
3 邵雪瑩;幾類時(shí)滯不確定神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性分析[D];渤海大學(xué);2015年
4 胡婷;改進(jìn)QGA-BP模型及其在彌苴河總氮量預(yù)測中的應(yīng)用[D];昆明理工大學(xué);2015年
5 劉俊輝;基于數(shù)據(jù)清洗方法的河道水位預(yù)測研究[D];昆明理工大學(xué);2015年
6 劉波;短期風(fēng)電功率預(yù)測方法研究[D];南京信息工程大學(xué);2015年
7 蔡邦宇;人臉識別中單次ERP時(shí)空特征分析及其快速檢索的應(yīng)用[D];浙江大學(xué);2015年
8 鄭川;垃圾評論檢測算法的研究[D];西南交通大學(xué);2015年
9 李菊;BP神經(jīng)網(wǎng)絡(luò)在房地產(chǎn)批量評估中的應(yīng)用研究[D];昆明理工大學(xué);2015年
10 馬亮;降水點(diǎn)分類預(yù)測方法研究[D];中國地質(zhì)大學(xué)(北京);2015年
本文關(guān)鍵詞:自然場景文字檢測方法研究,由筆耕文化傳播整理發(fā)布。
,本文編號:487827
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/487827.html