自然場(chǎng)景圖像中的文本檢測(cè)算法研究
發(fā)布時(shí)間:2021-07-03 22:53
文字作為高層語義信息是人類思想和感情表達(dá)的重要載體,包含非常有價(jià)值的信息,對(duì)于人們的日常生活是不可或缺的。隨著互聯(lián)網(wǎng)的發(fā)展以及智能手機(jī)、數(shù)碼相機(jī)等移動(dòng)終端的普及,海量的圖像不斷涌現(xiàn)出來,尤其是自然場(chǎng)景中的圖像,其中的文本信息不僅是對(duì)場(chǎng)景的重要補(bǔ)充,也是場(chǎng)景理解非常重要的線索。因此,自然場(chǎng)景圖像中的文本檢測(cè)已經(jīng)成為了近年的研究熱點(diǎn)之一,其應(yīng)用十分廣泛,例如人機(jī)交互,圖像搜索,工業(yè)自動(dòng)化和車牌識(shí)別等等。對(duì)于傳統(tǒng)的光學(xué)字符識(shí)別技術(shù),已經(jīng)有了相當(dāng)成熟的解決方案,在處理文檔文本方面取得了令人矚目的成果。但是,由于文本的多樣性、背景的復(fù)雜性以及其他外界因素的干擾,自然場(chǎng)景圖像中的文本檢測(cè)依然面臨著諸多挑戰(zhàn)。針對(duì)現(xiàn)有的自然場(chǎng)景文本檢測(cè)算法準(zhǔn)確率尚未理想的問題,從連通分量的提取與剪枝、連通區(qū)域的分類和多方向候選文本行的形成與分類三個(gè)方面進(jìn)行算法的改進(jìn),提出了一種基于行特征和改進(jìn)型卷積神經(jīng)網(wǎng)絡(luò)的文本檢測(cè)算法。本文的主要工作和貢獻(xiàn)具體如下:(1)采用增強(qiáng)的最大穩(wěn)定極值區(qū)域得到連通分量,可以分割因模糊而相連的字符像素,以及字符連通域的孔洞。采用結(jié)合平滑度的剪枝操作將重復(fù)嵌套的最大穩(wěn)定極值區(qū)域剪枝,得到孤立的...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:63 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳統(tǒng)的文檔圖像與場(chǎng)景圖像
南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 基于 MSER 的連通區(qū)域提取與剪枝基本沒有變化或者變化很小,則認(rèn)定這樣的連通區(qū)域?yàn)樽畲蠓(wěn)定極值區(qū)域。對(duì)于最大穩(wěn)定極值區(qū)域的具體定義,下一小節(jié)有詳細(xì)的描述。上述步驟中選取的閾值從 0 到 255 逐漸遞增,提取的黑色區(qū)域?yàn)闃O小值區(qū)域,即 MSER+區(qū)域,通常是由灰度值較小的連通分量組成,可以檢測(cè)亮色背景中的暗文本區(qū)域。當(dāng)閾值從 255 依次遞減為 0,提取的白色區(qū)域?yàn)闃O大值區(qū)域,即 MSER-區(qū)域,通常是由灰度值較大的連通分量構(gòu)成,檢測(cè)的是暗色背景中的亮色文本區(qū)域。MSER+區(qū)域和 MSER-區(qū)域的并集才是最終提取的 MSER 區(qū)域的全部集合。(a) 灰度圖像 I (b) t=0,I0為全白 (c) t=50,I50(d) t=100,I100
南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 基于 MSER 的連通區(qū)域提取與剪枝MSER 檢測(cè)算法與分水嶺算法雖然本質(zhì)上是相通的,但是還是有所區(qū)別,其不同之處在于輸出的不同。分水嶺算法尋找區(qū)域交匯時(shí)的水位,輸出為一組互不相交的區(qū)域,區(qū)域即將交匯時(shí)的閾值通常并不穩(wěn)定,且交匯后不再保存。而 MSER 檢測(cè)算法是遍歷全部閾值,尋找使區(qū)域面積相對(duì)穩(wěn)定的閾值,輸出為穩(wěn)定連通區(qū)域的集合,當(dāng)存在多個(gè)穩(wěn)定閾值時(shí),多個(gè)穩(wěn)定連通區(qū)域可能相互嵌套。
【參考文獻(xiàn)】:
期刊論文
[1]自然場(chǎng)景中多方向文本的檢測(cè)[J]. 方承志,黃梅玲. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(05)
[2]基于色彩空間的最大穩(wěn)定極值區(qū)域的自然場(chǎng)景文本檢測(cè)[J]. 范一華,鄧德祥,顏佳. 計(jì)算機(jī)應(yīng)用. 2018(01)
[3]結(jié)合連通分量規(guī)則度與Adaboost的文本定位算法[J]. 方承志,田彪. 電視技術(shù). 2015(21)
博士論文
[1]自然場(chǎng)景圖像中的文字檢測(cè)[D]. 孫雷.中國科學(xué)技術(shù)大學(xué) 2015
[2]自然圖像中文字檢測(cè)與識(shí)別研究[D]. 姚聰.華中科技大學(xué) 2014
碩士論文
[1]自然場(chǎng)景圖像中的文字檢測(cè)關(guān)鍵算法研究[D]. 田彪.南京郵電大學(xué) 2016
本文編號(hào):3263509
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:63 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
傳統(tǒng)的文檔圖像與場(chǎng)景圖像
南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 基于 MSER 的連通區(qū)域提取與剪枝基本沒有變化或者變化很小,則認(rèn)定這樣的連通區(qū)域?yàn)樽畲蠓(wěn)定極值區(qū)域。對(duì)于最大穩(wěn)定極值區(qū)域的具體定義,下一小節(jié)有詳細(xì)的描述。上述步驟中選取的閾值從 0 到 255 逐漸遞增,提取的黑色區(qū)域?yàn)闃O小值區(qū)域,即 MSER+區(qū)域,通常是由灰度值較小的連通分量組成,可以檢測(cè)亮色背景中的暗文本區(qū)域。當(dāng)閾值從 255 依次遞減為 0,提取的白色區(qū)域?yàn)闃O大值區(qū)域,即 MSER-區(qū)域,通常是由灰度值較大的連通分量構(gòu)成,檢測(cè)的是暗色背景中的亮色文本區(qū)域。MSER+區(qū)域和 MSER-區(qū)域的并集才是最終提取的 MSER 區(qū)域的全部集合。(a) 灰度圖像 I (b) t=0,I0為全白 (c) t=50,I50(d) t=100,I100
南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 基于 MSER 的連通區(qū)域提取與剪枝MSER 檢測(cè)算法與分水嶺算法雖然本質(zhì)上是相通的,但是還是有所區(qū)別,其不同之處在于輸出的不同。分水嶺算法尋找區(qū)域交匯時(shí)的水位,輸出為一組互不相交的區(qū)域,區(qū)域即將交匯時(shí)的閾值通常并不穩(wěn)定,且交匯后不再保存。而 MSER 檢測(cè)算法是遍歷全部閾值,尋找使區(qū)域面積相對(duì)穩(wěn)定的閾值,輸出為穩(wěn)定連通區(qū)域的集合,當(dāng)存在多個(gè)穩(wěn)定閾值時(shí),多個(gè)穩(wěn)定連通區(qū)域可能相互嵌套。
【參考文獻(xiàn)】:
期刊論文
[1]自然場(chǎng)景中多方向文本的檢測(cè)[J]. 方承志,黃梅玲. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(05)
[2]基于色彩空間的最大穩(wěn)定極值區(qū)域的自然場(chǎng)景文本檢測(cè)[J]. 范一華,鄧德祥,顏佳. 計(jì)算機(jī)應(yīng)用. 2018(01)
[3]結(jié)合連通分量規(guī)則度與Adaboost的文本定位算法[J]. 方承志,田彪. 電視技術(shù). 2015(21)
博士論文
[1]自然場(chǎng)景圖像中的文字檢測(cè)[D]. 孫雷.中國科學(xué)技術(shù)大學(xué) 2015
[2]自然圖像中文字檢測(cè)與識(shí)別研究[D]. 姚聰.華中科技大學(xué) 2014
碩士論文
[1]自然場(chǎng)景圖像中的文字檢測(cè)關(guān)鍵算法研究[D]. 田彪.南京郵電大學(xué) 2016
本文編號(hào):3263509
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3263509.html
最近更新
教材專著