基于CNN的任意分布的場景文本檢測與識別方法研究
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1–1文章結(jié)構(gòu)
圖1–1文章結(jié)構(gòu)基于上述的研究內(nèi)容,本文以下幾章節(jié)的具體內(nèi)容安排如下:在第二章中,通過考慮以下的文本自身的特性進(jìn)行檢測,利用字符的邊到一些候選區(qū)域,可以視為其輪廓,輪廓內(nèi)的區(qū)域一般具有很多相似如顏色、筆畫寬度、位置信息等等。通過這些特征來得到最終的字符區(qū)用深度神經(jīng)網(wǎng)絡(luò)對候....
圖2–1基于字符的文本檢測方法流程圖
得到最終的文本區(qū)域,將其結(jié)合成單詞或文本行。圖2–1基于字符的文本檢測方法流程圖2.2.2候選字符提取大多數(shù)圖像具有可重復(fù)檢測并且沒有變形的一些局部特征。這些局部特征實(shí)際上是具有某些數(shù)據(jù)依賴性的某些特征區(qū)域,因此也被稱為重要區(qū)域。作為特征區(qū)域的必要條件,這些區(qū)域中包....
圖2-2抑制之前的結(jié)果示例
值抑制的方法,抑制重復(fù)的極值區(qū)域。通過實(shí)驗(yàn),發(fā)現(xiàn)在具會產(chǎn)生大量的重復(fù)極值區(qū)域,為了識別重復(fù)的極值區(qū)域,采區(qū)域組成的ER樹進(jìn)行篩選。如公式(2-2)所示。其中|R|表像素數(shù)量。對于每個節(jié)點(diǎn)Rt,可以得到一條從Rt到根節(jié)點(diǎn)的Rt對于路徑上每個父節(jié)點(diǎn)的重疊率O(....
圖2–3檢測及合并示意圖
圖2–3檢測及合并示意圖經(jīng)過上述操作后,可以將低置信度區(qū)域分為文本區(qū)域和非文本區(qū)域。接下來將每個通道的文本區(qū)域進(jìn)行合并。由于是在多個色彩通道上進(jìn)行分別檢測的,所以存在很多相同或相覆蓋的區(qū)域。這里簡單的將重疊區(qū)域大于50%的區(qū)域進(jìn)行合并,保留較大的區(qū)域。通過神經(jīng)網(wǎng)絡(luò)分....
本文編號:3955145
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3955145.html