基于深度學(xué)習(xí)的自然場(chǎng)景文本檢測(cè)與識(shí)別研究
【文章頁數(shù)】:75 頁
【部分圖文】:
圖1.1基于MSER的自然場(chǎng)景文本檢測(cè)
了該領(lǐng)域研究的主要技術(shù)。1)傳統(tǒng)的自然場(chǎng)景文本檢測(cè)方法基于傳統(tǒng)的文本檢測(cè)技術(shù)包括處理連通域和處理滑動(dòng)窗口的技術(shù)等。對(duì)于連通域的技術(shù)主要有最大穩(wěn)定極值區(qū)域[7](MSER)技術(shù)和Epshtein等人提出的筆畫寬度變換[8](SWT)技術(shù)等。SWT算法能夠獲得在規(guī)模和空間特征....
圖1.2基于Textboxes++任意方向排列的文本檢測(cè)
華中科技大學(xué)碩士學(xué)位論文Liao等人先是設(shè)計(jì)了Textboxes文本檢測(cè)方法[26],通過改進(jìn)SSD網(wǎng)絡(luò),使得文本在每個(gè)區(qū)域存在可能性的計(jì)算速度得到提升。隨后他們改進(jìn)之前的工作,設(shè)計(jì)了Textboxes++技術(shù)[27],并進(jìn)一步改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu),把T....
圖1.3基于深度卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別模型網(wǎng)絡(luò)結(jié)構(gòu)
華中科技大學(xué)碩士學(xué)位論文識(shí)別上[50]。該網(wǎng)絡(luò)通過深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行文本的特征提取,然后再采用遞歸神經(jīng)網(wǎng)絡(luò)取代語言模型對(duì)文本進(jìn)行識(shí)別,可以識(shí)別帶標(biāo)點(diǎn)的文本。然而該方法在文本較長(zhǎng)的情況下識(shí)別率不高。隨后Shi等人采用的注意力模型來解決長(zhǎng)文本問題[51]。
圖1.4基于字典搜索糾錯(cuò)的端到端文字識(shí)別算法的結(jié)果
華中科技大學(xué)碩士學(xué)位論文就可以到達(dá)識(shí)別任務(wù)的方法,通過MSER提取圖像中的文本作為文本候選區(qū)域,再利用訓(xùn)練好的分類器過濾掉非文本區(qū)域,并把其他的文本候選區(qū)域放到字符識(shí)別模型中進(jìn)行識(shí)別[7]。Matas等人對(duì)方法進(jìn)行改進(jìn),引入了基于連通域文本的檢測(cè)方法,....
本文編號(hào):3923869
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3923869.html