天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于卷積神經(jīng)網(wǎng)絡(luò)的自然場(chǎng)景文本檢測(cè)技術(shù)研究

發(fā)布時(shí)間:2020-06-17 11:36
【摘要】:自然場(chǎng)景的文本檢測(cè)是從自然場(chǎng)景中實(shí)現(xiàn)對(duì)文本檢測(cè)和定位,進(jìn)而服務(wù)與各項(xiàng)應(yīng)用,在社會(huì)的方方面面中都有著越來(lái)越重要的作用。使用卷積神經(jīng)網(wǎng)絡(luò)檢測(cè)文本已有一些研究,但是依舊存在很多問(wèn)題沒(méi)有解決。本文針對(duì)自然場(chǎng)景中的長(zhǎng)文本和石碑文本的檢測(cè)提出新的方法。本文主要研究?jī)?nèi)容如下:一、針對(duì)自然場(chǎng)景下的長(zhǎng)文本檢測(cè)因?yàn)槲谋拘械臉O端長(zhǎng)寬比使得大部分網(wǎng)絡(luò)無(wú)法完整檢測(cè)的問(wèn)題。本文在網(wǎng)絡(luò)模型中結(jié)合特征激勵(lì)模塊提取通道信息,來(lái)抑制背景特征,進(jìn)而加強(qiáng)前景特征;并提出了新的橢圓形幾何回歸方式,可以在不添加額外步驟的情況下準(zhǔn)確的完成長(zhǎng)文本的鏈接和角度的旋轉(zhuǎn),提升長(zhǎng)文本檢測(cè)的準(zhǔn)確性。二、針對(duì)自然場(chǎng)景下的石碑文字因?yàn)槠湮淖值摹按蟆背^(guò)大部分網(wǎng)絡(luò)對(duì)文字設(shè)定的最大限度而不能準(zhǔn)確檢測(cè)的問(wèn)題。利用深度卷積神經(jīng)網(wǎng)絡(luò)作為特征提取工具,將提取到的特征進(jìn)行圖像信息熵計(jì)算,取最大熵的值作為文本候選區(qū)域的一部分。另一方面,使用特征減弱算法,盡量消除與顏色特征無(wú)關(guān)的影響,輸入最大穩(wěn)定極值區(qū)域算法中或者文本候選區(qū)域的一部分。兩者的最終結(jié)果相結(jié)合得到文本區(qū)域特征圖。結(jié)合遷移學(xué)習(xí)訓(xùn)練一個(gè)分類網(wǎng)絡(luò),將候選區(qū)域輸入網(wǎng)絡(luò)中,得到最終的文本區(qū)域。并在此任務(wù)研究的過(guò)程中制作一個(gè)石碑?dāng)?shù)據(jù)集,設(shè)計(jì)兩種不同的標(biāo)簽用以支撐研究任務(wù),并且在這個(gè)數(shù)據(jù)集上與其他最先進(jìn)的進(jìn)行了比較試驗(yàn),驗(yàn)證了這個(gè)數(shù)據(jù)集的挑戰(zhàn)性。本文取得的研究成果:一、自然場(chǎng)景下的長(zhǎng)文本模型所改進(jìn)的網(wǎng)絡(luò)模型有較強(qiáng)的遷移能力,可以用于其他領(lǐng)域的研究;所提出的模型與多個(gè)性能優(yōu)秀的模型進(jìn)行比較試驗(yàn),在精準(zhǔn)率、召回率、f值中均取得了最好的性能結(jié)果。二、自然場(chǎng)景下的石碑文字檢測(cè)模型結(jié)合了深度學(xué)習(xí)和傳統(tǒng)方法,在小數(shù)據(jù)集中與其他方法相比較,取得了最好的效果。所提出的數(shù)據(jù)集有足夠的挑戰(zhàn)性,有擴(kuò)展的空間。
【學(xué)位授予單位】:南寧師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP391.41;TP183
【圖文】:

示意圖,模型,示意圖,文本檢測(cè)


域建議網(wǎng)絡(luò)產(chǎn)生的候選目標(biāo)區(qū)域框的大小是固定的,對(duì)于長(zhǎng)寬比不同的文本測(cè)很難找到一個(gè)通用的候選框大小,因此這種方法的魯棒性并不是很高。單純使用目標(biāo)檢測(cè)的框架和方法并不能直接解決文本檢測(cè)的問(wèn)題,但是這果激勵(lì)也大大隨后的研究人員,隨后全卷積網(wǎng)絡(luò)[22]空間變換網(wǎng)絡(luò)[23]被提被出卷積網(wǎng)絡(luò)是指將每一個(gè)像素都分為前景與背景兩個(gè)類別,這樣的分類可以生加精細(xì)的檢測(cè)結(jié)果。尤其是文字有獨(dú)特的筆畫結(jié)構(gòu),依靠筆畫對(duì)每一個(gè)像素行分類非常適用用文本檢測(cè)。空間變換網(wǎng)絡(luò)是指輸入的特征可以在空間層面矯正,并且可以實(shí)現(xiàn)梯度傳導(dǎo)進(jìn)而可以實(shí)現(xiàn)端到端的檢測(cè)。這兩個(gè)模型提出,很多性能優(yōu)異的文本檢測(cè)模型都是在此基礎(chǔ)上加以改進(jìn)提出的。Tian 等人[24]提出的 CTPN 是目前流傳最為廣泛的文本檢測(cè)模型,它將文本一個(gè)字符串的序列,但不是真正的分割每一個(gè)字符,而是使用固定長(zhǎng)度文本行分割,一方面使用卷積神經(jīng)網(wǎng)絡(luò)來(lái)提取每一個(gè)分割的每一個(gè)小塊的局部特用了循環(huán)神經(jīng)網(wǎng)絡(luò)中的雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(BLSTM)來(lái)提取序列中上下文息,兩者結(jié)合最終得到文本行區(qū)域。

示意圖,融合模型,文本,語(yǔ)義


圖 1-2 文本語(yǔ)義融合模型示意圖EAST[27]模型是也是極為流行的文本檢測(cè)模型之一,它使用全卷積神經(jīng)網(wǎng)絡(luò)特征,隨后對(duì)每一個(gè)像素點(diǎn)回歸其到所屬文本行的矩形四條邊的距離信息和旋轉(zhuǎn)信息。因此這個(gè)方法是可以檢測(cè)任意角度文本的模型,同時(shí)他還通過(guò)幾變換,可以將一個(gè)非矩形的任意凸四邊形轉(zhuǎn)化為平行四邊形,并對(duì)其檢測(cè)的。SegLink[28]模型在檢測(cè)文本時(shí)不同于 EAST 一次性檢測(cè)整行文本,它認(rèn)為檢整行文本的難度過(guò)大,而檢測(cè)文本的一部分較為容易,這類似于 CTPN 模型想。其獨(dú)特的地方在小的文本框之間的連接信息不來(lái)自于雙向長(zhǎng)短時(shí)記憶網(wǎng)來(lái)自于每個(gè)候選框之間、候選框所在層于上下層之間的空間信息,通過(guò)鄰近的方式形成文本行。這相比產(chǎn)生大量的候選區(qū)域并逐一檢測(cè)要快得多。

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張逸揚(yáng);儲(chǔ)s

本文編號(hào):2717546


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2717546.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1f9c7***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com