天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于全卷積網(wǎng)絡(luò)的古籍文檔圖像二值化研究

發(fā)布時(shí)間:2024-04-18 05:35
  作為文檔分析與識(shí)別系統(tǒng)中的重要預(yù)處理步驟,二值化不僅可以提高文檔圖像的視覺(jué)質(zhì)量,還對(duì)后續(xù)的檢測(cè)與識(shí)別起著重要的作用。傳統(tǒng)的二值化算法通;谌斯ぬ卣,在包含多種退化因素的文檔上效果較差;谏疃葘W(xué)習(xí)的二值化算法采用全卷積網(wǎng)絡(luò)對(duì)文檔圖像進(jìn)行端到端的分割,取得了較好的效果。但是,全卷積網(wǎng)絡(luò)本質(zhì)上是學(xué)習(xí)像素顏色差異,因此對(duì)于顏色較淺的文本或顏色較深的背景噪聲容易產(chǎn)生誤分類。此外,由于卷積神經(jīng)網(wǎng)絡(luò)輸入大小的限制,導(dǎo)致其很難處理文本分布不均勻問(wèn)題。本文針對(duì)上述問(wèn)題,首先引入了注意力門控模塊,該模塊能夠在加強(qiáng)文本像素的同時(shí)抑制背景像素,從而加大文本和噪聲的差異,使網(wǎng)絡(luò)輸出更精確的二值化結(jié)果。在此基礎(chǔ)上提出了兩階段網(wǎng)絡(luò)用于解決文本分布不均勻問(wèn)題,其中第一階段網(wǎng)絡(luò)用于產(chǎn)生圖像全局和局部?jī)煞N尺度的預(yù)測(cè),第二階段網(wǎng)絡(luò)融合兩種預(yù)測(cè)的信息,產(chǎn)生背景更干凈、筆畫(huà)結(jié)構(gòu)更完整的精細(xì)二值分割。本文在文檔圖像二值化的基準(zhǔn)數(shù)據(jù)集——DIBCO數(shù)據(jù)集上進(jìn)行了一系列的實(shí)驗(yàn)。在消融實(shí)驗(yàn)中,引入注意力門控模塊后的網(wǎng)絡(luò)在二值化性能上有所提升,這證明了該模塊的有效性,而兩階段網(wǎng)絡(luò)在文本分布不均勻情況居多的DIBCO2013數(shù)據(jù)集上相...

【文章頁(yè)數(shù)】:76 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2-1DIBCO2016H08的原始圖像及對(duì)應(yīng)的GT[35]

圖2-1DIBCO2016H08的原始圖像及對(duì)應(yīng)的GT[35]

第二章文檔圖像二值化算法概述5第二章文檔圖像二值化算法概述如前文所述,文檔圖像二值化是指將文檔圖像中的像素分為文字和背景兩個(gè)類別,并分別賦予255和0的灰度值。需要補(bǔ)充的一點(diǎn)是,二值化算法通常會(huì)在實(shí)現(xiàn)前將輸入圖像反相,這樣算法得到的二值化分割圖的前景像素灰度值為255,背景像素灰....


圖2-6文獻(xiàn)[18]的算法的整體網(wǎng)絡(luò)結(jié)構(gòu)

圖2-6文獻(xiàn)[18]的算法的整體網(wǎng)絡(luò)結(jié)構(gòu)

?玫接?xùn)V淙臚枷襝嗤?嘰緄氖涑鐾枷瘢?傭?繁5玫驕??的結(jié)果進(jìn)行像素級(jí)分類;③FCN設(shè)計(jì)了可融合不同尺度特征圖的跳級(jí)結(jié)構(gòu),同時(shí)確保魯棒性和精確性。FCN的這些特性使它能夠勝任圖像分割任務(wù)。對(duì)于語(yǔ)義級(jí)別的圖像分割,融合全局與局部特征可以顯著提升模型性能,例如最初提出的FCN-8s結(jié)構(gòu)....


圖2-9DSN結(jié)構(gòu)示意圖[19]

圖2-9DSN結(jié)構(gòu)示意圖[19]

第二章文檔圖像二值化算法概述132.2.3分層次DSN二值化方法[19]Vo等人于2018年提出基于分層次深度監(jiān)督網(wǎng)絡(luò)的文檔圖像二值化算法[19]。作者在文章中提出了魯棒二值化算法的兩個(gè)標(biāo)準(zhǔn):一是從前景中區(qū)分復(fù)雜背景噪聲的能力,二是保留高質(zhì)量視覺(jué)效果的前景細(xì)節(jié)的能力。對(duì)于第一點(diǎn),....


圖2-10分層次DSN整體架構(gòu)[19]

圖2-10分層次DSN整體架構(gòu)[19]

第二章文檔圖像二值化算法概述132.2.3分層次DSN二值化方法[19]Vo等人于2018年提出基于分層次深度監(jiān)督網(wǎng)絡(luò)的文檔圖像二值化算法[19]。作者在文章中提出了魯棒二值化算法的兩個(gè)標(biāo)準(zhǔn):一是從前景中區(qū)分復(fù)雜背景噪聲的能力,二是保留高質(zhì)量視覺(jué)效果的前景細(xì)節(jié)的能力。對(duì)于第一點(diǎn),....



本文編號(hào):3957500

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3957500.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e855e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com