天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類碩士論文 >

基于新型CNN實(shí)例分割算法的文本行分析關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2021-01-18 16:53
  對(duì)文檔圖像的自動(dòng)處理能大大減輕人的勞動(dòng)。文檔圖像的文本行分割是字符識(shí)別、關(guān)鍵詞檢索等文檔分析和識(shí)別系統(tǒng)的重要部分,是提升字符識(shí)別效果的關(guān)鍵,對(duì)文檔的數(shù)字化存儲(chǔ)來(lái)說(shuō)意義非凡。對(duì)于無(wú)約束的手寫(xiě)文檔圖像,其文本行之間的交疊,文本字符大小不一、以及文本行不同的傾斜角度和不同程度的彎曲等,都給手寫(xiě)文檔行的分割造成了困難,因此,無(wú)約束文檔圖像的文本行分割仍然是一個(gè)值得研究的問(wèn)題。近年來(lái),深度學(xué)習(xí)技術(shù)在圖像分割等領(lǐng)域取得了令人矚目的成就;诰矸e神經(jīng)網(wǎng)絡(luò)的圖像分割方法猶如雨后春筍般大量涌現(xiàn)。針對(duì)手寫(xiě)文檔圖像的文本行分割,本文提出兩種基于深度卷積神經(jīng)網(wǎng)絡(luò)的文本行分割方法,結(jié)合后處理操作,能夠有效地處理文本行分割中存在的粘連、傾斜及字符大小不一等問(wèn)題。本文主要工作如下:第一,提出一種基于語(yǔ)義分割的文本行提取方法,將文檔圖像分為文本主體區(qū)域和背景區(qū)域,主干網(wǎng)絡(luò)采用經(jīng)典的VGG16,通過(guò)增加批量歸一化層及采用空洞卷積對(duì)其進(jìn)行改進(jìn),用跳躍連接的方式結(jié)合淺層特征信息,構(gòu)建了用于語(yǔ)義分割的全卷積網(wǎng)絡(luò),對(duì)卷積網(wǎng)絡(luò)輸出的概率圖進(jìn)行二值化,得到不同文本行的文本主體區(qū)域,結(jié)合提取的結(jié)果,依據(jù)最近鄰原則對(duì)文本連通部件進(jìn)行分... 

【文章來(lái)源】:西安理工大學(xué)陜西省

【文章頁(yè)數(shù)】:66 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于新型CNN實(shí)例分割算法的文本行分析關(guān)鍵技術(shù)研究


文檔內(nèi)容提取的一般過(guò)程

文檔圖像,低質(zhì)量,卷積


文檔圖像預(yù)處理與卷積神經(jīng)網(wǎng)絡(luò)介紹72文檔圖像預(yù)處理與卷積神經(jīng)網(wǎng)絡(luò)介紹文檔圖像的二值化在文檔圖像的自動(dòng)處理過(guò)程中意義非凡,是文檔分析系統(tǒng)的重要預(yù)處理步驟。歷史文檔在保存的過(guò)程中會(huì)受到人為或者外界因素的影響而出現(xiàn)退化,例如,古籍文獻(xiàn)會(huì)遭受非人為因素的侵蝕和造成文檔質(zhì)量低下,例如現(xiàn)墨水?dāng)U散、退色、起皺等現(xiàn)象。在將文檔掃描為圖像的過(guò)程中,圖像的扭曲,或者由于光照的因素而產(chǎn)生對(duì)比度變化以及燈光變化產(chǎn)生的噪聲等都會(huì)造成掃描圖像的質(zhì)量下降。不同原因造成的低質(zhì)量文檔圖像如圖2-1所示。本章主要介紹卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)及文檔圖像的預(yù)處理方法,并給出文本行分割算法的評(píng)價(jià)標(biāo)準(zhǔn)。圖2-1低質(zhì)量文檔圖像Figure2-1Degradeddocumentimages2.1卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)2.1.1卷積神經(jīng)網(wǎng)絡(luò)整體結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetwork,CNN)主要用來(lái)處理時(shí)間序列、圖像等具有網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)[41]。上世紀(jì)80年代就有相關(guān)學(xué)者展開(kāi)了這方面的研究,YannLeCun等人構(gòu)建的LeNet-5是現(xiàn)代卷積神經(jīng)網(wǎng)絡(luò)的雛形。GPU等硬件設(shè)備的更新發(fā)展以及許多深度學(xué)習(xí)開(kāi)源框架的出現(xiàn)為卷積網(wǎng)絡(luò)的應(yīng)用提供了基矗2012年,著名的AlexNet的提出再次提升了其關(guān)注度,AlesNet的貢獻(xiàn)在于采用了ReLu,該網(wǎng)絡(luò)獲得了ILSVRC的第一名,從那以后,深度學(xué)習(xí)技術(shù)開(kāi)始在許多領(lǐng)域嶄露頭角,屢屢在各種計(jì)算機(jī)視覺(jué)比賽中

卷積,神經(jīng)網(wǎng)絡(luò)


西安理工大學(xué)碩士學(xué)位論文8獲得令人矚目的成績(jī)。如圖2-2所示為一個(gè)標(biāo)準(zhǔn)的卷積神經(jīng)網(wǎng)絡(luò),輸入圖像通過(guò)一系列的卷積、激活以及池化操作,最后利用全連接層進(jìn)行分類。首先對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行簡(jiǎn)單介紹。圖2-2標(biāo)準(zhǔn)卷積神經(jīng)網(wǎng)絡(luò)Figure2-2Astandardconvolutionalneuralnetwork(1)神經(jīng)網(wǎng)絡(luò)(neuralnetwork)該模型的目標(biāo)是通過(guò)學(xué)習(xí)參數(shù)的值,來(lái)近似某個(gè)函數(shù)。圖2-3所示為一個(gè)人工神經(jīng)元模型,該模型包含n個(gè)輸入12,...nxxx,n個(gè)權(quán)值12,...nwww,b和y分別表示偏置和輸出。該神經(jīng)元接收一個(gè)向量作為輸入,得到一個(gè)標(biāo)量輸出,其計(jì)算如式(2.1)所示,其中f()表示激活函數(shù),W和X分別為表示權(quán)值和輸入。圖2-3人工神經(jīng)元模型Figure2-3Modelofartificialneuron()()TiiiyfWXbfwxb(2.1)圖2-4所示的多層神經(jīng)網(wǎng)絡(luò),最左側(cè)為輸入層神經(jīng)元,第二層和第三層為隱層,最右側(cè)為輸出層神經(jīng)元。每一層的輸入輸出均可看作向量。具有一個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)稱之為淺層神經(jīng)網(wǎng)絡(luò),具有一個(gè)以上隱含層的神經(jīng)網(wǎng)絡(luò)稱之為深度神經(jīng)網(wǎng)絡(luò)。分類網(wǎng)絡(luò)一般包含特征提取功能和分類功能,分別由卷積層和全連接層來(lái)實(shí)現(xiàn)相應(yīng)的功能。此外,全連接神經(jīng)網(wǎng)絡(luò)也可單獨(dú)用于分類任務(wù)。

【參考文獻(xiàn)】:
期刊論文
[1]基于深度學(xué)習(xí)的語(yǔ)義分割問(wèn)題研究綜述[J]. 張祥甫,劉健,石章松,吳中紅,王智.  激光與光電子學(xué)進(jìn)展. 2019(15)
[2]回歸——聚類聯(lián)合框架下的手寫(xiě)文本行提取[J]. 朱健菲,應(yīng)自爐,陳鵬飛.  中國(guó)圖象圖形學(xué)報(bào). 2018(08)
[3]基于高階相關(guān)聚類的脫機(jī)手寫(xiě)文本行分割[J]. 殷亞林,劉愛(ài)民,周祥東.  華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(01)
[4]基于圖聚類的脫機(jī)手寫(xiě)文檔圖像文本行分割[J]. 黃亮,殷飛,陳慶虎.  華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(03)
[5]基于分段式前景涂抹和背景細(xì)化的文本行分割[J]. 易曉芳,卡米力·木依丁,艾斯卡爾·艾木都拉.  計(jì)算機(jī)工程. 2013(05)

碩士論文
[1]基于圖論的掃描圖像文本行分割與矯正[D]. 鐘巧.湖南大學(xué) 2017



本文編號(hào):2985301

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2985301.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8cd42***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com