【摘要】: 隨著我國(guó)經(jīng)濟(jì)的迅速發(fā)展以及全國(guó)票據(jù)交換系統(tǒng)的推廣,使得金融票據(jù)憑證的使用量呈現(xiàn)了跨越式增長(zhǎng)。現(xiàn)今我國(guó)的信息化已經(jīng)進(jìn)入全方位、多層次推進(jìn)的新階段,信息化也從對(duì)銀行發(fā)展的“支持”階段走向“支撐”階段,由經(jīng)濟(jì)全球化帶來(lái)的行業(yè)競(jìng)爭(zhēng)不斷加劇,國(guó)內(nèi)金融業(yè)對(duì)票據(jù)自動(dòng)化處理系統(tǒng)的需求也漸大,票據(jù)自動(dòng)處理系統(tǒng)的市場(chǎng)前景十分廣闊。 票據(jù)自動(dòng)處理系統(tǒng)以實(shí)現(xiàn)自動(dòng)的票據(jù)輸入與復(fù)核為目標(biāo),覆蓋了從前端信息錄入到后端事后監(jiān)督的主要部分:直接從票據(jù)憑證影像中提取要素?cái)?shù)據(jù)(如憑證號(hào),賬號(hào),日期,金額,磁碼等),在后臺(tái)進(jìn)行OCR流水識(shí)別,自動(dòng)建立憑證索引,以便于支票圖像存檔檢索;與銀行事后監(jiān)督系統(tǒng)相結(jié)合,生成待監(jiān)督數(shù)據(jù)文件,通過(guò)與流水識(shí)別取得的業(yè)務(wù)系統(tǒng)中臨柜帳務(wù)數(shù)據(jù)進(jìn)行核對(duì),替代操作人員完成事后監(jiān)督工作;配有印章驗(yàn)證系統(tǒng)后,自動(dòng)將憑證圖像中的客戶印章與系統(tǒng)中預(yù)留的印鑒進(jìn)行比較,完成印章的真?zhèn)巫R(shí)別,提升銀行業(yè)務(wù)處理效率。 作為票據(jù)自動(dòng)化處理過(guò)程中不可或缺的核心技術(shù),票據(jù)OCR系統(tǒng)主要根據(jù)票據(jù)影像,來(lái)完成種類(lèi)和主附件關(guān)系的判定,以及票據(jù)要素的自動(dòng)提取以及識(shí)別,并將數(shù)據(jù)提供給后續(xù)的相關(guān)業(yè)務(wù)使用。在學(xué)科上票據(jù)OCR識(shí)別屬于模式識(shí)別和人工智能的范疇,不僅對(duì)銀行業(yè)有非常大的實(shí)用價(jià)值,而且容易在其他領(lǐng)域中得到轉(zhuǎn)化應(yīng)用,在國(guó)內(nèi)外保險(xiǎn)、海關(guān)、稅務(wù)、教育、郵政、醫(yī)務(wù)、政府行政管理等領(lǐng)域都有著廣泛的應(yīng)用前景。 票據(jù)自動(dòng)處理系統(tǒng)實(shí)際應(yīng)用的關(guān)鍵在于,確保票據(jù)各識(shí)別域識(shí)別結(jié)果的高可靠性。本文對(duì)票據(jù)自動(dòng)處理系統(tǒng)的各個(gè)模塊進(jìn)行相應(yīng)的分析,對(duì)票據(jù)自動(dòng)識(shí)別中的若干關(guān)鍵技術(shù)進(jìn)行了深入的研究,并給出了相應(yīng)的實(shí)現(xiàn)方案。主要研究工作可歸納為以下三部分: (一)在版面分析中,首先根據(jù)票據(jù)中框線目標(biāo)的特點(diǎn),提出了一種有效的框線檢測(cè)與提取算法;其次,基于框線提取,采用基于框線相關(guān)性的相似度模型來(lái)計(jì)算票據(jù)框線間的相似度,提出了由粗到細(xì)的多類(lèi)別票據(jù)版面判定的方法。在真實(shí)數(shù)據(jù)集上的試驗(yàn)結(jié)果表明了該算法的有效性。 (二)預(yù)處理中,根據(jù)票據(jù)圖像的特點(diǎn)1)通過(guò)綜合字符筆畫(huà)雙邊緣特征與背景抑制增強(qiáng),來(lái)提取復(fù)雜背景下識(shí)別域子圖中的字符目標(biāo);2)采用連通鏈結(jié)構(gòu)來(lái)描述框線檢測(cè)結(jié)果與字符目標(biāo)提取結(jié)果融合后的框線區(qū)域,通過(guò)對(duì)交疊進(jìn)行檢測(cè)和標(biāo)記,來(lái)判別字符與框線的交疊方式,并據(jù)此保留字符筆畫(huà)去除框線干擾,還原待識(shí)別字串真實(shí)的面貌;3)結(jié)合輪廓分析與拓?fù)浣Y(jié)構(gòu)分析,來(lái)確定粘連數(shù)字串的分割策略,對(duì)無(wú)限制手寫(xiě)數(shù)字字符串進(jìn)行有效的切分。最后采用視覺(jué)效果評(píng)判和基于字符識(shí)別的同類(lèi)算法對(duì)比實(shí)驗(yàn)的評(píng)價(jià)方式,結(jié)果證實(shí)了提出的算法更為有效。 (三)在手寫(xiě)體數(shù)字字符識(shí)別中,分別從構(gòu)建代表訓(xùn)練樣本集和組合分類(lèi)器與特征的角度出發(fā),對(duì)手寫(xiě)體數(shù)字識(shí)別進(jìn)行了研究,提出了基于AP與LDA的手寫(xiě)阿拉伯?dāng)?shù)字識(shí)別算法,及組合結(jié)構(gòu)特征和統(tǒng)計(jì)特征的手寫(xiě)數(shù)字識(shí)別算法。所提算法在仿真數(shù)據(jù)集以及現(xiàn)實(shí)應(yīng)用中都取得了比較好的效果。 本文最后簡(jiǎn)要介紹了票據(jù)自動(dòng)識(shí)別子系統(tǒng)在銀行票據(jù)后督系統(tǒng)和支票影像交換系統(tǒng)行內(nèi)系統(tǒng)中的應(yīng)用實(shí)例,均已在實(shí)際中得到應(yīng)用,取得了良好的效果。
【圖文】:
中表格框線等非文字信息,起到指導(dǎo)和規(guī)范人們閱讀表格內(nèi)容和填寫(xiě)的作用。同一種類(lèi)票據(jù),它的預(yù)打印信息的位置和內(nèi)容是一致的。填寫(xiě)信息指的是票據(jù)在流通過(guò)程中,,用戶或銀行業(yè)務(wù)人員填寫(xiě)的信息,如金額、賬號(hào)、日期、印章等。圖1.2.1中是幾種常見(jiàn)的票據(jù)文檔示例,包括銀行支票、商業(yè)發(fā)票、稅單等(注:全文多處示例來(lái)自于.2.

癮豁豁三姍群鮮翔矍 矍(c)匹配結(jié)果二圖2實(shí)驗(yàn)在CpU為 peniium42.660,線檢測(cè)到票據(jù)分類(lèi)識(shí)別,平均用時(shí)為表2(d)匹配結(jié)果三本文算法匹配結(jié)果內(nèi)存為IG的PC上進(jìn)行,每一張票據(jù)圖像從框 0.1615。票據(jù)圖像分類(lèi)結(jié)果分類(lèi)結(jié)果粗檢正確張數(shù)正確率/(%)細(xì)檢正確張數(shù)正確率/(%)測(cè)試集測(cè)試集2模板框線框線檢測(cè)框線檢測(cè) 213205100.096.2 213186100.087.3 21141993從表2.5.1中可以看出,測(cè)試集1中的模板框線是一種理想情況,它直接使用了手工標(biāo)定的框線信息進(jìn)行匹配,有較高的分類(lèi)正確率。而用框線檢測(cè)算法提取票據(jù)框線的情況,與理想情況有一定的差距。此外,同種情況下測(cè)試集2的正確率要高于測(cè)試集1,這是由于測(cè)試集1中的票種較多,而部分票據(jù)圖像框線檢測(cè)結(jié)果較差,這直接影響了分類(lèi)正確率;而測(cè)試集2中的票據(jù)種類(lèi)相對(duì)集中,框線檢測(cè)效果較好。經(jīng)過(guò)分析發(fā)現(xiàn),識(shí)別錯(cuò)誤的多是版面復(fù)雜,短框線較多的票據(jù)。導(dǎo)致分類(lèi)識(shí)別錯(cuò)誤的原因主要有:1)印章圖象的干擾導(dǎo)致的框線檢測(cè)失敗;2)不規(guī)則外框中部分關(guān)鍵短框線的誤檢漏檢直接導(dǎo)致外框檢測(cè)失敗;3)部分票據(jù)存在撕毀現(xiàn)象等。
【學(xué)位授予單位】:南京理工大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2008
【分類(lèi)號(hào)】:TH693
【引證文獻(xiàn)】
相關(guān)博士學(xué)位論文 前1條
1 時(shí)愈;灰度不均勻的曲線形態(tài)檢測(cè)方法及應(yīng)用研究[D];華中科技大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 林強(qiáng);基于OCR的支票識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2010年
2 劉培根;銀行票據(jù)手寫(xiě)數(shù)字串識(shí)別的預(yù)處理與分割[D];南京理工大學(xué);2012年
3 潘宇;票據(jù)圖像分類(lèi)的技術(shù)研究[D];南京理工大學(xué);2012年
4 陸軍;銀行支票中手寫(xiě)用途域字串識(shí)別[D];南京理工大學(xué);2013年
5 郝夢(mèng)琳;手寫(xiě)體數(shù)字識(shí)別方法的研究與實(shí)現(xiàn)[D];太原科技大學(xué);2013年
6 汪磊;基于結(jié)構(gòu)特征提取的選票分析系統(tǒng)的設(shè)計(jì)與研究[D];安徽大學(xué);2013年
7 虞飛;機(jī)打普通商業(yè)發(fā)票識(shí)別系統(tǒng)研究[D];華南理工大學(xué);2013年
8 孫忠禮;面向問(wèn)卷自動(dòng)識(shí)別系統(tǒng)的版面定義器的設(shè)計(jì)與實(shí)現(xiàn)[D];沈陽(yáng)工業(yè)大學(xué);2014年
9 袁善磊;問(wèn)卷自動(dòng)分析系統(tǒng)中手寫(xiě)符號(hào)的識(shí)別及可視化方法研究[D];沈陽(yáng)工業(yè)大學(xué);2014年
10 尤權(quán)鋒;飲食業(yè)地方稅收發(fā)票識(shí)別算法研究與實(shí)現(xiàn)[D];華南理工大學(xué);2014年
本文編號(hào):
2674776
本文鏈接:http://sikaile.net/kejilunwen/jixiegongcheng/2674776.html