中文票據(jù)圖像處理和智能識別技術(shù)研究
發(fā)布時間:2023-05-11 06:06
漢字由于本身具有字體風(fēng)格多樣、字符集巨大、字符相似性高等特征,因此比英文字母更加難以識別,這就給識別研究帶來了很大的挑戰(zhàn)性。而中文票據(jù)則由于版面更為復(fù)雜包含各種印章、表格、不規(guī)則圖案等,因此比普通的標(biāo)準(zhǔn)中文文檔更具挑戰(zhàn)性。目前市場上雖然有各種型號的OCR設(shè)備,號稱識別率可達(dá)99.99%,但是在現(xiàn)實(shí)情況中,除名片、身份證等類的表面圖案復(fù)雜度低、面積較小、不易彎折、字體結(jié)構(gòu)比較單一的類別的目標(biāo)物時比較容易識別,其它類似于票據(jù)類的薄紙質(zhì)類目標(biāo)物,目前市場上的OCR產(chǎn)品對帶有中文的票據(jù)類目標(biāo)物識別效果都不算太理想,有待進(jìn)一步改進(jìn)。本課題結(jié)合一些傳統(tǒng)圖像處理算法和目前性能比較好的幾個深度神經(jīng)網(wǎng)絡(luò)的算法,對傳統(tǒng)中文票據(jù)識別系統(tǒng)做了一些改進(jìn)和優(yōu)化,本課題主要做了如下幾點(diǎn)的工作:首先,訓(xùn)練樣本的制作部分,訓(xùn)練數(shù)據(jù)集增廣的方法除了采用了傳統(tǒng)的仿射變換和加隨機(jī)噪聲的方法外,還引入了條件生成對抗網(wǎng)絡(luò),對訓(xùn)練樣本做了比較好的擴(kuò)充,將十分有利于后面識別模型的訓(xùn)練。其次,識別模型部分,采用了深度卷積神經(jīng)網(wǎng)絡(luò),本課題將目前性能比較優(yōu)良的幾個神經(jīng)網(wǎng)絡(luò)分類算法架構(gòu),根據(jù)本課題的實(shí)際需求做了一下結(jié)構(gòu)上的調(diào)整,通過實(shí)驗(yàn)我們...
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外發(fā)展現(xiàn)狀
1.3 本文主要研究的內(nèi)容
第二章 票據(jù)識別系統(tǒng)相關(guān)理論知識
2.1 票據(jù)的去噪相關(guān)理論知識
2.1.1 RGB空間介紹
2.1.2 HSV空間介紹
2.2 感興趣文字區(qū)域定位相關(guān)原理
2.3 文字的切割部分相關(guān)原理
2.3.1 垂直投影法
2.3.2 OTSU自動閾值分割算法
2.4 數(shù)據(jù)集增廣相關(guān)原理
2.4.1 仿射變換
2.4.2 生成對抗網(wǎng)絡(luò)
2.5 識別算法相關(guān)原理
2.5.1 現(xiàn)有的識別算法
2.5.2 深度神經(jīng)網(wǎng)絡(luò)相關(guān)原理
2.6 糾錯算法相關(guān)原理
2.6.1 常規(guī)的統(tǒng)計學(xué)語言模型
2.6.2 LSTM網(wǎng)絡(luò)的介紹
第三章 文字切割與訓(xùn)練字符集的獲取
3.1 原始票據(jù)圖片的預(yù)處理
3.1.1 原始票據(jù)在RGB域的分析
3.1.2 原始票據(jù)在HSV域的分析
3.2 感興趣文字區(qū)域的定位
3.2.1 霍夫變換直線檢測法
3.3 文字的切割
3.3.1 垂直投影法
3.3.2 改進(jìn)型的連通域分割法
3.4 訓(xùn)練樣本的制作
3.4.1 初始訓(xùn)練集的制作
3.4.2 初略識別的模型創(chuàng)建
3.4.3 真實(shí)場景下的數(shù)據(jù)集的獲取
3.4.4 訓(xùn)練集進(jìn)一步增廣
第四章 識別和糾錯算法
4.1 識別算法
4.1.1 現(xiàn)有的識別算法
4.1.2 深度神經(jīng)網(wǎng)絡(luò)的方法
4.2 糾錯算法
4.2.1 常規(guī)的統(tǒng)計學(xué)語言模型
4.2.2 長短記憶網(wǎng)絡(luò)模型
4.3 算法模型的部署
第五章 系統(tǒng)設(shè)計與實(shí)驗(yàn)結(jié)果分析
5.1 票據(jù)識別系統(tǒng)的流程
5.2 原始圖片的初步去噪實(shí)驗(yàn)
5.3 文字區(qū)域的定位實(shí)驗(yàn)
5.4 文字切割算法的驗(yàn)證
5.5 識別模型和糾錯模型的測試
5.5.1 識別模型的單獨(dú)測試
5.5.2 識別模型和糾錯模型的聯(lián)合測試
5.6 系統(tǒng)測試
總結(jié)與展望
參考文獻(xiàn)
攻碩期間取得的成果
致謝
本文編號:3814317
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外發(fā)展現(xiàn)狀
1.3 本文主要研究的內(nèi)容
第二章 票據(jù)識別系統(tǒng)相關(guān)理論知識
2.1 票據(jù)的去噪相關(guān)理論知識
2.1.1 RGB空間介紹
2.1.2 HSV空間介紹
2.2 感興趣文字區(qū)域定位相關(guān)原理
2.3 文字的切割部分相關(guān)原理
2.3.1 垂直投影法
2.3.2 OTSU自動閾值分割算法
2.4 數(shù)據(jù)集增廣相關(guān)原理
2.4.1 仿射變換
2.4.2 生成對抗網(wǎng)絡(luò)
2.5 識別算法相關(guān)原理
2.5.1 現(xiàn)有的識別算法
2.5.2 深度神經(jīng)網(wǎng)絡(luò)相關(guān)原理
2.6 糾錯算法相關(guān)原理
2.6.1 常規(guī)的統(tǒng)計學(xué)語言模型
2.6.2 LSTM網(wǎng)絡(luò)的介紹
第三章 文字切割與訓(xùn)練字符集的獲取
3.1 原始票據(jù)圖片的預(yù)處理
3.1.1 原始票據(jù)在RGB域的分析
3.1.2 原始票據(jù)在HSV域的分析
3.2 感興趣文字區(qū)域的定位
3.2.1 霍夫變換直線檢測法
3.3 文字的切割
3.3.1 垂直投影法
3.3.2 改進(jìn)型的連通域分割法
3.4 訓(xùn)練樣本的制作
3.4.1 初始訓(xùn)練集的制作
3.4.2 初略識別的模型創(chuàng)建
3.4.3 真實(shí)場景下的數(shù)據(jù)集的獲取
3.4.4 訓(xùn)練集進(jìn)一步增廣
第四章 識別和糾錯算法
4.1 識別算法
4.1.1 現(xiàn)有的識別算法
4.1.2 深度神經(jīng)網(wǎng)絡(luò)的方法
4.2 糾錯算法
4.2.1 常規(guī)的統(tǒng)計學(xué)語言模型
4.2.2 長短記憶網(wǎng)絡(luò)模型
4.3 算法模型的部署
第五章 系統(tǒng)設(shè)計與實(shí)驗(yàn)結(jié)果分析
5.1 票據(jù)識別系統(tǒng)的流程
5.2 原始圖片的初步去噪實(shí)驗(yàn)
5.3 文字區(qū)域的定位實(shí)驗(yàn)
5.4 文字切割算法的驗(yàn)證
5.5 識別模型和糾錯模型的測試
5.5.1 識別模型的單獨(dú)測試
5.5.2 識別模型和糾錯模型的聯(lián)合測試
5.6 系統(tǒng)測試
總結(jié)與展望
參考文獻(xiàn)
攻碩期間取得的成果
致謝
本文編號:3814317
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3814317.html
最近更新
教材專著