票據(jù)字符識(shí)別平臺(tái)研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2023-04-04 03:47
字符識(shí)別在現(xiàn)實(shí)場(chǎng)景中有著廣泛的應(yīng)用需求和研究意義。身份證的字符識(shí)別,銀行票據(jù)的字符信息提取及錄入,無(wú)不要求字符識(shí)別系統(tǒng)能夠快速準(zhǔn)確地將圖像中的字符信息提取出來(lái)。本文以市場(chǎng)交易中常見(jiàn)的票據(jù)作為研究對(duì)象,探索票據(jù)圖文識(shí)別的研究方法。通過(guò)成像設(shè)備獲取的票據(jù)圖像往往因?yàn)榕臄z條件較差容易受到噪聲干擾,獲取到的圖像也容易發(fā)生傾斜。首先,本文通過(guò)分析噪聲的成因,采用去噪算法對(duì)圖像進(jìn)行還原操作。其次,為了將圖像中冗余的信息去除,選擇將圖像進(jìn)行二值化操作,二值化之后的圖像從3通道彩色圖變成灰度圖,降低原始圖像通道顏色的信息冗余,F(xiàn)有的目標(biāo)檢測(cè)算法在文本平直的情況下才能獲得較好的檢測(cè)結(jié)果。為了提高圖像信息提取精度,本文對(duì)圖像進(jìn)行了傾斜校正。最后本文對(duì)票據(jù)圖像進(jìn)行版面分析,對(duì)票據(jù)不同的區(qū)域進(jìn)行了分割研究,以便于對(duì)票據(jù)的關(guān)鍵信息進(jìn)行提取。本文在文本檢測(cè)算法中采用基于YOLO-v3的目標(biāo)檢測(cè)算法,在原始的YOLO-v3算法中融入空間注意力模塊與通道注意力模塊,加入空間注意力機(jī)制能使圖像主體獲得更高的權(quán)重,背景等內(nèi)容將會(huì)獲得較小的權(quán)重。通過(guò)加入通道注意力機(jī)制賦予各通道不同的權(quán)重,使信息量大的通道獲得更大權(quán)重,更有...
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題來(lái)源與研究意義
1.2 字符識(shí)別國(guó)內(nèi)外發(fā)展現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
第2章 圖像預(yù)處理以及版面分析
2.1 票據(jù)圖像預(yù)處理
2.1.1 票據(jù)圖像的噪聲去除
2.1.2 票據(jù)圖像二值化
2.1.3 票據(jù)圖像的傾斜校正
2.2 版面分析
2.3 本章小結(jié)
第3章 文本檢測(cè)算法
3.1 深度卷積神經(jīng)網(wǎng)絡(luò)
3.2 深度學(xué)習(xí)目標(biāo)檢測(cè)網(wǎng)絡(luò)
3.3 注意力機(jī)制
3.3.1 空間注意力機(jī)制
3.3.2 通道注意力機(jī)制
3.4 文本檢測(cè)算法
3.4.1 多尺度圖像金字塔
3.4.1.1 高斯金字塔
3.4.1.2 拉普拉斯金字塔
3.4.2 基于改進(jìn)型YOLO-v3 的目標(biāo)檢測(cè)網(wǎng)絡(luò)
3.4.2.1 初始化候選框
3.4.2.2 稀疏訓(xùn)練
3.4.2.3 通道剪枝
3.5 文本檢測(cè)實(shí)驗(yàn)與分析
3.5.1 文本檢測(cè)數(shù)據(jù)集
3.5.2 試驗(yàn)參數(shù)設(shè)置與實(shí)驗(yàn)結(jié)果分析
3.6 本章小結(jié)
第4章 文本識(shí)別算法
4.1 基于深度學(xué)習(xí)的文本識(shí)別算法
4.1.1 特征提取網(wǎng)絡(luò)
4.1.2 特征序列識(shí)別
4.1.3 長(zhǎng)短期記憶網(wǎng)絡(luò)
4.1.4 改進(jìn)型長(zhǎng)短期記憶網(wǎng)絡(luò)
4.1.5 序列識(shí)別解碼
4.1.6 文本識(shí)別算法框架
4.2 語(yǔ)言模型
4.2.1 門控卷積神經(jīng)網(wǎng)絡(luò)
4.3 文本識(shí)別實(shí)驗(yàn)與分析
4.3.1 文本識(shí)別數(shù)據(jù)集
4.3.2 參數(shù)設(shè)置
4.3.3 實(shí)驗(yàn)結(jié)果分析
4.4 本章小結(jié)
第5章 票據(jù)圖像字符識(shí)別平臺(tái)實(shí)現(xiàn)
5.1 票據(jù)圖像字符識(shí)別算法流程
5.2 模塊介紹
5.2.1 數(shù)據(jù)構(gòu)建模塊
5.2.2 文本定位識(shí)別模塊
5.2.3 票據(jù)字符識(shí)別界面展示
5.3 本章小結(jié)
第6章 研究結(jié)論與展望
6.1 工作結(jié)論及創(chuàng)新點(diǎn)
6.2 展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)歷及攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與研究成果
本文編號(hào):3781724
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題來(lái)源與研究意義
1.2 字符識(shí)別國(guó)內(nèi)外發(fā)展現(xiàn)狀
1.3 本文主要研究?jī)?nèi)容
第2章 圖像預(yù)處理以及版面分析
2.1 票據(jù)圖像預(yù)處理
2.1.1 票據(jù)圖像的噪聲去除
2.1.2 票據(jù)圖像二值化
2.1.3 票據(jù)圖像的傾斜校正
2.2 版面分析
2.3 本章小結(jié)
第3章 文本檢測(cè)算法
3.1 深度卷積神經(jīng)網(wǎng)絡(luò)
3.2 深度學(xué)習(xí)目標(biāo)檢測(cè)網(wǎng)絡(luò)
3.3 注意力機(jī)制
3.3.1 空間注意力機(jī)制
3.3.2 通道注意力機(jī)制
3.4 文本檢測(cè)算法
3.4.1 多尺度圖像金字塔
3.4.1.1 高斯金字塔
3.4.1.2 拉普拉斯金字塔
3.4.2 基于改進(jìn)型YOLO-v3 的目標(biāo)檢測(cè)網(wǎng)絡(luò)
3.4.2.1 初始化候選框
3.4.2.2 稀疏訓(xùn)練
3.4.2.3 通道剪枝
3.5 文本檢測(cè)實(shí)驗(yàn)與分析
3.5.1 文本檢測(cè)數(shù)據(jù)集
3.5.2 試驗(yàn)參數(shù)設(shè)置與實(shí)驗(yàn)結(jié)果分析
3.6 本章小結(jié)
第4章 文本識(shí)別算法
4.1 基于深度學(xué)習(xí)的文本識(shí)別算法
4.1.1 特征提取網(wǎng)絡(luò)
4.1.2 特征序列識(shí)別
4.1.3 長(zhǎng)短期記憶網(wǎng)絡(luò)
4.1.4 改進(jìn)型長(zhǎng)短期記憶網(wǎng)絡(luò)
4.1.5 序列識(shí)別解碼
4.1.6 文本識(shí)別算法框架
4.2 語(yǔ)言模型
4.2.1 門控卷積神經(jīng)網(wǎng)絡(luò)
4.3 文本識(shí)別實(shí)驗(yàn)與分析
4.3.1 文本識(shí)別數(shù)據(jù)集
4.3.2 參數(shù)設(shè)置
4.3.3 實(shí)驗(yàn)結(jié)果分析
4.4 本章小結(jié)
第5章 票據(jù)圖像字符識(shí)別平臺(tái)實(shí)現(xiàn)
5.1 票據(jù)圖像字符識(shí)別算法流程
5.2 模塊介紹
5.2.1 數(shù)據(jù)構(gòu)建模塊
5.2.2 文本定位識(shí)別模塊
5.2.3 票據(jù)字符識(shí)別界面展示
5.3 本章小結(jié)
第6章 研究結(jié)論與展望
6.1 工作結(jié)論及創(chuàng)新點(diǎn)
6.2 展望
參考文獻(xiàn)
致謝
作者簡(jiǎn)歷及攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文與研究成果
本文編號(hào):3781724
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3781724.html
最近更新
教材專著