基于深度學習的表單識別系統(tǒng)的研究與實現(xiàn)
發(fā)布時間:2021-02-25 16:34
表單以紙質或數(shù)字(電子)形式存在于人們的日常生活中。紙質表單文件易于閱讀和分享,數(shù)字則易于索引與保存。為了進行更有效的知識管理,通常需要先將紙質表單轉換為數(shù)字格式,然后再進行表單文字信息的提取。傳統(tǒng)的表單數(shù)據(jù)一般通過手動錄入的方式進行信息的統(tǒng)計和分析,隨著人工智能,模式識別的研究和發(fā)展,人們獲取表單信息的方式不再局限于手動錄入或掃描儀的方式,而是利用計算機對表單圖像進行自動化識別,從而可以大幅度提高工作效率,為人們的生活與辦公提供便利。本文通過研究國內外表單識別的發(fā)展現(xiàn)狀,在深度學習下的卷積神經(jīng)網(wǎng)絡的基礎上,展開了對自然條件下表單文檔的定位以及特定類型表單上印刷體文字識別的研究。本文主要的研究工作有:(1)基于殘差網(wǎng)絡的表單定位算法研究針對表單文檔定位問題,通過對比本文提出的普通卷積神經(jīng)網(wǎng)絡模型與殘差網(wǎng)絡模型,選擇殘差網(wǎng)絡來處理表單文檔的定位,并將殘差網(wǎng)絡與擴張卷積、Dropout技術相結合來對表單進行更好地定位。為了使網(wǎng)絡模型更具有泛化性,在實驗中所包含的文檔不止表單,還包括論文、雜志等,則此時對于文檔的定位并不依賴于文檔的內容本身。本文將表單的定位問題處理為八個特征點的檢測問題,即...
【文章來源】:武漢工程大學湖北省
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
ReLU激活函數(shù)②非線性處理在線性系統(tǒng)中,改變輸入通常產(chǎn)生一個成比例的輸出,此時的系統(tǒng)
整體流程圖如圖 3.2 所示。圖 3.2 文檔定位算法整體流程圖3.2.1 實驗流程(1)角點檢測在本章中,首先使用擴張卷積殘差網(wǎng)絡來獲得四個預測的角點,即TL,TR,BR 和 BL,網(wǎng)絡結構如圖 3.3 所示。圖 3.3 擴張卷積殘差網(wǎng)絡結構圖以“ICDAR 2015 SmartDoc Challenge 1”數(shù)據(jù)庫中樣本圖為例,提取的四個角點如圖 3.4 所示。
圖 3.2 文檔定位算法整體流程圖3.2.1 實驗流程(1)角點檢測在本章中,首先使用擴張卷積殘差網(wǎng)絡來獲得四個預測的角點,即TL,TR,BR 和 BL,網(wǎng)絡結構如圖 3.3 所示。
【參考文獻】:
期刊論文
[1]基于深度學習的場景文字檢測與識別[J]. 白翔,楊明錕,石葆光,廖明輝. 中國科學:信息科學. 2018(05)
[2]基于深度殘差網(wǎng)絡的脫機手寫漢字識別研究[J]. 張帆,張良,劉星,張宇. 計算機測量與控制. 2017(12)
[3]基于Gabor特征和協(xié)同神經(jīng)網(wǎng)絡的車牌識別方法[J]. 石貴民,余文森,肖鐘捷. 河北大學學報(自然科學版). 2016(02)
[4]基于多尺度梯度及深度神經(jīng)網(wǎng)絡的漢字識別[J]. 潘煒深,金連文,馮子勇. 北京航空航天大學學報. 2015(04)
[5]基于多重卷積神經(jīng)網(wǎng)絡的大模式聯(lián)機手寫文字識別[J]. 葛明濤,王小麗,潘立武. 現(xiàn)代電子技術. 2014(20)
[6]基于ART神經(jīng)網(wǎng)絡的漢字識別[J]. 李龍,戴鳳智,于春雨,李玢瑤,張峻霞. 天津科技大學學報. 2013(04)
[7]支持向量機的古漢字識別研究[J]. 孫華,李愛平. 電腦知識與技術. 2013(18)
[8]基于改進BP神經(jīng)網(wǎng)絡的手寫字符識別[J]. 許宜申,顧濟華,陶智,吳迪,朱明誠. 通信技術. 2011(05)
[9]利用OCR識別技術實現(xiàn)視頻中文字的提取[J]. 陳義,李言俊,孫小煒. 計算機工程與應用. 2010(10)
碩士論文
[1]基于Tesseract的電子票據(jù)云平臺的設計與實現(xiàn)[D]. 王希晨.南京大學 2016
[2]深度學習及其在手寫漢字識別中的應用研究[D]. 王有旺.華南理工大學 2014
本文編號:3051246
【文章來源】:武漢工程大學湖北省
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
ReLU激活函數(shù)②非線性處理在線性系統(tǒng)中,改變輸入通常產(chǎn)生一個成比例的輸出,此時的系統(tǒng)
整體流程圖如圖 3.2 所示。圖 3.2 文檔定位算法整體流程圖3.2.1 實驗流程(1)角點檢測在本章中,首先使用擴張卷積殘差網(wǎng)絡來獲得四個預測的角點,即TL,TR,BR 和 BL,網(wǎng)絡結構如圖 3.3 所示。圖 3.3 擴張卷積殘差網(wǎng)絡結構圖以“ICDAR 2015 SmartDoc Challenge 1”數(shù)據(jù)庫中樣本圖為例,提取的四個角點如圖 3.4 所示。
圖 3.2 文檔定位算法整體流程圖3.2.1 實驗流程(1)角點檢測在本章中,首先使用擴張卷積殘差網(wǎng)絡來獲得四個預測的角點,即TL,TR,BR 和 BL,網(wǎng)絡結構如圖 3.3 所示。
【參考文獻】:
期刊論文
[1]基于深度學習的場景文字檢測與識別[J]. 白翔,楊明錕,石葆光,廖明輝. 中國科學:信息科學. 2018(05)
[2]基于深度殘差網(wǎng)絡的脫機手寫漢字識別研究[J]. 張帆,張良,劉星,張宇. 計算機測量與控制. 2017(12)
[3]基于Gabor特征和協(xié)同神經(jīng)網(wǎng)絡的車牌識別方法[J]. 石貴民,余文森,肖鐘捷. 河北大學學報(自然科學版). 2016(02)
[4]基于多尺度梯度及深度神經(jīng)網(wǎng)絡的漢字識別[J]. 潘煒深,金連文,馮子勇. 北京航空航天大學學報. 2015(04)
[5]基于多重卷積神經(jīng)網(wǎng)絡的大模式聯(lián)機手寫文字識別[J]. 葛明濤,王小麗,潘立武. 現(xiàn)代電子技術. 2014(20)
[6]基于ART神經(jīng)網(wǎng)絡的漢字識別[J]. 李龍,戴鳳智,于春雨,李玢瑤,張峻霞. 天津科技大學學報. 2013(04)
[7]支持向量機的古漢字識別研究[J]. 孫華,李愛平. 電腦知識與技術. 2013(18)
[8]基于改進BP神經(jīng)網(wǎng)絡的手寫字符識別[J]. 許宜申,顧濟華,陶智,吳迪,朱明誠. 通信技術. 2011(05)
[9]利用OCR識別技術實現(xiàn)視頻中文字的提取[J]. 陳義,李言俊,孫小煒. 計算機工程與應用. 2010(10)
碩士論文
[1]基于Tesseract的電子票據(jù)云平臺的設計與實現(xiàn)[D]. 王希晨.南京大學 2016
[2]深度學習及其在手寫漢字識別中的應用研究[D]. 王有旺.華南理工大學 2014
本文編號:3051246
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3051246.html
最近更新
教材專著