基于圖像的印刷體表格識別系統(tǒng)
發(fā)布時間:2021-03-02 15:25
書刊以及報表等印刷體文檔圖像的識別,是模式識別的一個重要分支。字符識別的技術已經(jīng)較為成熟,在市場上已有比較多的商業(yè)產(chǎn)品。而對于印刷體表格圖像的識別技術還有待進一步完善,F(xiàn)有的方法在識別時對圖片的規(guī)整度要求高、魯棒性差,并且多數(shù)識別系統(tǒng)是基于PC端。隨著移動互聯(lián)網(wǎng)的發(fā)展,PC端的系統(tǒng)已經(jīng)不能滿足需求。本文在分析研究國內外的相關技術以及產(chǎn)品現(xiàn)狀的基礎上,針對表格圖像的預處理方法、閉合印刷體表格的識別、印刷體表格中漢字的識別以及基于Android的表格識別軟件設計展開研究,最終實現(xiàn)了魯棒性較高的表格識別系統(tǒng),并完成了移動端系統(tǒng)的開發(fā)。論文完成的主要工作如下:1.對表格圖像的預處理算法進行了研究,通過優(yōu)化的二值化算法對文檔圖像進行二值化;根據(jù)表格不同的傾斜情況,對文檔圖像分別進行傾斜校正和透視校正;應用基于形態(tài)學的圖像算法對表格區(qū)域進行識別定位,并將得到的表格框線進行細化。2.提出了基于輪廓互斥篩選的單元格定位算法,該算法能夠準確地找出每一個細分單元格的具體位置,并將該部分ROI送到識別器進行識別,提高了單元格識別定位的效率。3.設計基于深度神經(jīng)網(wǎng)絡的印刷體漢字識別算法,對提取后的表格單元格整...
【文章來源】:湖南大學湖南省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學位級別】:碩士
【部分圖文】:
均值濾波前后對比圖:(a)濾波前圖像;(b)濾波后圖像
掩模平滑濾波前后對比圖:(a)濾波前圖像;(b)濾波后圖像
中值濾波前后對比圖:(a)去噪前圖像;(b)去噪后圖像
【參考文獻】:
期刊論文
[1]圖像文字識別中的預處理技術研究綜述[J]. 弓耀輝. 信息通信. 2017(09)
[2]深度學習在手寫漢字識別中的應用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊. 自動化學報. 2016(08)
[3]一種基于改進Canny的邊緣檢測算法[J]. 許宏科,秦嚴嚴,陳會茹. 紅外技術. 2014(03)
[4]基于MQDF的車牌字符識別[J]. 周明輝,劉輝,曹剛. 信息技術. 2013(07)
[5]一種基于自適用結構元素的表格框線去除形態(tài)學算法[J]. 劉艷順,邱澤陽. 貴州大學學報(自然科學版). 2008(04)
[6]基于改進Hough變換的文本圖像傾斜校正方法[J]. 周冠瑋,平西建,程娟. 計算機應用. 2007(07)
[7]光學字符識別技術與展望[J]. 荊濤,王仲. 計算機工程. 2003(02)
[8]基于有向單連通鏈的表格框線檢測算法[J]. 鄭冶楓,劉長松,丁曉青,潘世言. 軟件學報. 2002(04)
博士論文
[1]文檔圖像中圖形分析與識別關鍵技術研究[D]. 張自力.哈爾濱工業(yè)大學 2015
[2]中文版面分析關鍵技術的研究[D]. 靳從.南京理工大學 2007
碩士論文
[1]基于圖像處理和模式識別的身份證識別系統(tǒng)設計與實現(xiàn)[D]. 宋韌.電子科技大學 2015
[2]基于.NET的健康調查問卷系統(tǒng)的設計與實現(xiàn)[D]. 張亞楠.大連理工大學 2012
[3]印刷體文字識別系統(tǒng)的研究與實現(xiàn)[D]. 李俊.電子科技大學 2011
[4]印刷體中文文檔中表格和漢字的識別研究[D]. 于伯峰.哈爾濱工程大學 2011
[5]表格手寫內容識別系統(tǒng)的設計與實現(xiàn)[D]. 王淞.華中科技大學 2011
[6]車牌圖像二值化效果的改進算法研究[D]. 魏誠.浙江大學 2006
[7]印刷體漢字識別系統(tǒng)的研究與實現(xiàn)[D]. 梁涌.西北工業(yè)大學 2006
本文編號:3059499
【文章來源】:湖南大學湖南省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學位級別】:碩士
【部分圖文】:
均值濾波前后對比圖:(a)濾波前圖像;(b)濾波后圖像
掩模平滑濾波前后對比圖:(a)濾波前圖像;(b)濾波后圖像
中值濾波前后對比圖:(a)去噪前圖像;(b)去噪后圖像
【參考文獻】:
期刊論文
[1]圖像文字識別中的預處理技術研究綜述[J]. 弓耀輝. 信息通信. 2017(09)
[2]深度學習在手寫漢字識別中的應用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊. 自動化學報. 2016(08)
[3]一種基于改進Canny的邊緣檢測算法[J]. 許宏科,秦嚴嚴,陳會茹. 紅外技術. 2014(03)
[4]基于MQDF的車牌字符識別[J]. 周明輝,劉輝,曹剛. 信息技術. 2013(07)
[5]一種基于自適用結構元素的表格框線去除形態(tài)學算法[J]. 劉艷順,邱澤陽. 貴州大學學報(自然科學版). 2008(04)
[6]基于改進Hough變換的文本圖像傾斜校正方法[J]. 周冠瑋,平西建,程娟. 計算機應用. 2007(07)
[7]光學字符識別技術與展望[J]. 荊濤,王仲. 計算機工程. 2003(02)
[8]基于有向單連通鏈的表格框線檢測算法[J]. 鄭冶楓,劉長松,丁曉青,潘世言. 軟件學報. 2002(04)
博士論文
[1]文檔圖像中圖形分析與識別關鍵技術研究[D]. 張自力.哈爾濱工業(yè)大學 2015
[2]中文版面分析關鍵技術的研究[D]. 靳從.南京理工大學 2007
碩士論文
[1]基于圖像處理和模式識別的身份證識別系統(tǒng)設計與實現(xiàn)[D]. 宋韌.電子科技大學 2015
[2]基于.NET的健康調查問卷系統(tǒng)的設計與實現(xiàn)[D]. 張亞楠.大連理工大學 2012
[3]印刷體文字識別系統(tǒng)的研究與實現(xiàn)[D]. 李俊.電子科技大學 2011
[4]印刷體中文文檔中表格和漢字的識別研究[D]. 于伯峰.哈爾濱工程大學 2011
[5]表格手寫內容識別系統(tǒng)的設計與實現(xiàn)[D]. 王淞.華中科技大學 2011
[6]車牌圖像二值化效果的改進算法研究[D]. 魏誠.浙江大學 2006
[7]印刷體漢字識別系統(tǒng)的研究與實現(xiàn)[D]. 梁涌.西北工業(yè)大學 2006
本文編號:3059499
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3059499.html
最近更新
教材專著