基于深度學習的脫機手寫漢字識別技術研究
發(fā)布時間:2022-01-10 13:57
漢字是世界上使用最多的文字,漢字識別在殘疾人無障礙閱讀、文獻自動錄入、郵件分揀、銀行票據處理、證件識別等領域有著重要的應用價值。漢字數量巨大,手寫風格各異,并且漢字中存在大量的形近字,導致脫機手寫漢字識別一直存在準確率偏低的問題。近年來,深度學習發(fā)展迅速,在模式識別、自然語言處理、語音識別等領域都取得了不錯的成績。因此,本文采用深度學習的方法對脫機手寫漢字識別進行研究。針對漢字識別大分類問題,采用深度學習中卷積神經網絡的方法對GB2312-80標準中規(guī)定的最常用的一級3755個漢字進行識別。典型的卷積神經網絡是一個端到端的結構,直接接受原圖輸入,但卻無法學習到相關領域知識。常規(guī)卷積操作中,圖像對應區(qū)域的所有通道均被同時考慮,無形中增加了網絡的冗余度。本文對此進行改進,使用圖像的八方向梯度特征作為卷積神經網絡輸入,使用深度可分離的卷積方式進行卷積。最后設計多組卷積神經網絡進行實驗,在CASIA-HWDB數據集上的實驗結果表明,八方向梯度特征輸入與深度可分離卷積能夠顯著提升漢字識別效果,最終取得了95.86%的準確率。針對脫機手寫漢字識別中形近字難以識別問題,從兩個方面進行改進。方法一,使...
【文章來源】:重慶郵電大學重慶市
【文章頁數】:73 頁
【學位級別】:碩士
【部分圖文】:
圖像預處理前后效果對比圖
八方向梯度平面示意圖
CPU Intel Core i7-87GPU Nvidia RAM DD深度學習框架 Keras2.1.0,編程語言 P3.4.2 CASIA-HWDB 數據集深度學習是在數據驅動下發(fā)展的,沒有數的手寫漢字數據集有北京郵電大學模式識別實及中科院自動化研究所模式識別國家重點實驗相對于 HCL2000 數據集,CASIA-HWDB 數據別難度更大,因此本文選擇 CASIA-HWDB 數CASIA-HWDB 數據集樣本圖像如圖 3.8 所示。
【參考文獻】:
期刊論文
[1]深度學習在手寫漢字識別中的應用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊. 自動化學報. 2016(08)
[2]大數據下的基于深度神經網的相似漢字識別[J]. 楊釗,陶大鵬,張樹業(yè),金連文. 通信學報. 2014(09)
[3]基于CNN和隨機彈性形變的相似手寫漢字識別[J]. 高學,王有旺. 華南理工大學學報(自然科學版). 2014(01)
[4]支持向量機理論與算法研究綜述[J]. 丁世飛,齊丙娟,譚紅艷. 電子科技大學學報. 2011(01)
[5]SVM分類核函數及參數選擇比較[J]. 奉國和. 計算機工程與應用. 2011(03)
[6]一種基于支持向量機的手寫漢字識別方法[J]. 高學,金連文,尹俊勛,黃建成. 電子學報. 2002(05)
博士論文
[1]基于支持向量機的脫機手寫相似漢字識別的研究[D]. 封筠.北京科技大學 2005
碩士論文
[1]基于卷積神經網絡的脫機手寫漢字識別系統(tǒng)研究[D]. 高燦.安徽理工大學 2017
[2]基于深度學習的手寫漢字識別技術研究[D]. 孫巍巍.哈爾濱理工大學 2017
[3]深度卷積神經網絡及其在手寫體漢字識別中的應用研究[D]. 郭鵬.四川師范大學 2016
[4]深度學習及其在脫機手寫漢字識別領域的應用研究[D]. 劉全升.華南理工大學 2016
[5]基于深度模型的脫機手寫體漢字識別研究[D]. 周星辰.浙江大學 2016
[6]深度學習及其在手寫漢字識別中的應用研究[D]. 王有旺.華南理工大學 2014
本文編號:3580832
【文章來源】:重慶郵電大學重慶市
【文章頁數】:73 頁
【學位級別】:碩士
【部分圖文】:
圖像預處理前后效果對比圖
八方向梯度平面示意圖
CPU Intel Core i7-87GPU Nvidia RAM DD深度學習框架 Keras2.1.0,編程語言 P3.4.2 CASIA-HWDB 數據集深度學習是在數據驅動下發(fā)展的,沒有數的手寫漢字數據集有北京郵電大學模式識別實及中科院自動化研究所模式識別國家重點實驗相對于 HCL2000 數據集,CASIA-HWDB 數據別難度更大,因此本文選擇 CASIA-HWDB 數CASIA-HWDB 數據集樣本圖像如圖 3.8 所示。
【參考文獻】:
期刊論文
[1]深度學習在手寫漢字識別中的應用綜述[J]. 金連文,鐘卓耀,楊釗,楊維信,謝澤澄,孫俊. 自動化學報. 2016(08)
[2]大數據下的基于深度神經網的相似漢字識別[J]. 楊釗,陶大鵬,張樹業(yè),金連文. 通信學報. 2014(09)
[3]基于CNN和隨機彈性形變的相似手寫漢字識別[J]. 高學,王有旺. 華南理工大學學報(自然科學版). 2014(01)
[4]支持向量機理論與算法研究綜述[J]. 丁世飛,齊丙娟,譚紅艷. 電子科技大學學報. 2011(01)
[5]SVM分類核函數及參數選擇比較[J]. 奉國和. 計算機工程與應用. 2011(03)
[6]一種基于支持向量機的手寫漢字識別方法[J]. 高學,金連文,尹俊勛,黃建成. 電子學報. 2002(05)
博士論文
[1]基于支持向量機的脫機手寫相似漢字識別的研究[D]. 封筠.北京科技大學 2005
碩士論文
[1]基于卷積神經網絡的脫機手寫漢字識別系統(tǒng)研究[D]. 高燦.安徽理工大學 2017
[2]基于深度學習的手寫漢字識別技術研究[D]. 孫巍巍.哈爾濱理工大學 2017
[3]深度卷積神經網絡及其在手寫體漢字識別中的應用研究[D]. 郭鵬.四川師范大學 2016
[4]深度學習及其在脫機手寫漢字識別領域的應用研究[D]. 劉全升.華南理工大學 2016
[5]基于深度模型的脫機手寫體漢字識別研究[D]. 周星辰.浙江大學 2016
[6]深度學習及其在手寫漢字識別中的應用研究[D]. 王有旺.華南理工大學 2014
本文編號:3580832
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3580832.html