基于BiRNN的學(xué)生手寫文字識別系統(tǒng)設(shè)計與實現(xiàn)
發(fā)布時間:2021-02-12 02:35
手寫文字識別是計算機(jī)視覺、自然語言處理領(lǐng)域中的重要問題和研究熱點問題之一。將學(xué)生手寫文檔數(shù)字化對未來的學(xué)生作業(yè)大數(shù)據(jù)分析、在線教育等領(lǐng)域有著重要的推進(jìn)意義。傳統(tǒng)光字符識別技術(shù)主要面向高質(zhì)量印刷體文檔圖像,而在處理手寫體文檔時,會出現(xiàn)識別效果差的問題。本論文針對學(xué)生手寫文字的特點和傳統(tǒng)手寫文字識別方法的局限性,探討了基于深度學(xué)習(xí)的學(xué)生手寫文字識別方法的優(yōu)勢。提出了基于圖像數(shù)據(jù)的端到端學(xué)習(xí)方法,并訓(xùn)練得到循環(huán)卷積神經(jīng)網(wǎng)絡(luò)模型,取得了較高的準(zhǔn)確率;诒揪W(wǎng)絡(luò)模型,開發(fā)設(shè)計了一套用于學(xué)生手寫文檔格式化錄入的手寫文字識別系統(tǒng)。本論文的研究工作主要包括以下四個方面。1、針對中文字符集中,不常用字較多的現(xiàn)象,設(shè)計了一種手寫文字圖像樣本增廣方法,以解決樣本分布不均衡的問題。本論文首先統(tǒng)計并分析了訓(xùn)練樣本中不均衡的種類,然后利用添加高斯噪聲、添加椒鹽噪聲及伽馬變換三種方法模擬字體變化及光照影響,對訓(xùn)練樣本數(shù)量進(jìn)行了增廣。2、提出了一種改進(jìn)的CNN網(wǎng)絡(luò)模型。針對CNN網(wǎng)絡(luò)特征提取時網(wǎng)絡(luò)層數(shù)過深而導(dǎo)致的梯度消失問題,本論文使用了殘差模型并改進(jìn)了殘差方式與激活函數(shù),分析了改進(jìn)后訓(xùn)練時間與測試準(zhǔn)確度的效果,并對...
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
學(xué)生手寫文字樣本示例
高斯差分金字塔Fig.2-2PyramidofGaussiandifference
空間極值檢測
【參考文獻(xiàn)】:
期刊論文
[1]Long Short-Term Memory Recurrent Neural Network-Based Acoustic Model Using Connectionist Temporal Classification on a Large-Scale Training Corpus[J]. Donghyun Lee,Minkyu Lim,Hosung Park,Yoseb Kang,Jeong-Sik Park,Gil-Jin Jang,Ji-Hwan Kim. 中國通信. 2017(09)
[2]基于雙流混合變換CNN特征的圖像分類與識別[J]. 湯鵬杰,譚云蘭,李金忠,譚彬. 井岡山大學(xué)學(xué)報(自然科學(xué)版). 2015(05)
[3]基于顏色散布分析的自然場景文本定位[J]. 周慧燦,劉瓊,王耀南. 計算機(jī)工程. 2010(08)
[4]基于CNN彩色圖像邊緣檢測的車牌定位方法[J]. 劉萬軍,姜慶玲,張闖. 自動化學(xué)報. 2009(12)
[5]基于文字混合特征的視頻文本定位研究[J]. 趙超,方向忠. 微計算機(jī)信息. 2009(18)
[6]面向復(fù)雜場景圖像的文本定位新方法[J]. 傅光輝,黃劍華,唐降龍,劉家鋒,吳銳. 微計算機(jī)信息. 2008(18)
碩士論文
[1]自然場景中文本檢測識別系統(tǒng)的設(shè)計與實現(xiàn)[D]. 師軍.北京交通大學(xué) 2017
本文編號:3030114
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
學(xué)生手寫文字樣本示例
高斯差分金字塔Fig.2-2PyramidofGaussiandifference
空間極值檢測
【參考文獻(xiàn)】:
期刊論文
[1]Long Short-Term Memory Recurrent Neural Network-Based Acoustic Model Using Connectionist Temporal Classification on a Large-Scale Training Corpus[J]. Donghyun Lee,Minkyu Lim,Hosung Park,Yoseb Kang,Jeong-Sik Park,Gil-Jin Jang,Ji-Hwan Kim. 中國通信. 2017(09)
[2]基于雙流混合變換CNN特征的圖像分類與識別[J]. 湯鵬杰,譚云蘭,李金忠,譚彬. 井岡山大學(xué)學(xué)報(自然科學(xué)版). 2015(05)
[3]基于顏色散布分析的自然場景文本定位[J]. 周慧燦,劉瓊,王耀南. 計算機(jī)工程. 2010(08)
[4]基于CNN彩色圖像邊緣檢測的車牌定位方法[J]. 劉萬軍,姜慶玲,張闖. 自動化學(xué)報. 2009(12)
[5]基于文字混合特征的視頻文本定位研究[J]. 趙超,方向忠. 微計算機(jī)信息. 2009(18)
[6]面向復(fù)雜場景圖像的文本定位新方法[J]. 傅光輝,黃劍華,唐降龍,劉家鋒,吳銳. 微計算機(jī)信息. 2008(18)
碩士論文
[1]自然場景中文本檢測識別系統(tǒng)的設(shè)計與實現(xiàn)[D]. 師軍.北京交通大學(xué) 2017
本文編號:3030114
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3030114.html
最近更新
教材專著