天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于深度模型的脫機(jī)手寫體漢字識(shí)別研究

發(fā)布時(shí)間:2017-08-02 16:00

  本文關(guān)鍵詞:基于深度模型的脫機(jī)手寫體漢字識(shí)別研究


  更多相關(guān)文章: 卷積神經(jīng)網(wǎng)絡(luò) 遞歸神經(jīng)網(wǎng)絡(luò) 深度學(xué)習(xí) 脫機(jī)手寫體漢字識(shí)別


【摘要】:手寫體漢字識(shí)別在殘疾人無障礙閱讀、文獻(xiàn)自動(dòng)翻譯、文獻(xiàn)自動(dòng)錄入、金融單據(jù)的處理、快遞包裹和信件的分揀等領(lǐng)域有著廣闊的應(yīng)用前景,幫助使用者自動(dòng)錄入文字,節(jié)省勞動(dòng)力成本。它涉及機(jī)器學(xué)習(xí)、模式識(shí)別、數(shù)字圖像處理、人工智能、自然語言處理、統(tǒng)計(jì)學(xué)、信息論等多門學(xué)科。由于每個(gè)人的書寫習(xí)慣不同、漢字筆畫粘連等因素,脫機(jī)手寫體漢字識(shí)別是中文OCR領(lǐng)域最具挑戰(zhàn)性的問題。因此,本文提出基于深度學(xué)習(xí)的脫機(jī)手寫體漢字識(shí)別方法。針對(duì)無遮擋的手寫體漢字圖像,本文采取基于深度卷積神經(jīng)網(wǎng)絡(luò)的分類算法,直接使用預(yù)處理后的圖像數(shù)據(jù)作為分類器的輸入。針對(duì)深度卷積神經(jīng)網(wǎng)絡(luò)容易過擬合的特點(diǎn),本文提出滑動(dòng)窗口和彈性形變的方式等擴(kuò)充訓(xùn)練數(shù)據(jù)集,提升模型的魯棒性和泛化能力。本文使用多個(gè)不同結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò)對(duì)手寫體漢字圖像進(jìn)行分類,然后將其融合,進(jìn)一步提升模型效果。針對(duì)古籍掃描和手寫稿件掃描中出現(xiàn)的文字破損、文字被污跡遮擋等情況,提出基于深度遞歸網(wǎng)絡(luò)和深度信念網(wǎng)絡(luò)的有遮擋的手寫體漢字的識(shí)別方法。首先使用兩個(gè)深度遞歸神經(jīng)網(wǎng)絡(luò)從有遮擋的漢字圖像和無遮擋的漢字圖像中提取高層抽象特征,然后訓(xùn)練深度信念網(wǎng)絡(luò)將有遮擋手寫體漢字的特征空間轉(zhuǎn)換到無遮擋手寫體漢字的特征空間,接著用深度玻爾茲曼機(jī)進(jìn)行分類,最后添加深度卷積網(wǎng)絡(luò)隱含層提取的特征改善識(shí)別準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明,本文提出的無遮擋手寫體漢字圖像識(shí)別算法和有遮擋手寫體漢字識(shí)別算法均具有較好的識(shí)別效果。
【關(guān)鍵詞】:卷積神經(jīng)網(wǎng)絡(luò) 遞歸神經(jīng)網(wǎng)絡(luò) 深度學(xué)習(xí) 脫機(jī)手寫體漢字識(shí)別
【學(xué)位授予單位】:浙江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.43
【目錄】:
  • 摘要5-6
  • ABSTRACT6-13
  • 第1章 緒論13-18
  • 1.1 課題背景13-14
  • 1.2 課題難點(diǎn)14-16
  • 1.3 本文工作16
  • 1.4 本文組織結(jié)構(gòu)16-17
  • 1.5 本章小結(jié)17-18
  • 第2章 脫機(jī)手寫體漢字識(shí)別技術(shù)綜述18-37
  • 2.1 圖像預(yù)處理方法綜述18-24
  • 2.1.1 二值化18-20
  • 2.1.2 圖像平滑20-21
  • 2.1.3 腐蝕膨脹21-23
  • 2.1.4 歸一化23-24
  • 2.2 手寫體漢字特征提取方法綜述24-28
  • 2.2.1 彈性網(wǎng)格24-26
  • 2.2.2 漢字分解和方向特征提取26-28
  • 2.3 圖像分類方法綜述28-36
  • 2.3.1 Adaboost算法28-31
  • 2.3.2 決策樹算法31-33
  • 2.3.3 SVM算法33-36
  • 2.4 本章小結(jié)36-37
  • 第3章 無遮擋手寫體漢字識(shí)別37-57
  • 3.1 研究背景37
  • 3.2 問題描述37-38
  • 3.3 數(shù)據(jù)集38-41
  • 3.3.1 CASIA-HWDB1.1數(shù)據(jù)集38-39
  • 3.3.2 數(shù)據(jù)預(yù)處理與數(shù)據(jù)集構(gòu)造39-41
  • 3.4 基于深度卷積神經(jīng)網(wǎng)絡(luò)的手寫體漢字識(shí)別41-51
  • 3.4.1 卷積神經(jīng)網(wǎng)絡(luò)41-44
  • 3.4.2 卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練44-46
  • 3.4.3 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)46-49
  • 3.4.4 基于多網(wǎng)絡(luò)融合的手寫體漢字識(shí)別49-51
  • 3.5 實(shí)驗(yàn)結(jié)果51-55
  • 3.5.1 實(shí)驗(yàn)環(huán)境51
  • 3.5.2 基于深度卷積神經(jīng)網(wǎng)絡(luò)的手寫體漢字識(shí)別51-54
  • 3.5.3 基于多網(wǎng)絡(luò)融合的手寫體漢字識(shí)別54-55
  • 3.6 本章小結(jié)55-57
  • 第4章 有遮擋手寫體漢字識(shí)別57-76
  • 4.1 問題描述57
  • 4.2 數(shù)據(jù)集構(gòu)造57-58
  • 4.3 遞歸神經(jīng)網(wǎng)絡(luò)58-64
  • 4.3.1 遞歸神經(jīng)網(wǎng)絡(luò)58-61
  • 4.3.2 基于RNN的卷積網(wǎng)絡(luò)61-63
  • 4.3.3 基于ReNet的漢字特征提取63-64
  • 4.4 基于深度信念網(wǎng)絡(luò)的特征映射64-72
  • 4.4.1 深度信念網(wǎng)絡(luò)64-70
  • 4.4.2 基于DNN的特征映射70-72
  • 4.5 基于DBM的漢字分類72
  • 4.6 實(shí)驗(yàn)結(jié)果72-75
  • 4.7 本章小結(jié)75-76
  • 第5章 總結(jié)與展望76-78
  • 5.1 本文工作小結(jié)76-77
  • 5.2 未來工作展望77-78
  • 參考文獻(xiàn)78-83
  • 致謝83

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 劉偉;王建平;李秀娟;;基于智能結(jié)構(gòu)模型的手寫體漢字識(shí)別方法研究[J];巢湖學(xué)院學(xué)報(bào);2011年06期

2 謝克中;;聯(lián)機(jī)手寫體漢字識(shí)別[J];中南礦冶學(xué)院學(xué)報(bào);1985年02期

3 李邁;中國科學(xué)院自動(dòng)化研究所研制成功特定人手寫體漢字識(shí)別系統(tǒng)[J];高技術(shù)通訊;1996年01期

4 余楚中,趙學(xué)軍,彭靜,鄭勝林;聯(lián)機(jī)手寫體漢字識(shí)別中的筆劃分類及筆劃識(shí)別[J];重慶大學(xué)學(xué)報(bào)(自然科學(xué)版);1998年02期

5 余楚中,趙學(xué)軍,蔡雷,潘保昌;聯(lián)機(jī)手寫體漢字識(shí)別方法的研究[J];重慶大學(xué)學(xué)報(bào)(自然科學(xué)版);1998年03期

6 王正群,孫興華,楊靜宇;基于子筆劃的手寫體漢字識(shí)別[J];南京理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2002年04期

7 劉峽壁,賈云得;用于手寫體漢字識(shí)別的漢字結(jié)構(gòu)模型[J];北京理工大學(xué)學(xué)報(bào);2003年03期

8 高彥宇,楊揚(yáng);基于正交特征的手寫體漢字識(shí)別方法[J];儀器儀表學(xué)報(bào);2003年S2期

9 史紹強(qiáng),王英健,唐賢瑛;基于整形特征和模糊識(shí)別的手寫體漢字識(shí)別[J];微機(jī)發(fā)展;2004年01期

10 高彥宇,楊揚(yáng),頡斌;脫機(jī)手寫體漢字識(shí)別中多模板字典的制作方法[J];計(jì)算機(jī)工程;2005年02期

中國重要會(huì)議論文全文數(shù)據(jù)庫 前8條

1 高彥宇;楊揚(yáng);;基于正交特征的手寫體漢字識(shí)別方法[A];首屆信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2003年

2 王建平;潘樂;;基于廣義誤差反饋的手寫體漢字識(shí)別系統(tǒng)研究[A];2007'儀表,自動(dòng)化及先進(jìn)集成技術(shù)大會(huì)論文集(一)[C];2007年

3 林磊;王曉龍;徐志明;;基于語言學(xué)知識(shí)的多分類器融合方法在手寫體漢字識(shí)別中的應(yīng)用[A];輝煌二十年——中國中文信息學(xué)會(huì)二十周年學(xué)術(shù)會(huì)議論文集[C];2001年

4 王建平;陳正偉;欒慶磊;金鐵江;;基于遺傳算法的漢字識(shí)別決策系統(tǒng)的研究[A];中國計(jì)量協(xié)會(huì)冶金分會(huì)2008年會(huì)論文集[C];2008年

5 王建平;陳正偉;欒慶磊;金鐵江;;基于遺傳算法的漢字識(shí)別決策系統(tǒng)的研究[A];2008全國第十三屆自動(dòng)化應(yīng)用技術(shù)學(xué)術(shù)交流會(huì)論文集[C];2008年

6 曹鶴;裴明濤;賈云得;;一種基于上下文的手寫體漢字識(shí)別候選集選取方法[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年

7 秦朗;;基于二叉樹多層分類SVM的脫機(jī)手寫體漢字識(shí)別[A];第十九屆測(cè)控、計(jì)量、儀器儀表學(xué)術(shù)年會(huì)(MCMI'2009)論文集[C];2009年

8 寧薇;鄭翔;金奕江;趙雁南;馬少平;;基于ASIC識(shí)別卡的脫機(jī)手寫體漢字識(shí)別系統(tǒng)[A];第八屆全國漢字識(shí)別學(xué)術(shù)會(huì)議論文集[C];2002年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前4條

1 王正群;手寫體漢字識(shí)別研究[D];南京理工大學(xué);2001年

2 金連文;手寫體漢字識(shí)別的研究[D];華南理工大學(xué);1996年

3 居琰;基于多層次信息融合的手寫體漢字識(shí)別研究[D];重慶大學(xué);2002年

4 朱寧波;小類別無限制手寫體漢字識(shí)別研究[D];南京理工大學(xué);2004年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 周星辰;基于深度模型的脫機(jī)手寫體漢字識(shí)別研究[D];浙江大學(xué);2016年

2 王二帥;基于廣義特征反饋的手寫體漢字識(shí)別系統(tǒng)研究[D];合肥工業(yè)大學(xué);2010年

3 張大敏;基于變精度粗糙集的手寫體漢字識(shí)別方法的研究[D];合肥工業(yè)大學(xué);2010年

4 丁慧東;脫機(jī)手寫體漢字識(shí)別研究[D];東北師范大學(xué);2005年

5 藺菲;手寫體漢字識(shí)別的研究[D];合肥工業(yè)大學(xué);2006年

6 馮志敏;基于結(jié)構(gòu)特征的手寫體漢字識(shí)別研究[D];云南師范大學(xué);2006年

7 潘樂;基于反饋結(jié)構(gòu)的手寫體漢字識(shí)別系統(tǒng)研究[D];合肥工業(yè)大學(xué);2008年

8 謝玉芯;手寫體漢字識(shí)別方法研究[D];天津大學(xué);2010年

9 常歡;基于卷積神經(jīng)網(wǎng)絡(luò)的孤立手寫體漢字識(shí)別研究[D];安徽大學(xué);2015年

10 侯艷平;脫機(jī)手寫體漢字識(shí)別研究[D];揚(yáng)州大學(xué);2008年

,

本文編號(hào):610048

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/610048.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶087e9***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com