基于深度學(xué)習(xí)的漢字識別技術(shù)研究
發(fā)布時間:2022-12-18 00:28
漢字圖像識別是模式識別研究與應(yīng)用領(lǐng)域的一個重要分支,在經(jīng)濟貿(mào)易、智能交通、文字印刷等許多領(lǐng)域有著極其廣泛的應(yīng)用。因此,漢字識別方法的技術(shù)研究與開發(fā)越來越受到人們的重視,現(xiàn)今已經(jīng)成為世界范圍內(nèi)熱門研究的課題之一。隨著深度學(xué)習(xí)在人工智能領(lǐng)域中的快速發(fā)展,深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)在模式識別中獲得了優(yōu)秀的識別性能。針對傳統(tǒng)漢字識別受特征提取方法的限制,深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)便發(fā)揮了可以自動獲取學(xué)習(xí)樣本特征的優(yōu)勢,但是深度學(xué)習(xí)在訓(xùn)練樣本時比較復(fù)雜所以難度較大。本文通過結(jié)合卷積神經(jīng)網(wǎng)絡(luò)以及傳統(tǒng)模式識別在漢字識別的應(yīng)用進行了相關(guān)的研究,論文主要研究工作如下:1)本文研究了傳統(tǒng)漢字圖像識別方法,使用支持向量機加決策樹作為分類器,分別使用方向特征、Gabor特征以及彈性網(wǎng)格特征加上三種不同的數(shù)據(jù)集預(yù)處理方法進行試驗。實驗表明使用形態(tài)學(xué)轉(zhuǎn)換的數(shù)據(jù)集預(yù)處理方法加上使用彈性網(wǎng)格特征,能夠獲得較好的識別準(zhǔn)確率。2)為了解決形相似漢字的微小差異會在訓(xùn)練中丟失的問題,通過將注意力層與本文選定的AlexNet網(wǎng)絡(luò)中的卷積層進行并聯(lián),以提高漢字圖像中微小差異處的權(quán)重,達到提高該處注意力的目的,從而減少卷積層對于丟...
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)的漢字識別
1.2.2 基于深度學(xué)習(xí)的漢字識別
1.3 論文主要內(nèi)容和組織結(jié)構(gòu)
第2章 傳統(tǒng)漢字圖像識別方法
2.1 漢字識別的流程
2.2 預(yù)處理
2.2.1 圖像二值化
2.2.2 圖像平滑
2.2.3 形態(tài)學(xué)轉(zhuǎn)換
2.2.4 規(guī)整化
2.3 特征提取
2.3.1 方向特征
2.3.2 Gabor特征
2.3.3 彈性網(wǎng)格
2.4 圖像分類方法
2.4.1 決策樹算法
2.4.2 提升算法
2.4.3 支持向量機
2.5 本章小結(jié)
第3章 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別
3.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
3.1.1 局部感知區(qū)域與權(quán)值共享
3.1.2 激勵函數(shù)
3.1.3 局部響應(yīng)歸一化
3.1.4 池化
3.1.5 Dropout
3.2 卷積神經(jīng)網(wǎng)絡(luò)的前向傳播
3.2.1 卷積層的前向傳播
3.2.2 池化層的前向傳播
3.2.3 全連接層的前向傳播
3.2.4 Softmax層的前向傳播
3.3 卷積神經(jīng)網(wǎng)絡(luò)的反向傳播
3.3.1 Softmax層的反向傳播
3.3.2 全連接層的反向傳播
3.3.3 池化層的反向傳播
3.3.4 卷積層的反向傳播
3.4 本章小結(jié)
第4章 集成注意力層的卷積神經(jīng)網(wǎng)絡(luò)在漢字識別上的應(yīng)用
4.1 研究目的與總體思路
4.2 基準(zhǔn)模型選取
4.2.1 模型設(shè)計
4.2.2 實驗
4.3 AlexNet詳解
4.4 基于注意力層的卷積神經(jīng)網(wǎng)絡(luò)
4.4.1 注意力層原理
4.4.2 集成注意力層的卷積神經(jīng)網(wǎng)絡(luò)
4.5 本章小結(jié)
第5章 漢字圖像識別實驗
5.1 實驗平臺搭建
5.1.1 GPU架構(gòu)設(shè)計
5.1.2 數(shù)據(jù)交互
5.1.3 軟件設(shè)計
5.2 數(shù)據(jù)集
5.2.1 數(shù)據(jù)集介紹
5.2.2 數(shù)據(jù)增強
5.3 漢字圖像識別實驗
5.3.1 實驗一:傳統(tǒng)漢字識別試驗方法對比
5.3.2 實驗二:漢字圖像分辨率對比
5.3.3 實驗三:訓(xùn)練樣本數(shù)量對比
5.3.4 實驗四:網(wǎng)絡(luò)結(jié)構(gòu)對比
5.3.5 實驗五:網(wǎng)絡(luò)性能優(yōu)化
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 本文的主要工作
6.2 未來工作的展望
參考文獻
攻讀學(xué)位期間發(fā)表的論文
致謝
【參考文獻】:
期刊論文
[1]一種基于CNN手寫字符識別的改進方法[J]. 高燦. 黑龍江科技信息. 2017(03)
[2]基于GPU的卷積檢測模型加速[J]. 劉琦,黃咨,陳璐艷,胡福喬. 計算機應(yīng)用與軟件. 2016(05)
[3]基于方向線素特征的手寫體維文字符識別[J]. 姜文,盧朝陽,李靜. 微電子學(xué)與計算機. 2013(10)
[4]基于手寫體漢字雙彈性網(wǎng)格模糊特征的研究[J]. 魏瑋,郭向丹. 控制工程. 2012(06)
[5]手寫體漢字識別的二叉樹SVM算法研究[J]. 朱程輝,項思俊. 計算機技術(shù)與發(fā)展. 2009(09)
[6]基于二元樹復(fù)數(shù)小波變換的文種自動識別[J]. 朱華光,平西建,程娟. 數(shù)據(jù)采集與處理. 2008(06)
[7]基于Gabor變換的高魯棒漢字識別新方法[J]. 王學(xué)文,丁曉青,劉長松. 電子學(xué)報. 2002(09)
[8]一種基于支持向量機的手寫漢字識別方法[J]. 高學(xué),金連文,尹俊勛,黃建成. 電子學(xué)報. 2002(05)
[9]基于多尺度小波紋理分析的文字種類自動識別[J]. 曾理,唐遠炎,陳廷槐. 計算機學(xué)報. 2000(07)
[10]一種基于灰度期望值的圖象二值化算法[J]. 高永英,張利,吳國威. 中國圖象圖形學(xué)報. 1999(06)
博士論文
[1]降維算法和手寫文字識別中若干問題研究[D]. 姚超.西安電子科技大學(xué) 2014
碩士論文
[1]基于深度學(xué)習(xí)的字符識別[D]. 張超群.電子科技大學(xué) 2016
[2]基于CPU-GPU異構(gòu)平臺的圖像處理的加速研究[D]. 宋展.西安電子科技大學(xué) 2014
[3]深度學(xué)習(xí)及其在手寫漢字識別中的應(yīng)用研究[D]. 王有旺.華南理工大學(xué) 2014
[4]維吾爾文單字符Gabor特征提取與識別[D]. 姜文.西安電子科技大學(xué) 2012
[5]基于大字符集脫機手寫體漢字識別方法研究[D]. 周雙飛.蘇州大學(xué) 2011
[6]基于圖像匹配的漢字識別系統(tǒng)研究與實現(xiàn)[D]. 武桐.上海交通大學(xué) 2010
本文編號:3720957
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)的漢字識別
1.2.2 基于深度學(xué)習(xí)的漢字識別
1.3 論文主要內(nèi)容和組織結(jié)構(gòu)
第2章 傳統(tǒng)漢字圖像識別方法
2.1 漢字識別的流程
2.2 預(yù)處理
2.2.1 圖像二值化
2.2.2 圖像平滑
2.2.3 形態(tài)學(xué)轉(zhuǎn)換
2.2.4 規(guī)整化
2.3 特征提取
2.3.1 方向特征
2.3.2 Gabor特征
2.3.3 彈性網(wǎng)格
2.4 圖像分類方法
2.4.1 決策樹算法
2.4.2 提升算法
2.4.3 支持向量機
2.5 本章小結(jié)
第3章 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像識別
3.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
3.1.1 局部感知區(qū)域與權(quán)值共享
3.1.2 激勵函數(shù)
3.1.3 局部響應(yīng)歸一化
3.1.4 池化
3.1.5 Dropout
3.2 卷積神經(jīng)網(wǎng)絡(luò)的前向傳播
3.2.1 卷積層的前向傳播
3.2.2 池化層的前向傳播
3.2.3 全連接層的前向傳播
3.2.4 Softmax層的前向傳播
3.3 卷積神經(jīng)網(wǎng)絡(luò)的反向傳播
3.3.1 Softmax層的反向傳播
3.3.2 全連接層的反向傳播
3.3.3 池化層的反向傳播
3.3.4 卷積層的反向傳播
3.4 本章小結(jié)
第4章 集成注意力層的卷積神經(jīng)網(wǎng)絡(luò)在漢字識別上的應(yīng)用
4.1 研究目的與總體思路
4.2 基準(zhǔn)模型選取
4.2.1 模型設(shè)計
4.2.2 實驗
4.3 AlexNet詳解
4.4 基于注意力層的卷積神經(jīng)網(wǎng)絡(luò)
4.4.1 注意力層原理
4.4.2 集成注意力層的卷積神經(jīng)網(wǎng)絡(luò)
4.5 本章小結(jié)
第5章 漢字圖像識別實驗
5.1 實驗平臺搭建
5.1.1 GPU架構(gòu)設(shè)計
5.1.2 數(shù)據(jù)交互
5.1.3 軟件設(shè)計
5.2 數(shù)據(jù)集
5.2.1 數(shù)據(jù)集介紹
5.2.2 數(shù)據(jù)增強
5.3 漢字圖像識別實驗
5.3.1 實驗一:傳統(tǒng)漢字識別試驗方法對比
5.3.2 實驗二:漢字圖像分辨率對比
5.3.3 實驗三:訓(xùn)練樣本數(shù)量對比
5.3.4 實驗四:網(wǎng)絡(luò)結(jié)構(gòu)對比
5.3.5 實驗五:網(wǎng)絡(luò)性能優(yōu)化
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 本文的主要工作
6.2 未來工作的展望
參考文獻
攻讀學(xué)位期間發(fā)表的論文
致謝
【參考文獻】:
期刊論文
[1]一種基于CNN手寫字符識別的改進方法[J]. 高燦. 黑龍江科技信息. 2017(03)
[2]基于GPU的卷積檢測模型加速[J]. 劉琦,黃咨,陳璐艷,胡福喬. 計算機應(yīng)用與軟件. 2016(05)
[3]基于方向線素特征的手寫體維文字符識別[J]. 姜文,盧朝陽,李靜. 微電子學(xué)與計算機. 2013(10)
[4]基于手寫體漢字雙彈性網(wǎng)格模糊特征的研究[J]. 魏瑋,郭向丹. 控制工程. 2012(06)
[5]手寫體漢字識別的二叉樹SVM算法研究[J]. 朱程輝,項思俊. 計算機技術(shù)與發(fā)展. 2009(09)
[6]基于二元樹復(fù)數(shù)小波變換的文種自動識別[J]. 朱華光,平西建,程娟. 數(shù)據(jù)采集與處理. 2008(06)
[7]基于Gabor變換的高魯棒漢字識別新方法[J]. 王學(xué)文,丁曉青,劉長松. 電子學(xué)報. 2002(09)
[8]一種基于支持向量機的手寫漢字識別方法[J]. 高學(xué),金連文,尹俊勛,黃建成. 電子學(xué)報. 2002(05)
[9]基于多尺度小波紋理分析的文字種類自動識別[J]. 曾理,唐遠炎,陳廷槐. 計算機學(xué)報. 2000(07)
[10]一種基于灰度期望值的圖象二值化算法[J]. 高永英,張利,吳國威. 中國圖象圖形學(xué)報. 1999(06)
博士論文
[1]降維算法和手寫文字識別中若干問題研究[D]. 姚超.西安電子科技大學(xué) 2014
碩士論文
[1]基于深度學(xué)習(xí)的字符識別[D]. 張超群.電子科技大學(xué) 2016
[2]基于CPU-GPU異構(gòu)平臺的圖像處理的加速研究[D]. 宋展.西安電子科技大學(xué) 2014
[3]深度學(xué)習(xí)及其在手寫漢字識別中的應(yīng)用研究[D]. 王有旺.華南理工大學(xué) 2014
[4]維吾爾文單字符Gabor特征提取與識別[D]. 姜文.西安電子科技大學(xué) 2012
[5]基于大字符集脫機手寫體漢字識別方法研究[D]. 周雙飛.蘇州大學(xué) 2011
[6]基于圖像匹配的漢字識別系統(tǒng)研究與實現(xiàn)[D]. 武桐.上海交通大學(xué) 2010
本文編號:3720957
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3720957.html
最近更新
教材專著