基于深度學(xué)習(xí)的手寫漢字識(shí)別技術(shù)研究
本文選題:手寫漢字識(shí)別 + 深度學(xué)習(xí)。 參考:《哈爾濱理工大學(xué)》2017年碩士論文
【摘要】:世界上使用人數(shù)最多、信息存儲(chǔ)最簡練、運(yùn)用最廣泛的語言文字,是中國傳統(tǒng)文化和世界文化不可或缺的重要部分,所以針對(duì)漢字圖像的識(shí)別研究具有非常重要的實(shí)用價(jià)值。手寫漢字識(shí)別在日常的辦公自動(dòng)化、郵件分揀、金融等領(lǐng)域都具有非常很好的前景,手寫漢字識(shí)別的研究可以使人們的日常生活更便捷。但是由于漢字的類別多,并且結(jié)構(gòu)復(fù)雜,存在大量的相似漢字,再加上不同的人有不同的書寫風(fēng)格,在不同的書寫環(huán)境、書寫方式情況下,手寫出來的漢字圖像從種類和相似度等方面都很復(fù)雜,這就使得手寫漢字識(shí)別在模式識(shí)別領(lǐng)域一直是難點(diǎn)同時(shí)也是研究熱點(diǎn)。近年來,深度學(xué)習(xí)成為機(jī)器學(xué)習(xí)領(lǐng)域最熱門的研究內(nèi)容,尤其是在圖像識(shí)別領(lǐng)域取得了非常好的效果。它能將復(fù)雜函數(shù)用更簡潔的方式表達(dá),可以自動(dòng)獲取樣本概率分布同時(shí)在學(xué)習(xí)樣本特征上具有優(yōu)勢。因此本文將深度學(xué)習(xí)模型應(yīng)用到脫機(jī)手寫漢字識(shí)別任務(wù)當(dāng)中,通過使用深度學(xué)習(xí)中不同的方法和模型,進(jìn)一步提高手寫漢字識(shí)別的準(zhǔn)確性。本文研究內(nèi)容主要分以下幾個(gè)方面:首先從深度信念網(wǎng)絡(luò)入手,分析了傳統(tǒng)手寫漢字識(shí)別方法的不足,提出了一種基于深度信念網(wǎng)絡(luò)融合模型對(duì)手寫漢字識(shí)別的方法。該方法首先用修正的二次判別函數(shù)分類器識(shí)別較為簡單的漢字,而較為復(fù)雜的漢字圖像交給深度信念網(wǎng)絡(luò)模型來處理,具體的分工過程通過定義可信度來協(xié)調(diào)兩個(gè)分類器在識(shí)別任務(wù)中的分工,從而達(dá)到理想的識(shí)別效果。然后從卷積神經(jīng)網(wǎng)絡(luò)入手,卷積神經(jīng)網(wǎng)絡(luò)優(yōu)于傳統(tǒng)的圖像分類方法在特征提取方面,所以將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在脫機(jī)手寫漢字識(shí)別問題中。分析了卷積在手寫漢字處理中的優(yōu)缺點(diǎn),針對(duì)相似手寫漢字分類問題,進(jìn)一步改進(jìn)卷積神經(jīng)網(wǎng)絡(luò),充分利用網(wǎng)絡(luò)中特征提取的優(yōu)勢,二分類器則采用經(jīng)典的SVM分類器,兩者結(jié)合更好的對(duì)相似手寫漢字識(shí)別分類。本文實(shí)驗(yàn)選用MNIST手寫字、中國科學(xué)院自動(dòng)化研究所采集的CASIA-HWDB1.1、北京郵電大學(xué)采集的HCL2000數(shù)據(jù)集。實(shí)驗(yàn)表明,本文提出的基于卷積神經(jīng)網(wǎng)絡(luò)的手寫漢字識(shí)別方法能取得較好的識(shí)別效果。
[Abstract]:It is an indispensable part of Chinese traditional culture and world culture to use the largest number of people in the world, the most concise information storage, the most widely used language and characters, so the research on Chinese character image recognition has very important practical value.Handwritten Chinese character recognition has a very good prospect in the fields of office automation, mail sorting, finance and so on. The research of handwritten Chinese character recognition can make people's daily life more convenient.But because of the variety of Chinese characters, the complexity of their structure, the existence of a large number of similar characters, and the fact that different people have different writing styles, in different writing environments and ways of writing,Handwritten Chinese character images are very complex in terms of type and similarity, which makes handwritten Chinese character recognition difficult and research hotspot in the field of pattern recognition.In recent years, depth learning has become the most popular research content in machine learning field, especially in the field of image recognition.It can express the complex function in a more concise way, and it can automatically obtain the probability distribution of the sample and have the advantage in learning the feature of the sample.In this paper, the depth learning model is applied to the off-line handwritten Chinese character recognition task, and the accuracy of handwritten Chinese character recognition is further improved by using different methods and models in depth learning.The main contents of this paper are as follows: firstly, from the perspective of depth belief network, the shortcomings of traditional handwritten Chinese character recognition methods are analyzed, and a method of handwritten Chinese character recognition based on depth belief network fusion model is proposed.Firstly, the modified quadratic discriminant function classifier is used to recognize the simpler Chinese characters, and the more complex Chinese character images are processed by the depth belief network model.The specific process of division of labor coordinates the division of labor between the two classifiers in the recognition task by defining the credibility, so as to achieve the ideal recognition effect.Then, the convolution neural network is better than the traditional image classification method in feature extraction, so the convolution neural network is applied to the off-line handwritten Chinese character recognition problem.The advantages and disadvantages of convolution in handwritten Chinese character processing are analyzed. Aiming at the problem of similar handwritten Chinese character classification, the convolution neural network is further improved to make full use of the advantages of feature extraction in the network. The second classifier uses the classical SVM classifier.The combination of the two is better for the recognition and classification of similar handwritten Chinese characters.In this paper, MNIST handwritten, CASIA-HWDB1.1 collected by Institute of Automation, Chinese Academy of Sciences, and HCL2000 data set collected by Beijing University of posts and Telecommunications are selected.Experimental results show that the proposed method based on convolution neural network can achieve good recognition effect.
【學(xué)位授予單位】:哈爾濱理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.43;TP181
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王林泉;;關(guān)于手寫漢字識(shí)別的研究[J];計(jì)算機(jī)研究與發(fā)展;1987年07期
2 ;漢王聯(lián)機(jī)手寫漢字識(shí)別第六版開發(fā)成功[J];自動(dòng)化博覽;1996年02期
3 薛炳如,楊靜宇,胡鐘山,婁震;小類別數(shù)手寫漢字識(shí)別[J];計(jì)算機(jī)研究與發(fā)展;2000年04期
4 劉昌平,錢躍良,張永慧,宋東,李豐林;863手寫漢字識(shí)別測試平臺(tái)[J];中文信息學(xué)報(bào);2000年02期
5 李宏東,葉秀清,顧偉康;知識(shí)基聯(lián)機(jī)自然手寫漢字識(shí)別[J];杭州電子工業(yè)學(xué)院學(xué)報(bào);2000年06期
6 唐云廷,羅勇,周必水;基于參照模型的聯(lián)機(jī)手寫漢字筆劃提取及識(shí)別[J];計(jì)算技術(shù)與自動(dòng)化;2002年03期
7 張洪剛,劉剛,郭軍;一種手寫漢字識(shí)別結(jié)果可信度的測定方法及應(yīng)用[J];計(jì)算機(jī)學(xué)報(bào);2003年05期
8 趙姝巖,郭捷,施鵬飛;基于筆畫分析和背景細(xì)化的粘連手寫漢字切分[J];上海交通大學(xué)學(xué)報(bào);2003年09期
9 俞慶英,吳建國;一種聯(lián)機(jī)手寫漢字識(shí)別算法的研究與實(shí)現(xiàn)[J];合肥學(xué)院學(xué)報(bào)(自然科學(xué)版);2004年01期
10 白宇,徐慶新,劉斌;基于語義的手寫漢字識(shí)別模型[J];計(jì)算機(jī)工程與應(yīng)用;2005年07期
相關(guān)會(huì)議論文 前8條
1 方應(yīng)謙;張琦;;脫機(jī)手寫漢字的模糊識(shí)別方法[A];2001年中國智能自動(dòng)化會(huì)議論文集(上冊(cè))[C];2001年
2 盧達(dá);浦煒;謝銘培;;基于SEART網(wǎng)和模糊相似測量的手寫漢字預(yù)分類法[A];2005年全國自動(dòng)化新技術(shù)學(xué)術(shù)交流會(huì)論文集[C];2005年
3 盧達(dá);浦煒;謝銘培;;基于SEART網(wǎng)和模糊相似測量的手寫漢字預(yù)分類法[A];2005全國自動(dòng)化新技術(shù)學(xué)術(shù)交流會(huì)論文集(二)[C];2005年
4 吳天雷;馬少平;;基于重疊動(dòng)態(tài)網(wǎng)格和模糊方向線素特征的手寫漢字識(shí)別[A];第八屆全國漢字識(shí)別學(xué)術(shù)會(huì)議論文集[C];2002年
5 陳森;高學(xué);;基于LDA的手寫漢字特征選擇方法[A];2009年中國高校通信類院系學(xué)術(shù)研討會(huì)論文集[C];2009年
6 劉麗艷;盛立東;;一個(gè)特定人手寫漢字識(shí)別系統(tǒng)的實(shí)現(xiàn)[A];第八屆全國漢字識(shí)別學(xué)術(shù)會(huì)議論文集[C];2002年
7 唐降龍;劉家鋒;趙巍;;部件HMM級(jí)聯(lián)的聯(lián)機(jī)自由手寫漢字識(shí)別方法[A];第八屆全國漢字識(shí)別學(xué)術(shù)會(huì)議論文集[C];2002年
8 黃磊;劉昌平;劉迎建;;基于非參數(shù)化降維的手寫漢字識(shí)別研究[A];中文信息處理前沿進(jìn)展——中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
相關(guān)重要報(bào)紙文章 前4條
1 顧艷偉;專家建議:書法應(yīng)成為學(xué)生必修課[N];中國消費(fèi)者報(bào);2008年
2 早報(bào)記者 駱俊澎;莫讓手寫漢字成為他國的“非遺”[N];東方早報(bào);2013年
3 本報(bào)通訊員 王莉 董潔;網(wǎng)友熱議漢字書寫[N];光明日?qǐng)?bào);2010年
4 記者 唐斌;漢王科技研制成功漢字手寫芯片[N];計(jì)算機(jī)世界;2003年
相關(guān)博士學(xué)位論文 前4條
1 呂新橋;聯(lián)機(jī)手寫漢字識(shí)別技術(shù)研究[D];華中科技大學(xué);2009年
2 蘇哲文;手寫漢字圖像動(dòng)態(tài)信息恢復(fù)方法研究[D];華中科技大學(xué);2009年
3 高學(xué);基于運(yùn)動(dòng)圖像的手寫漢字識(shí)別研究[D];華南理工大學(xué);2003年
4 朱雷;古籍手寫漢字圖像分割算法研究[D];重慶大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 李小園;基于結(jié)構(gòu)分析的離線手寫漢字切分[D];河北大學(xué);2009年
2 劉欣;基于卷積神經(jīng)網(wǎng)絡(luò)的聯(lián)機(jī)手寫漢字識(shí)別系統(tǒng)[D];哈爾濱工業(yè)大學(xué);2015年
3 孫巍巍;基于深度學(xué)習(xí)的手寫漢字識(shí)別技術(shù)研究[D];哈爾濱理工大學(xué);2017年
4 羅巧玲;聯(lián)機(jī)手寫漢字識(shí)別關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2009年
5 黃盛明;聯(lián)機(jī)手寫漢字的旋轉(zhuǎn)無關(guān)識(shí)別研究[D];華南理工大學(xué);2010年
6 王有旺;深度學(xué)習(xí)及其在手寫漢字識(shí)別中的應(yīng)用研究[D];華南理工大學(xué);2014年
7 劉曉娟;聯(lián)機(jī)手寫漢字識(shí)別中字根提取算法研究[D];華中科技大學(xué);2008年
8 崔景楠;基于筆順重排的聯(lián)機(jī)手寫漢字識(shí)別的研究與實(shí)現(xiàn)[D];遼寧工程技術(shù)大學(xué);2009年
9 劉學(xué)文;聚類分析在手寫漢字識(shí)別中的應(yīng)用[D];華南理工大學(xué);2010年
10 莫詠柳;基于支持向量機(jī)的聯(lián)機(jī)手寫漢字識(shí)別的研究[D];太原理工大學(xué);2011年
,本文編號(hào):1758520
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1758520.html