天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

2016流行的手寫體字_最簡(jiǎn)單的手寫體_基于SVM的脫機(jī)手寫體漢字識(shí)別研究

發(fā)布時(shí)間:2016-08-13 19:01

  本文關(guān)鍵詞:脫機(jī)手寫體漢字識(shí)別研究,由筆耕文化傳播整理發(fā)布。


脫機(jī)手寫體漢字識(shí)別目前仍然是模式識(shí)別中最困難的問題之一,因而也是手寫中文信息化的主要障礙之一,它的研究對(duì)漢字信息處理自動(dòng)化及開拓新一代計(jì)算機(jī)的智能輸入都有著重要的意義。由于脫機(jī)手寫體漢字是一個(gè)超多類復(fù)雜模式識(shí)別問題,以往的研究顯示,要想得到較高的識(shí)別率,需要集成多種識(shí)別方法,但同時(shí)也增加了系統(tǒng)開銷。支持向量機(jī)理論是基于統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的,有較好的理論框架。它在解決小樣本、非線性及高維模式識(shí)別問題中表現(xiàn)出許多特有的優(yōu)勢(shì)。脫機(jī)手寫體漢字識(shí)別屬于復(fù)雜高維模式識(shí)別問題,將SVM理論運(yùn)用于脫機(jī)手寫體漢字的識(shí)別有較大的理論...

脫機(jī)手寫體漢字識(shí)別目前仍然是模式識(shí)別中最困難的問題之一,因而也是手寫中文信息化的主要障礙之一,它的研究對(duì)漢字信息處理自動(dòng)化及開拓新一代計(jì)算機(jī)的智能輸入都有著重要的意義。由于脫機(jī)手寫體漢字是一個(gè)超多類復(fù)雜模式識(shí)別問題,以往的研究顯示,要想得到較高的識(shí)別率,需要集成多種識(shí)別方法,但同時(shí)也增加了系統(tǒng)開銷。支持向量機(jī)理論是基于統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的,有較好的理論框架。它在解決小樣本、非線性及高維模式識(shí)別問題中表現(xiàn)出許多特有的優(yōu)勢(shì)。脫機(jī)手寫體漢字識(shí)別屬于復(fù)雜高維模式識(shí)別問題,將SVM理論運(yùn)用于脫機(jī)手寫體漢字的識(shí)別有較大的理論意義和實(shí)踐價(jià)值。 論文所涉及到的主要內(nèi)容如下: (1)概論。闡述了脫機(jī)手寫體漢字識(shí)別研究的目的和意義,并對(duì)當(dāng)前在此研究領(lǐng)域內(nèi)存在的困難進(jìn)行了說明。通過漢字識(shí)別已往的研究歷程和現(xiàn)在的發(fā)展現(xiàn)狀總結(jié)了漢字識(shí)別的一般原理與方法。 (2)脫機(jī)手寫體漢字自動(dòng)錄入接口設(shè)計(jì)。設(shè)計(jì)了一個(gè)脫機(jī)手寫體漢字掃描過程自動(dòng)人機(jī)接口模型。利用TWAIN協(xié)議(計(jì)算機(jī)應(yīng)用程序與光柵圖像獲取設(shè)備標(biāo)準(zhǔn)通信協(xié)議),無(wú)須人為操作,應(yīng)用程序?qū)⒓堎|(zhì)文檔的手寫漢字信息按照人為設(shè)置要求自動(dòng)錄入計(jì)算機(jī)成規(guī)定格式便于后期預(yù)處理、特征提取和識(shí)別,從而提高了效率。 (3)脫機(jī)手寫體漢字樣本的收集及圖像預(yù)處理。采用設(shè)計(jì)專用表格的方式對(duì)年齡分布段為18~60歲的不同職業(yè)、性別、學(xué)歷的人的一般手寫字體進(jìn)行樣本收集。受人員和經(jīng)費(fèi)的限制,收集的漢字類別為GB2312-80一級(jí)字庫(kù)中的前50類漢字,每類漢字收集108個(gè)樣本。對(duì)收集的漢字樣本進(jìn)行灰度化、二值化,傾斜校正,表格標(biāo)記定位,漢字切分,歸一化處理形成樣本庫(kù)。 (4)特征提取。將網(wǎng)格方向特征作為手寫體漢字特征。闡述了4種彈性網(wǎng)格構(gòu)造方法,并對(duì)它們?cè)谖帐謱戵w漢字形變能力和算法性能方面作了分析和比較。對(duì)3種漢字方向分解法進(jìn)行闡述和分析,得出3種方法各自存在優(yōu)點(diǎn)與缺陷,適用于不同的應(yīng)用環(huán)境。經(jīng)綜合分析,本文選取基于點(diǎn)密度均衡的彈性網(wǎng)格構(gòu)造法與3種漢字方向分解法組成3種手寫體漢字特征(骨架特征、邊緣特征和筆畫特征),其中,本文針對(duì)AND分解和OR分解得出的相應(yīng)骨架特征的各自特點(diǎn),將骨架特征進(jìn)行了改進(jìn),融合了兩者優(yōu)點(diǎn),形成新的骨架特征。本文對(duì)這3種特征提取算法在時(shí)間復(fù)雜度和反映漢字筆畫準(zhǔn)確度方面給出了定性的比較分析。從實(shí)驗(yàn)結(jié)果可以看出這3種特征都能有效反映出手寫體漢字的特征。 (5)基于支持向量機(jī)的漢字識(shí)別。本文首次將上文所提的骨架特征、邊緣特征和筆畫特征用于支持向量機(jī)分類器,利用支持向量機(jī)理論通過對(duì)少量漢字樣本的學(xué)習(xí)獲得推廣性能良好的識(shí)別器。該方法在對(duì)每個(gè)漢字僅用幾十個(gè)樣本學(xué)習(xí)的情況下就能取得較好的識(shí)別效果。 本文研究對(duì)象為少量常用漢字,研究目標(biāo)是探索SVM理論在非特定人低限制手寫體漢字脫機(jī)識(shí)別的有效性。實(shí)驗(yàn)選取了國(guó)標(biāo)GB2312-80一級(jí)字庫(kù)中的前50個(gè)漢字,每個(gè)漢字108個(gè)樣本,共5400個(gè)漢字樣本,,采用LibSVM2.86分類器對(duì)樣本進(jìn)行訓(xùn)練和識(shí)別,實(shí)驗(yàn)取得了較好識(shí)別結(jié)果。

展開


  本文關(guān)鍵詞:脫機(jī)手寫體漢字識(shí)別研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):93312

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/93312.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b08ff***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com