天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

漢字細(xì)化算法的研究

發(fā)布時(shí)間:2020-03-14 04:24
【摘要】:隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,漢字識(shí)別技術(shù)也逐漸成熟,被應(yīng)用于許多領(lǐng)域,如信件的智能分揀、稿件校對(duì)、筆跡鑒定、文檔圖像處理等。而細(xì)化算法是漢字識(shí)別預(yù)處理中最重要的技術(shù)之一,也一直是脫機(jī)漢字識(shí)別的瓶頸,因此本文重點(diǎn)研究漢字的細(xì)化算法。本文在研究實(shí)現(xiàn)已有算法的基礎(chǔ)上,重點(diǎn)提出了若干改進(jìn)算法,論文主要工作如下。(1)研究了細(xì)化前對(duì)圖像的預(yù)處理,重點(diǎn)研究了基于縱橫向積分法和區(qū)域擴(kuò)張法兩種方法的字切分最小包圍盒算法。在縱橫向積分法中提出對(duì)積分曲線應(yīng)用小波變換進(jìn)行平滑處理,提高了列、字切分的準(zhǔn)確度。實(shí)驗(yàn)表明采用兩種方法較好地實(shí)現(xiàn)了字符切分。接著,研究了 Z-S細(xì)化算法,最大圓盤骨架提取算法、基于數(shù)學(xué)形態(tài)學(xué)的細(xì)化算法、基于索引表的細(xì)化算法以及A-W細(xì)化算法等,重點(diǎn)研究實(shí)現(xiàn)了這些算法并比較其優(yōu)缺點(diǎn)。(2)雖然A-W細(xì)化算法優(yōu)于上述其他方法的細(xì)化結(jié)果,但仍存在非單像素問(wèn)題、分叉點(diǎn)處畸變和毛刺等缺陷;卩徑泳仃嚨膯蜗袼鼗幚硭惴▽(duì)于筆畫(huà)撇、捺的處理效果不理想,而基于模板匹配的單像素化處理算法對(duì)筆畫(huà)撇、捺處理效果好,對(duì)交叉點(diǎn)處處理效果不佳,提出將這兩種方法結(jié)合起來(lái)的新方法CEADAR(Combination of template matching and adjacency matrix),消除了可能存在的兩像素寬的骨架,達(dá)到了良好效果;接著,針對(duì)A-W細(xì)化算法的不足,提出基于筆畫(huà)走向預(yù)測(cè)的A-W細(xì)化改進(jìn)算法,對(duì)于滿足A-W刪除條件的點(diǎn),判斷其筆畫(huà)走向并優(yōu)先保留橫、豎、撇、捺四個(gè)筆畫(huà)走向上的點(diǎn),實(shí)驗(yàn)結(jié)果表明此算法改善了交叉點(diǎn)處畸變的現(xiàn)象。(3)提出一種骨架畸變的矯正算法。檢測(cè)骨架上的特征點(diǎn),針對(duì)最大圓算法在筆畫(huà)連接后骨架會(huì)出現(xiàn)不平滑的現(xiàn)象,采用改進(jìn)的最大圓方法進(jìn)行分叉點(diǎn)合并以及局部筆畫(huà)的重新連接,提出結(jié)合漢字結(jié)構(gòu)知識(shí)規(guī)則來(lái)優(yōu)化局部筆畫(huà)的連接,可獲得更優(yōu)的效果。實(shí)驗(yàn)結(jié)果表明以上改進(jìn)算法得到的細(xì)化結(jié)果是單像素而且無(wú)毛刺和分叉點(diǎn)的,在書(shū)法字庫(kù)和宋體、楷體、黑體、隸書(shū)等數(shù)據(jù)集上均取得了良好的細(xì)化結(jié)果。
【圖文】:

字體,漢字


性思想與文化的交流和繼承,成為中華民族最宏偉的文化寶藏。與此同時(shí),經(jīng)過(guò)的發(fā)展與積淀,它具有了很多藝術(shù)特征和價(jià)值。黨的 十八大 提出 文化強(qiáng)國(guó) 的計(jì)算機(jī)來(lái)研究漢字藝術(shù)具有重要的價(jià)值和實(shí)際意義。現(xiàn)代電子科技技術(shù)的飛速發(fā)展,,引發(fā)人們 提筆忘字 的現(xiàn)象越來(lái)越嚴(yán)重。而《中寫(xiě)大會(huì)》《漢字英雄》等節(jié)目的熱播也進(jìn)一步說(shuō)明了人們對(duì)漢字文化的巨大需求技的發(fā)展,需要在智能設(shè)備中實(shí)現(xiàn)漢字的智能化識(shí)別。漢字的智能化識(shí)別正在成活中不可或缺的一種輸入方式,單純的鍵盤鼠標(biāo)輸入技術(shù)已經(jīng)不能滿足人們的離線字符識(shí)別依舊是難點(diǎn)和重點(diǎn)。在這些工作中,字體骨架的提取起到了至關(guān)重,其中,基于骨架相似性的字符檢索與識(shí)別[1]主要是利用提取的骨架的全局和局通過(guò)特征向量進(jìn)行相似度計(jì)算。但由于漢字本身具有的幾個(gè)特點(diǎn),使得漢字識(shí)別。(1) 漢字字體多樣漢字有很多種不同的字體,例如,常用的楷體、宋體、隸書(shū)、黑體,更不用法作品中各種風(fēng)格的字體都有可能出現(xiàn)。圖 1-1 展示了四種比較常見(jiàn)字體書(shū)寫(xiě)的字。可以看出,四種字形各具特色。

二值化閾值


圖像二值化的二值化處理實(shí)際上就是區(qū)分圖像中的 前景目標(biāo) 和 背景 ,從灰度最基本的方法就是基于圖像灰度分布的閾值方法[36]。閾值方法的核心。的選取是圖像二值化的關(guān)鍵,一個(gè)恰當(dāng)?shù)拈撝禃?huì)得到效果較好的二值大或太小,都會(huì)導(dǎo)致目標(biāo)信息的丟失,從而達(dá)不到分辨的效果。因此將圖像背景和目標(biāo)分離的關(guān)鍵,從圖像中獲得最大信息量。副灰度圖像中,用 表示圖像在像素點(diǎn) 處的灰度值,用 g (i , , 為二值圖像, 的取值范圍是 0~255,設(shè)選取的閾值是 T 1, ( , )0, ( , )f i j Tg i, jf i j T 不同的閾值得到的結(jié)果會(huì)相差很多,如圖 2-2 所示。當(dāng)選擇的閾值太全將背景過(guò)濾掉,導(dǎo)致目標(biāo)文字與背景不能區(qū)分開(kāi)。當(dāng)選擇的閾值太較深的部分目標(biāo)文字會(huì)被歸為背景,仍然不能將背景與目標(biāo)清晰的分息。這個(gè)例子中我們最終選擇了 T=200,效果如圖所示。
【學(xué)位授予單位】:西安理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李文杰;何家峰;;一種改進(jìn)的A-W細(xì)化算法[J];計(jì)算機(jī)工程;2012年06期

2 侯立斐;張靜;霍玲玲;;一種改進(jìn)的漢字骨架提取算法[J];微型機(jī)與應(yīng)用;2011年17期

3 廖志武;;2-D骨架提取算法研究進(jìn)展[J];四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年05期

4 俞凱;吳江琴;莊越挺;;基于骨架相似性的書(shū)法字檢索[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2009年06期

5 苗晉誠(chéng);;基于骨架化、骨架劃分獲取書(shū)法漢字結(jié)構(gòu)特征方法[J];昆明理工大學(xué)學(xué)報(bào)(理工版);2008年03期

6 唐瑤;張錫哲;王鉦旋;;一種中國(guó)書(shū)法作品的骨架提取算法[J];工程圖學(xué)學(xué)報(bào);2006年05期

7 王建平;錢自拓;王金玲;羅國(guó)軍;;基于數(shù)學(xué)形態(tài)學(xué)的圖像漢字筆劃細(xì)化和提取[J];合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年11期

8 趙春江,施文康,鄧勇;具有魯棒性的圖像骨架提取方法[J];計(jì)算機(jī)應(yīng)用;2005年06期

9 陳力,丁曉青;基于小波特征的單字符漢字字體識(shí)別[J];電子學(xué)報(bào);2004年02期

10 呂俊白;一種有效的二值圖像細(xì)化算法[J];計(jì)算機(jī)工程;2003年18期

相關(guān)會(huì)議論文 前1條

1 王燕妮;周明全;武仲科;敖雪峰;戴莉;周曼;;一種改進(jìn)的中國(guó)書(shū)法骨架提取算法[A];圖像圖形技術(shù)與應(yīng)用進(jìn)展——第三屆圖像圖形技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2008年

相關(guān)博士學(xué)位論文 前1條

1 俞凱;計(jì)算機(jī)書(shū)法若干關(guān)鍵技術(shù)研究[D];浙江大學(xué);2010年

相關(guān)碩士學(xué)位論文 前2條

1 張靜;骨架提取算法研究與應(yīng)用[D];遼寧師范大學(xué);2012年

2 趙琪;書(shū)法碑帖文字的筆劃提取技術(shù)及其實(shí)現(xiàn)[D];華東師范大學(xué);2010年



本文編號(hào):2586902

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2586902.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶357d4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com