天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

藏文印刷體識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2020-03-31 08:30
【摘要】:英、漢文字識(shí)別研究較早,經(jīng)過(guò)許多學(xué)者的不懈努力,中英文識(shí)別在技術(shù)方面累積了豐富的成果,并開(kāi)發(fā)出許多商業(yè)化產(chǎn)品,識(shí)別率達(dá)到了99%以上。藏文識(shí)別方面由于藏文信息化建設(shè)較晚,直到信息化高速發(fā)展的今天,還處于起步階段。而且藏文與中英文存在很大的差異,不能完全借鑒中英文識(shí)別中的成熟技術(shù),需要依據(jù)藏文自身的特點(diǎn),研究和設(shè)計(jì)出適合藏文的識(shí)別系統(tǒng)。藏文是一種非常古老的文字,記載著藏民族獨(dú)有的文化,是全世界文化寶庫(kù)中的重要組成部分。隨著信息化時(shí)代的到來(lái),為了讓藏文能更有效地進(jìn)行傳播、查閱和交換,必須用數(shù)字化方式來(lái)整理和保存。所以藏文識(shí)別技術(shù)是解決這一問(wèn)題的一種理想而有效的手段,可減少大量人力和財(cái)力的投入,而且藏文識(shí)別技術(shù)的發(fā)展,能推進(jìn)民族文化、教育、經(jīng)濟(jì)的發(fā)展。具有非常重要的意義。根據(jù)上述問(wèn)題,本課題深入研究了文字識(shí)別系統(tǒng)中的關(guān)鍵技術(shù)以及藏文字符的結(jié)構(gòu)特征。重點(diǎn)研究?jī)?nèi)容放在藏文字丁的切分和分類(lèi)識(shí)別上。提出了基于多策略的細(xì)化切分方法和基于二級(jí)分類(lèi)器的識(shí)別方法。完成的主要工作具體如下:1.圖像預(yù)處理。將圖像預(yù)處理過(guò)程分為圖像灰度化、二值化、除噪、傾斜矯正四個(gè)步驟。其主要目的就是盡可能地去除印刷體藏文文檔圖像的無(wú)用信息,使圖像中的文字信息更容易檢測(cè)。本系統(tǒng)圖像預(yù)處理過(guò)程主要采用文字識(shí)別系統(tǒng)中常用的預(yù)處理方式,并取得了較好的效果。2.印刷體藏文文檔圖像中藏文字丁的切分。藏文字丁的切分過(guò)程分為行切分和字丁切分。首先將圖像中的每個(gè)文本行切分出來(lái),然后把每行中的藏文字丁切分出來(lái)。由于藏文字丁寬高不等,圖像中會(huì)出現(xiàn)不同程度的重疊粘連問(wèn)題。針對(duì)該問(wèn)題提出了基于多策略的細(xì)化切分方法,對(duì)重疊粘連段該方法具有較好的切分效果。3.特征提取。特征提取對(duì)于印刷體藏文識(shí)別系統(tǒng)來(lái)說(shuō)是一個(gè)非常重要的步驟,是實(shí)現(xiàn)文字識(shí)別的核心及難點(diǎn)。其主要目的就是提取出反映藏文字丁本質(zhì)的特征序列,通過(guò)已提取的特征序列使計(jì)算機(jī)具備識(shí)別藏文文本的能力。根據(jù)藏文字符的字形和結(jié)構(gòu)特征,提出了一種藏文字符混合特征的提取方法,其特征主要包括基線特征、封閉區(qū)域數(shù)特征和粗網(wǎng)格特征。4.分類(lèi)識(shí)別。提取特征后,下一步就是與特征庫(kù)進(jìn)行分類(lèi)匹配,最終達(dá)到識(shí)別效果。在識(shí)別過(guò)程中分類(lèi)器的設(shè)計(jì)是很關(guān)鍵的問(wèn)題。分類(lèi)器的好壞直接影響識(shí)別的準(zhǔn)確率。所以設(shè)計(jì)了基于藏文混合特征的二級(jí)分類(lèi)器。該分類(lèi)器可以彌補(bǔ)小維度特征和大維度特征之間的缺陷,在識(shí)別過(guò)程中提高了速度和精確度。最后通過(guò)實(shí)驗(yàn)測(cè)試,本課題開(kāi)發(fā)的印刷體藏文識(shí)別系統(tǒng)具有較好的識(shí)別效果,識(shí)別率達(dá)到了83.24%,但與此同時(shí),還有一些模塊功能需要進(jìn)一步完善和提高。
【圖文】:

直方圖,文字,直方圖,閾值


文字灰度直方圖有兩個(gè)明顯的波峰,分別表示圖像中的文字和背景部分,此時(shí)可以將波谷處的像素值作為閾值。圖2-1 文字直方圖如果圖像質(zhì)量差,有噪點(diǎn)等其他干擾因素的情況下,該方法獲取閾值比較困難。(3) 迭代閾值設(shè)定實(shí)現(xiàn)迭代閾值設(shè)定的基本步驟就是,,首先,通過(guò)人工設(shè)定閾值或灰度直方圖設(shè)定閾值的方法確定初始化閾值Tx,然后根據(jù)Tx對(duì)圖像進(jìn)行二值化,將圖像區(qū)域分為文字部分和背景部分,再分別求出這兩個(gè)部分的平均值,并將兩個(gè)值的均值作為新閾值Tx+1,通過(guò)閾值Tx+1對(duì)圖像進(jìn)行二值化,依次反復(fù)迭代,當(dāng)閾值之間進(jìn)行對(duì)比無(wú)變化時(shí),結(jié)束迭代,得到最終的閾值。具體的算法流程圖如圖2-2所示。開(kāi)始初始化閾值TX用TX對(duì)圖像二值化求出文字、背景像素支均值H1和H2新閾值TX+1=(H1+H2)/2TX+1==TXTX=TX+1NY結(jié)束圖2-2 迭代閾值設(shè)定方法

藏文,圖片,文檔圖像,對(duì)偶性


藏文傾斜圖片
【學(xué)位授予單位】:青海民族大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:H214;TP391.41

【參考文獻(xiàn)】

相關(guān)期刊論文 前9條

1 周緯;陳良育;曾振柄;;基于幾何形狀分析的藏文字符識(shí)別[J];計(jì)算機(jī)工程與應(yīng)用;2012年18期

2 李永忠;王玉雷;劉真真;;藏文印刷體字符識(shí)別技術(shù)研究[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年01期

3 梁瑩;肖健;李s

本文編號(hào):2608832


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/yuyanyishu/2608832.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)7962c***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com