OCR技術(shù)研究進(jìn)展及前瞻
1、概述
OCR (Optical Character Recognition),即光學(xué)字符識(shí)別,是指 電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過程即對(duì)文本資料進(jìn)行掃描,然后對(duì)圖像文件進(jìn)行分析處理,獲取文字及版面信息的過程。
隨著計(jì)算機(jī)網(wǎng)絡(luò)飛速發(fā)展信息電子化已經(jīng)成為個(gè)時(shí)代必然趨勢。文字作為信息中最重要、最集中的載體,其電子化進(jìn)程顯得尤為重要。而OCR技術(shù)則是文字電子化過程中最重要的環(huán)節(jié),它改變了傳統(tǒng)的紙質(zhì)介質(zhì)資料輸入的概念。比如,通過OCR技術(shù).用戶可以將通過攝像機(jī)、掃描儀等光學(xué)輸入方式得到的報(bào)刊‘書籍、文稿、表格等印刷品的圖像信息轉(zhuǎn)化為可以供計(jì)算機(jī)識(shí)別和處理的文本信息。因此與傳統(tǒng)的手工錄入方式相比OCR技術(shù)大大提高了人們進(jìn)行資料存儲(chǔ).檢索.加工的效率。目前市場上符合銀行、證券、保險(xiǎn).稅務(wù)、公安.海關(guān)、機(jī)場、工商、軍隊(duì)及其它行業(yè)應(yīng)用的OCR產(chǎn)品已經(jīng)相對(duì)成熟,它們已經(jīng)通過市場檢驗(yàn)并被廣大用戶大規(guī)模使用11-4J。
2、OCR技術(shù)的起源及發(fā)展
OCR的起源最早追溯到1929年德國的科學(xué)家Taushcck獲得了 光學(xué)字符識(shí)別技術(shù)專利間,但是對(duì)于當(dāng)時(shí)的科技發(fā)展情況而言,一切僅僅是個(gè)設(shè)想『直到計(jì)算機(jī)的誕生才使得這種設(shè)想成為現(xiàn)實(shí)。經(jīng)過近百年的發(fā)展OCR已經(jīng)成為當(dāng)今模式識(shí)別領(lǐng)域中最活躍的分支之一。它綜合了數(shù)字圖像處理、計(jì)算機(jī)圖形學(xué)及人工智能等多方面的理論知識(shí)并在計(jì)算機(jī)及其相關(guān)領(lǐng)域中得到了相當(dāng)廣泛的應(yīng)用。近幾年來,它同語音識(shí)別、行為識(shí)到等一起曰益成為人們研究及關(guān)注的焦點(diǎn)。
在二十世紀(jì)六七十年代,世界各國就已經(jīng)展開了光學(xué)字符識(shí)別研究,如我們的鄰國日本,在六十年代中期就有了郵政編碼識(shí)別系統(tǒng)的產(chǎn)品問世,該系統(tǒng)能夠識(shí)別郵件上的郵政編碼,幫助郵局進(jìn)行區(qū)域分信作業(yè),這也使得郵政編碼一直沿用至今,6,隨后,經(jīng)過科研學(xué)者的努力,日本的三洋,筆耕論文,富士,理光,松下等知名公司也相繼有字符識(shí)§lIJ系統(tǒng)的產(chǎn)品面世。
我國的光學(xué)字符識(shí)別研究相對(duì)國外起步較晚!但是發(fā)展十分迅速。從早期簡單的單體識(shí)別發(fā)展到多種字體混合排列的多體識(shí)別,從中文印刷材料的識(shí)別發(fā)展到中英文混排印刷材料的雙語言識(shí)別,目前各個(gè)系統(tǒng)都可以支持筒、繁體漢字的識(shí)別,也有同時(shí)支持中,英,韓等多國文字的識(shí)別系統(tǒng),它們解決了多體多字號(hào)混排文本的識(shí)別問題,對(duì)于簡單的版面可以進(jìn)行效的定量分析,同時(shí)漢字識(shí)別率已經(jīng)可以達(dá)到98%以上。
推薦閱讀:《計(jì)算機(jī)研究與發(fā)展》
3、OCR技術(shù)的應(yīng)用
國外的OCR技術(shù)應(yīng)用相對(duì)成熟,包括IBM、Motor口怡、HP和Microsoft等世界型大公司都陸續(xù)展開了這方面的研究,在他們的產(chǎn) 品中綁定OCR技術(shù)。光符識(shí)別設(shè)備把報(bào)紙、雜志和其它印刷材料上的印刷字符讀取到計(jì)算機(jī)內(nèi)存。OCR軟件可以和任何流行的操作系統(tǒng)一起使用。除了識(shí)別印刷字符之外OCR也可能識(shí)別欄目布局,這種布局會(huì)在報(bào)紙中出現(xiàn)。例如,微軟公司最新推出的辦公套件一一州icrosoft Office XP中不僅加強(qiáng)了原有對(duì)手寫輸入的支持,還新增加了光學(xué)字符識(shí)別(OCR)的工具組件。字符識(shí)別產(chǎn)品的廣泛應(yīng)用推動(dòng)了模式識(shí)別等相關(guān)理論的發(fā)展,促進(jìn)了計(jì)算機(jī)應(yīng)用的普及。2008竿, Google也宣布它將開始在網(wǎng)絡(luò)蜘蛛中使用OCR技術(shù),這樣就可以識(shí)別許多非格式化文本和圖像并將其索引到數(shù)據(jù)庫。
如今OCR技術(shù)在我國的應(yīng)用也極為廣泛,可以說有漢字的地方就有OCR技術(shù)應(yīng)用的存在。在信息技術(shù)及計(jì)算機(jī)技術(shù)日益普及的今天,如何將文字方便、快捷地輸入到計(jì)算機(jī)中已經(jīng)成為影響人機(jī)接口效率的一個(gè)重要難題,也關(guān)系到計(jì)算機(jī)是否能夠真正在我國得到普及和應(yīng)用。
漢字輸入主要分為人工鍵盤輸入和機(jī)器自動(dòng)識(shí)別輸入兩種c其中人工鍵入速度慢而且勞動(dòng)強(qiáng)度大,自動(dòng)輸入又分為漢字識(shí)別輸入及語音識(shí)別輸入。從識(shí)另IJ技術(shù)的難度來說,手寫體識(shí)別的難度高于印刷體識(shí)別,而在手寫體識(shí)別中,脫機(jī)手寫體的難度又遠(yuǎn)遠(yuǎn)超過聯(lián)機(jī)手寫體識(shí)別。歪IJ目前為止,除了脫機(jī)手寫體數(shù)字的識(shí)別已有實(shí)際應(yīng)用外,漢字等文字的脫機(jī)手寫體識(shí)別還處在實(shí)驗(yàn)室階段。簡單來說,從影像到結(jié)果輸出,須經(jīng)過影像輸入、影像前處理、文字特征抽取、~t對(duì)識(shí)別、最后經(jīng)人工校正將認(rèn)錯(cuò)的文字更正,將結(jié)果輸出等環(huán)節(jié)的過程。
隨著我國信息化建設(shè)全面普及OCR技術(shù)的應(yīng)用前景將更加地廣闊。就目前從行業(yè)需求來看,金融、保險(xiǎn)、稅務(wù)、工商‘電子商務(wù)等行業(yè)對(duì)信息識(shí)別的需求已經(jīng)越來越廣泛,促進(jìn)了識(shí)別技術(shù)的大規(guī)模應(yīng)用。而個(gè)人消費(fèi)者對(duì)資料電子化、手寫識(shí)別技術(shù)等各方面需求則拓展了OCR識(shí)另IJ技術(shù)在這一領(lǐng)域的應(yīng)用之路,另一方面,網(wǎng)絡(luò)時(shí)代的高速發(fā)展使個(gè)人資料電子化、商務(wù)辦公自動(dòng)化等需求的呼聲也變得越來越高。
本文編號(hào):6149
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/6149.html