天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 論文百科 > 研究生論文 >

基于Linux平臺(tái)的圖片文字識(shí)別系統(tǒng)

發(fā)布時(shí)間:2016-08-04 09:56

第 1 章 緒論

1.1 研究背景及意義
圖片文字識(shí)別(OCR),應(yīng)用場景非常廣泛[1]。隨著信息時(shí)代的來臨,各種知識(shí)、書籍、檔案等都面臨著數(shù)字化的需求。而圖片存儲(chǔ)是個(gè)笨重的途徑,而且占用空間巨大,并且不方便查找等操作。因此以文檔方式存儲(chǔ)就面臨著巨大的錄入工作。這項(xiàng)工程當(dāng)然要使用計(jì)算機(jī)的幫助,這就是 OCR 的典型應(yīng)用了。市面上流行的各種掃描儀幾乎都會(huì)附帶著 OCR 識(shí)別程序。OCR 程序廣泛使用于印刷、打印等行業(yè)[2]。是這些行業(yè)支柱軟件。簡單的 OCR 識(shí)別應(yīng)用例如車牌號(hào)碼的識(shí)別,可以省去大量的人力、物力。車牌號(hào)碼的識(shí)別由于識(shí)別內(nèi)容相對(duì)固定,識(shí)別準(zhǔn)確率會(huì)高一些。復(fù)雜的例如對(duì)圖形、圖表混編的復(fù)雜版面識(shí)別,對(duì)各種報(bào)表的識(shí)別。如應(yīng)用在工商行業(yè)、數(shù)據(jù)分析等行業(yè)。OCR 應(yīng)用對(duì)古籍的保護(hù)和推廣也具有重大意義。OCR最廣泛的還是應(yīng)用于印刷體文字的識(shí)別,對(duì)手寫文字的識(shí)別相對(duì)更困難一些,常見的對(duì)手寫體識(shí)別是手機(jī)手寫輸入。這些應(yīng)用只占一小部分,但是卻極大的改善了人們的日常生活。在未來如果 OCR 程序的識(shí)別率達(dá)到一個(gè)可接受的范圍,可以替代手工輸入,將給錄入工作帶來革命性的跨越。比較有名的開源 OCR 程序有 Tesseract、Gocr 等程序,Tesseract 最先由 HP公司開發(fā),后經(jīng) Google 改進(jìn)優(yōu)化,是比較優(yōu)秀的開源 OCR 程序[3]。 Gocr 是由Joerg Schulenburg 等人開發(fā)的開源 OCR 程序,該程序不能夠識(shí)別漢字,識(shí)別英文的效果比較好[4]。國外的程序普遍對(duì)漢字的識(shí)別效果不佳。國內(nèi) OCR 做的比較好的程序有清華文通、漢王、尚書等。OCR 文字識(shí)別是一個(gè)復(fù)雜的系統(tǒng),最直接表現(xiàn)為識(shí)別率是否能夠可用,可用的標(biāo)準(zhǔn)是識(shí)別率。如果一個(gè)差的識(shí)別率,用起來倒給使用者增添煩惱,比如 DNA 圖片序列的識(shí)別,如果識(shí)別不準(zhǔn)確,想人工去校正將是一個(gè)痛苦的工作。而本身 DNA 序列是不能容忍錯(cuò)誤的。
...........

1.2 文字識(shí)別現(xiàn)狀
當(dāng)前的文字識(shí)別系統(tǒng)已經(jīng)取得了不錯(cuò)的成績,尤其是對(duì)英文的識(shí)別,但是漢字的識(shí)別仍然是具有難度和挑戰(zhàn)的[5]。使用上面提到的文字識(shí)別,也會(huì)經(jīng)常發(fā)現(xiàn)有識(shí)別不出來的文字,或者識(shí)別錯(cuò)誤的情況?梢哉f現(xiàn)在的圖片文字識(shí)別還處于一個(gè)發(fā)展階段,文字識(shí)別的關(guān)鍵點(diǎn)還是看怎樣去掃描出文字的特征碼來。當(dāng)前有以下幾種文字特征碼掃描方法[6]。關(guān)鍵背景法是在文字的背景上選擇兩個(gè)關(guān)鍵點(diǎn),分別從關(guān)鍵點(diǎn)出發(fā)對(duì)上下左右引出射線,分別記錄和文字的交叉次數(shù),然后這些交叉次數(shù)作為該文字的特征碼,很明顯該算法的關(guān)鍵點(diǎn)的尋找不是一件容易的事情。并且文字的一些為了美觀的小勾小叉等將影響算法的準(zhǔn)確性。模板匹配法是將每一個(gè)文字的標(biāo)準(zhǔn)圖片存儲(chǔ)起來,當(dāng)需要進(jìn)行識(shí)別時(shí),將待識(shí)別的文字和模板進(jìn)行匹配,找出像素重合最多的模板。該方法運(yùn)算量大,圖片存儲(chǔ)耗費(fèi)巨大,,查詢速度慢,是一種比較被動(dòng)的方法;诮y(tǒng)計(jì)特征的粗分類包含了幾個(gè)小的子方法,例如漢字復(fù)雜指數(shù)法,將漢字的復(fù)雜性作為一個(gè)特征來進(jìn)行統(tǒng)計(jì),還有四邊碼法,只統(tǒng)計(jì)漢字的左上、右上、左下、右下四個(gè)區(qū)域的像素多少,將像素的多少再設(shè)定個(gè)等級(jí)來編碼。該方法嚴(yán)重依賴于漢字的大小。還有粗外圍特征,只掃描漢字的外圍特征,還有粗網(wǎng)格特征,統(tǒng)計(jì)漢字落在網(wǎng)格里面的像素然后編碼。
.........

第 2 章 系統(tǒng)相關(guān)技術(shù)概述

2.1 Opencv
Opencv 是一個(gè)開源的圖形圖像處理庫,使用 C/C++語言編寫而成的。Opencv包含了大約 500 多個(gè)函數(shù),基本上覆蓋了基本的圖形圖像處理函數(shù)[7]。該庫還可以和 Intel 的 IPP(Integrated Performance Primitives)高性能多媒體函數(shù)庫自動(dòng)對(duì)接,但是 IPP 是需要購買的[8]。由于 Opencv 采用了開源的協(xié)議,許多公司例如 IBM、Google、Microsoft 等知名公司都在使用該庫[9]。而且 Opencv 在全世界都有龐大的用戶群體。由于互聯(lián)網(wǎng)的推動(dòng)也使 Opencv 越來越成熟高效。Opencv 包含了 5 大模塊,涵蓋了圖形圖像基本處理、繪圖、統(tǒng)計(jì)以及視頻流的處理和機(jī)器學(xué)習(xí)相關(guān)內(nèi)容?芍^內(nèi)容豐富,功能強(qiáng)大。CXCORE 提供了基本數(shù)據(jù)結(jié)構(gòu)、基本數(shù)學(xué)計(jì)算功能、以及內(nèi)存分配釋放管理等。ML 包含了機(jī)器學(xué)習(xí)中用到的聚類分析、數(shù)據(jù)分析等。High GUI 主要處理圖片、視頻的基本輸入輸出等。MLL 庫主要存放了統(tǒng)計(jì)方面的工具[10]。本文使用的基本上是 CV 模塊中的圖形處理。CV 庫包含了常見的圖形圖像處理函數(shù),平滑處理、漫水填充、尺寸調(diào)整、閥值化等基本處理,還有圖像變換如拉普拉斯變換、Canny 算子、霍夫曼變換等等[11]。
..........

2.2 像素關(guān)系
總所周知圖像是由屏幕上一個(gè)個(gè)像素點(diǎn)組成的,根據(jù)這些像素點(diǎn)的位置可以粗略的將兩個(gè)像素定義為相鄰或者不相鄰。一個(gè)像素 p(x,y)的鄰接點(diǎn)有 4 鄰接、8 鄰接、還有 M 鄰接[15]。在文字細(xì)化等模塊都使用的 8 鄰接關(guān)系。根據(jù) 8 鄰居可以定義出 8 個(gè)方向來。如下圖所示,P1 分別在 8 個(gè)方向上存在 8 個(gè)鄰接點(diǎn)。鄰接點(diǎn)的判定是根據(jù)兩個(gè)要素:1,如下圖中的像素位置;2,是像素的值是否在一個(gè)范圍里面。例如在二值化圖像中,0 表示黑,1 表示白。那么如果像素值相同并且位置相鄰那么它們就是連通的。當(dāng)文字經(jīng)過細(xì)化后,文字只剩下了一個(gè)像素的骨架。在遍歷該骨架是就是需要根據(jù)連通域來遍歷。在遍歷下一個(gè)鄰域節(jié)點(diǎn)就有 8 個(gè)方向可供選擇。UTF-8(8-bit Unicode Transformation Format)編碼是 Unicode 的一種編碼方式。它是存儲(chǔ)可變長的一種編碼。為實(shí)現(xiàn)全球統(tǒng)一編碼而產(chǎn)生,也叫萬國碼[16]。它使用 1-6 個(gè)字節(jié)來存儲(chǔ)一個(gè)字符編碼。我們熟知的 ASCII 編碼已經(jīng)普遍使用了,為了兼容 ASCII 碼,UTF-8 也使用一個(gè)字節(jié)來存儲(chǔ) ASCII,并且字節(jié)的最高位也置為 0。
...........

第 3 章 圖片文字識(shí)別系統(tǒng)分析與設(shè)計(jì)....12
3.1 系統(tǒng)需求分析........12
3.1.1 功能分析........ 12
3.1.2 用例分析........ 13
3.1.3 Word_OCR 識(shí)別時(shí)序圖.....14
3.1.4 流程控制分析......... 15
3.2 系統(tǒng)總體結(jié)構(gòu)設(shè)計(jì).........16
第 4 章 圖片文字識(shí)別..... 18
4.1 輸入輸出模塊........18
4.2 圖片預(yù)處理模塊....19
4.3 特征碼掃描............32
4.3.1 文字細(xì)化........ 32
4.3.2 連通域數(shù)字化......... 33
4.3.3 線段直線化.... 38
4.3.4 計(jì)算特征碼.... 40
4.4 數(shù)據(jù)庫操作............40
4.5 學(xué)習(xí)訓(xùn)練模塊........42
第 5 章 系統(tǒng)測(cè)試與分析.......... 43
5.1 系統(tǒng)測(cè)試.......43
5.2 學(xué)習(xí)訓(xùn)練測(cè)試........46

第 5 章 系統(tǒng)測(cè)試與分析

5.1 系統(tǒng)測(cè)試

系統(tǒng)測(cè)試包括對(duì)單模塊的測(cè)試,以及對(duì)系統(tǒng)的整體測(cè)試[30],Word_OCR 大模塊分為正常的識(shí)別業(yè)務(wù),和學(xué)習(xí)訓(xùn)練模塊。兩者其實(shí)是由關(guān)聯(lián)的,識(shí)別業(yè)務(wù)是使用數(shù)據(jù)庫,學(xué)習(xí)訓(xùn)練是擴(kuò)大數(shù)據(jù)庫,和增加數(shù)據(jù)庫、檢驗(yàn)數(shù)據(jù)庫。而正常識(shí)別業(yè)務(wù)的大步驟包含了圖片預(yù)處理模塊,和圖片特征碼掃描查詢模塊。下面分別對(duì)以上提及的兩大業(yè)務(wù)和兩小模塊進(jìn)行測(cè)試。圖 5.1 是在夜間拍攝的,整個(gè)圖片發(fā)暗。二值化后的圖片和校正之后的圖片如圖 5.2 所示。我們看到圖片 5.2 文字稍顯不清楚,應(yīng)該是二值化閥值參數(shù)選擇的不夠理想,二值化參數(shù)應(yīng)該加入更多的規(guī)則以尋求更好的效果。盡量減小圖像特征的損失。如果人來看都發(fā)現(xiàn)有筆畫缺失的化,那識(shí)別效果一定不會(huì)好的。因此二值化等這些關(guān)鍵步驟很重要。從圖 5.3 看到我們定位行應(yīng)該還是比較準(zhǔn)確的。圖片在一定程度上存在彎曲,我們看到圖片的一行不是很直,這會(huì)在文字識(shí)別的時(shí)候判斷文字位置存在問題。這種彎曲主要還是校正圖片處出現(xiàn)的,因此一個(gè)比較正的原圖片會(huì)增加識(shí)別的準(zhǔn)確性的。

基于Linux平臺(tái)的圖片文字識(shí)別系統(tǒng)

...........

總結(jié)

圖片文字識(shí)別OCR軟件應(yīng)用廣泛,打造一個(gè)算法優(yōu)異、識(shí)別率高、并且可靠的OCR軟件是很有應(yīng)用前景的。該軟件能直接明顯的解放手動(dòng)輸入的工作,是立竿見影式的工具。由于當(dāng)前的文字識(shí)別率還有很大的提升空間。當(dāng)前的OCR軟件只能輔助而不能另人們放心的去使用。這也是文字圖片識(shí)別還處于不成熟的階段。本文并未選擇流行的文字特征掃描算法。而是獨(dú)立自主的去探索一種基于文字幾何特征去深入文字內(nèi)部來獲取文字特征編碼。這樣的編碼的唯一性非常高。并且可重入性也非常高。雖然該方法復(fù)雜,但是卻類似人類來識(shí)別文字的過程。大方向是正確的。如果容錯(cuò)率再提高的化,準(zhǔn)確率應(yīng)當(dāng)是很可觀的。本文的所做的主要工作如下:
1. 分析了當(dāng)前OCR軟件流行算法,了解了當(dāng)前該領(lǐng)域的現(xiàn)狀。以及介紹了圖片操作的Opencv庫,和圖像圖片的基本知識(shí)。
2. 完成了word_OCR系統(tǒng)的需求分析,并從需求中分析中出了系統(tǒng)用例、系統(tǒng)時(shí)序圖、模塊圖、以及總體的架構(gòu)。
3. 完成了圖片的預(yù)處理的一系列操作,并且演示效果明顯。從輸入文字圖片開始,經(jīng)歷了放大圖片,轉(zhuǎn)換灰度圖片、二值化圖片、校正圖片,行列查找等。仔細(xì)分析了個(gè)階段和步驟,在二值化中能夠自動(dòng)尋找最佳的閥值點(diǎn)。能夠自動(dòng)的校正圖片。
.........
參考文獻(xiàn)(略)




本文編號(hào):84516

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenshubaike/lwfw/84516.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2d207***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
91熟女大屁股偷偷对白| 午夜久久久精品国产精品| 99久久国产精品亚洲| 日韩一级毛一欧美一级乱| 国产真人无遮挡免费视频一区| 五月天丁香亚洲综合网| 欧美国产极品一区二区| 日本特黄特色大片免费观看 | 日韩在线视频精品视频| 国产精品夜色一区二区三区不卡| 国产日本欧美韩国在线| 国产成人一区二区三区久久 | 无套内射美女视频免费在线观看 | 日韩综合国产欧美一区| 欧美黑人暴力猛交精品| 国产专区亚洲专区久久| 欧美成人国产精品高清| 熟女乱一区二区三区丝袜| 美女露小粉嫩91精品久久久| 色婷婷在线视频免费播放| 亚洲一区二区三区四区| 国产乱人伦精品一区二区三区四区| 自拍偷女厕所拍偷区亚洲综合| 亚洲中文字幕视频在线观看| 国产精品一区日韩欧美| 人妻巨大乳一二三区麻豆| 亚洲精品偷拍视频免费观看| 青青操视频在线观看国产 | 国产精品香蕉免费手机视频| 99热九九热这里只有精品| 国产午夜福利在线免费观看| 99久久免费看国产精品| 男人操女人下面国产剧情| 日韩偷拍精品一区二区三区| 五月婷婷缴情七月丁香| 热情的邻居在线中文字幕| 国产精品香蕉在线的人| 国产精品免费精品一区二区| 亚洲国产av国产av| 欧美加勒比一区二区三区| 亚洲伦片免费偷拍一区|