基于中亞多文種文檔圖像的文種識別技術(shù)研究
本文選題:文種識別 + 特征提取; 參考:《新疆大學》2017年碩士論文
【摘要】:全球各地目前使用很多種相似的文種。近年來,數(shù)字文件處理在辦公和圖書館自動化、銀行和郵政業(yè)務、出版社和通信管理等領(lǐng)域的應用中日益普及。對于能夠搜索多語言信息的書面和口頭來源工具的需求大大增加,。多文種OCR識別系統(tǒng)的開發(fā)已成為亟待解決的問題。在實現(xiàn)多文種OCR系統(tǒng)之前,需要研究多文種文檔圖像的文種識別,并需供給OCR系統(tǒng)。同時相似文種的識別是模式識別領(lǐng)域內(nèi)難點。本文主要研究是基于多特征提取的多文種文檔圖像的文種識別技術(shù)。本文主要突出的貢獻如下:(1)首先為了驗證本算法的有效性和穩(wěn)定性,建立了不同分辨率的三個多文種文本文檔圖像數(shù)據(jù)庫,分別有1600幅,2200副(分辨率100dpi)和2200副(分辨率200dpi)純文本整篇文檔圖像,包含英,漢,俄,蒙,阿拉伯,藏,維吾爾,土耳其,吉爾吉斯,塔吉克斯和哈薩克斯等共11個文種。(2)實現(xiàn)了基于HSV特征提取與利用BP分類器的多文種文本文檔圖像的文種識別系統(tǒng)。(3)提取了Tamura特征和由六個特征參數(shù)值構(gòu)成的紋理特征。并且這些特征利用不同的6個分類器進行分類,最后統(tǒng)計識別結(jié)果。(4)提出特征加權(quán)融合方法并提取融合的紋理特征,確定了適合中亞多文種文本文檔圖像文種識別的最佳權(quán)值。(5)提取了Hu不變矩特征,并利用貝葉斯,歐氏距離,馬氏距離和LDA等分類器進行分類識別。(6)最后,提出Hu不變矩特征、Tamura特征與紋理特征進行融合的識別方法,獲得了較好的識別結(jié)果。以建立的三個數(shù)據(jù)庫基礎(chǔ)上獲得的最高平均識別率分別為99.38%,95.69%和98.64%。實驗結(jié)果表明,本文提出的特征能較好的描述文檔圖像特征,并且它們能夠有效的分類識別以上所述的11個文種。尤其是對于中亞相似文種和我國少數(shù)民族文種的文本文檔圖像分類識別方面具有一定的優(yōu)越性和穩(wěn)定性。
[Abstract]:In recent years, digital file processing has become increasingly popular in applications in the fields of office and library automation, banking and postal services, publishing houses and communication management. The demand for written and oral source tools for searching multilingual information has increased greatly. Multi language OCR identification system Development has become a problem to be solved urgently. Before realizing the multi language OCR system, we need to study the identification of multi language document images and supply the OCR system. At the same time, the identification of similar language is the difficult point in the field of pattern recognition. This paper is mainly a study on the recognition technology of multi language document image based on multi feature extraction. The main outstanding contributions are as follows: (1) first of all, in order to verify the effectiveness and stability of the algorithm, three multitext text document image databases with different resolution are established, including 1600, 2200 pairs (resolution 100dpi) and 2200 pairs (resolution 200dpi), the whole text document images, including English, Han, Russian, Mongolian, Arabia, Tibet, Uygur, and soil 11 languages such as ear, Kyrgyz, tajikis and kazakx. (2) a text recognition system for text document images based on HSV feature extraction and BP classifier is realized. (3) the features of Tamura and the texture features made up of six characteristic parameters are extracted, and these features are divided by 6 different classifiers. Class and final statistical identification results. (4) a feature weighted fusion method is proposed and the fused texture features are extracted. The best weight suitable for the recognition of the text document image is determined. (5) the Hu invariant moment features are extracted and classified by Bayes, Euclidean distance, martensitic distance and LDA classification. (6) finally, Hu The feature of invariant moment, the recognition method of Tamura feature and texture feature fusion, obtained better recognition results. The highest average recognition rate obtained on the basis of the three databases is 99.38%, 95.69% and 98.64%. show that the features presented in this paper can describe the feature of the document image well, and they can have the recognition. The effective classification identifies the 11 languages mentioned above, especially for the classification and recognition of the text document image of the similar Central Asian and the ethnic minority languages in China.
【學位授予單位】:新疆大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.41
【參考文獻】
相關(guān)期刊論文 前10條
1 童莉;周林;平西建;徐森;;基于高斯衍生濾波器組的文種識別算法[J];數(shù)據(jù)采集與處理;2014年05期
2 王剛;靳彥青;劉立柱;儲瑞來;;基于多特征融合的東亞文種識別[J];計算機科學;2013年01期
3 顧立娟;劉才斌;吳勇;郝玉保;;基于多小波變換的文本圖像文種識別[J];電子設(shè)計工程;2011年15期
4 郭龍;平西建;周林;;基于文字筆畫方向直方圖的文本圖像文種識別[J];信息工程大學學報;2011年02期
5 顧立娟;邵命山;郝玉保;;基于可控金字塔子帶能量特征的文種識別方法[J];計算機應用與軟件;2011年03期
6 郭龍;平西建;周林;童莉;;基本圖像特征用于文本圖像文種識別[J];應用科學學報;2011年01期
7 郭海;趙晶瑩;韋宗偉;;一種采用小波包分析及RBFN的民族文種識別方法[J];計算機工程與科學;2010年08期
8 顧立娟;平西建;程娟;郝玉保;;一種具有旋轉(zhuǎn)魯棒性的文本圖像文種識別方法[J];中國圖象圖形學報;2010年06期
9 鄒剛;孫即祥;敖永紅;姚偉;;證據(jù)加權(quán)融合的多尺度形態(tài)學細胞邊緣檢測[J];計算機工程與應用;2010年12期
10 郭海;趙晶瑩;;基于小波分析及改進二次鑒別函數(shù)的民族文種識別[J];計算機應用;2009年12期
相關(guān)碩士學位論文 前5條
1 范曄斐;蒙漢英混排文檔圖像的文種識別研究[D];內(nèi)蒙古大學;2013年
2 郭龍;印刷體文本圖像文種識別技術(shù)研究[D];解放軍信息工程大學;2011年
3 顧立娟;基于文本圖像紋理特征的文種識別技術(shù)研究[D];解放軍信息工程大學;2009年
4 曹莉;基于文種識別的東南亞傳真報篩選檢索研究[D];解放軍信息工程大學;2009年
5 陸小川;印刷體文本圖像的文種識別研究[D];解放軍信息工程大學;2007年
,本文編號:1907459
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/1907459.html