面向特定字符集的脫機手寫體文字識別算法研究
【圖文】:
識別算法對預處理后的文字進行特征提取,進而依據(jù)提取出的各類特征進行分類,之后逡逑與知識庫中己有的文字特征進行匹配,最后可以識別出手寫體文字。逡逑從流程上看,脫機手寫識別大體分為預處理,,文字識別與后處理三個模塊,如圖2.1逡逑所示,預處理過程可分為二值化、平滑去噪、規(guī)范化等幾個步驟,文字識別過程又可分逡逑為特征提取、分類、特征匹配等幾個步驟,而后處理即為將識別過程中新學到的特征錄逡逑入知識庫中。逡逑手與體文件逡逑片格式保忭的逡逑文件邐筅機逡逑I邐I邐邐逡逑■邋■■■邋■..A邐 ̄?二值化逡逑預處理邐?|邐|平?噴|逡逑—— ̄ ̄I規(guī)范化丨逡逑邐邐邋 ̄?!邐I特征提。义希保敝R庫I邋」丨后處pk邋-邋識別邐?!分炎逡逑Li邐N邋j邋L邐!邐■{-邐"-十逡逑邐邐 ̄?!邐\mmM\逡逑邐'邋r邐逡逑輸出識別結果逡逑圖2.1脫機手寫體文字識別一般流程逡逑2.1預處理逡逑需要被識別的手寫體文字在書寫過程中或經過掃描后可能生成各種噪聲。噪聲即為逡逑掃描出文件中的文字與知識庫中標準文字的特征信息不匹配的地方,而產生噪聲的原因逡逑9逡逑
的識別工作,首先要進行對掃描圖像的預處理,從而將圖像的噪聲降到最低,以提高識逡逑別速度與識別率。逡逑如圖2.2所示,手寫識別與印刷體識別的預處理工作大致類似,基本步驟都分為二逡逑值化、去噪、傾斜校正、行切分、列切分、標準化等。逡逑'i邐-邐平邐^邐^邐^邐i逡逑Sl;邋一一邋j邋H邋—邋2邋一逡逑M邋u邐□邋11逡逑圖2.2手寫識別預處理一般過程逡逑2.1.1二值化逡逑所謂二值,指的是一副圖像中只存在黑白兩種顏色的圖像,并且在圖像中沒有另外逡逑的灰度變化。這樣的圖像中的像素點可以用0和1來表示黑和白(或白和黑)。二值化逡逑即為將普通的掃描圖像轉化為二值圖像的過程,通常為預處理的第一步,二值效果也將逡逑對之后的步驟造成很大影響,是整個預處理過程能否得到理想結果的關鍵。逡逑文獻[28]給出了一個灰度化彩色圖像的過程,從而可以得到二值化圖像;叶葓D像逡逑二值化的核心是確定適當?shù)拈撝担蛞詣澐止P畫像素和背景像素%。閾值劃分法將整個圖逡逑像劃分為256個灰度區(qū)域,同一灰度像素共屬于一個灰度區(qū)域,由于一般在一個文字圖逡逑像中筆畫部分與背景部分灰度差異比較明顯,可以依據(jù)此特點確定r從而將筆畫像素所逡逑代表的灰度區(qū)域像素抽取出來。多種尋找閾值r的方法都較為成熟,但需要根據(jù)實際情逡逑況進行選擇。逡逑(1)全局閾值法逡逑全局閾值法的計算對象為整個文字圖像
【學位授予單位】:哈爾濱工程大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP391.43
【參考文獻】
相關期刊論文 前10條
1 任日麗;彭利紅;;基于改進的十三點特征提取算法的智能閱卷系統(tǒng)研究[J];電腦知識與技術;2015年09期
2 孔斌;喻民;劉超;李續(xù);;保密檢查中圖像文件內容識別技術研究[J];保密科學技術;2014年07期
3 溫尚清;郝志峰;廖芹;陳炎雄;;基于貝葉斯網絡的脫機手寫體漢字智能識別[J];計算機輔助工程;2006年03期
4 魏陽;索忠偉;李文容;;數(shù)字濾波器在實時濾除心電干擾中的設計與應用[J];微計算機信息;2006年11期
5 李國宏;施鵬飛;;手寫體漢字筆畫特征點的完整性分析[J];計算機工程;2006年06期
6 焦李成;孫強;;多尺度變換域圖像的感知與識別:進展和展望[J];計算機學報;2006年02期
7 高彥宇,楊揚,陳飛;基于融合特征和LS-SVM的脫機手寫體漢字識別[J];北京科技大學學報;2005年04期
8 付慶玲,韓力群;基于人工神經網絡的手寫數(shù)字識別[J];北京工商大學學報(自然科學版);2004年03期
9 Paul Graham;;反垃圾信的新策略[J];程序員;2003年10期
10 童學鋒,石繁槐;FSVM在有限集脫機手寫體漢字識別中的應用[J];計算機工程;2003年13期
相關博士學位論文 前1條
1 婁正良;中文郵政地址識別研究[D];中國科學院研究生院(計算技術研究所);2004年
相關碩士學位論文 前1條
1 戚世貴;基于圖像特征點的提取匹配及應用[D];吉林大學;2006年
本文編號:2530696
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2530696.html