手寫體新蒙文字符識別算法研究
發(fā)布時間:2021-01-17 12:51
在當(dāng)今各國合作共建的時代背景下,中蒙兩國作為睦鄰友好的鄰國,將新蒙文做一個有效的電腦錄入以及字符識別,能有利于兩國之間和地區(qū)之間的經(jīng)濟、社會、文化發(fā)展,也能促進兩國和地區(qū)人民之間更好的交流溝通。為了滿足基本的應(yīng)用需求,本文從識別率及識別速度的角度出發(fā),結(jié)合新蒙文的字符與語言特點,設(shè)計了手寫體新蒙文字符識別系統(tǒng)。論文主要完成了以下內(nèi)容。1、完成了手寫體新蒙文字符庫與語料庫的建立。通過編寫字符錄入窗口,邀請15位同學(xué)進行樣本錄入,完成了手寫體新蒙文字符樣本集的制作。并通過轉(zhuǎn)錄新蒙文文章的形式構(gòu)建了新蒙文的語料庫。2、對于已錄入的樣本集,結(jié)合新蒙文的字符特征以及語言特點進行分析研究,通過手寫體新蒙文進行嘗試分類實驗發(fā)掘手寫體新蒙文字符識別中存在的問題。對于實驗結(jié)果進行分析,針對發(fā)現(xiàn)的問題,提出了手寫體新蒙文字符識別系統(tǒng)的設(shè)計方案。3、采用深層卷積神經(jīng)網(wǎng)絡(luò)作為主分類器,通過多組實驗測試比對,確定神經(jīng)網(wǎng)絡(luò)框架,并經(jīng)過微調(diào)確定了最適合手寫體新蒙文字符識別的深層卷積神經(jīng)網(wǎng)絡(luò)模型。基于識別結(jié)果提出了進一步提高識別率的可能。4、輔助分類器的設(shè)計與分類器整合。結(jié)合手寫體新蒙文字的語言特性,利用長短期記憶神...
【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:85 頁
【學(xué)位級別】:碩士
【部分圖文】:
新蒙文的鍵盤式輸入法
內(nèi)蒙古大學(xué)碩士學(xué)位論文6第二章字符樣本的錄入與數(shù)據(jù)集的制作由于在制作分類器時并沒有一個完備的手寫體新蒙文字符樣本庫與語料庫,受限于設(shè)計算法的需求,設(shè)計初期首先要做的就是構(gòu)建一個適合于網(wǎng)絡(luò)訓(xùn)練需求的樣本集。2.1字符的錄入字符錄入部分的工作是通過MATLAB編程完成,除此之外淺層神經(jīng)網(wǎng)絡(luò)的設(shè)計部分也在MATLAB環(huán)境下完成。字符錄入部分的設(shè)計思路是通過生成坐標(biāo)系,對鼠標(biāo)左鍵按下時的位置收錄作為點集,通過點集確定繪制區(qū)域,并將其與坐標(biāo)系結(jié)合生成圖像。為防止在鼠標(biāo)滑動較快時導(dǎo)致點不夠密集,由此引發(fā)生成的圖像存在斷線的情況,需要在每次捕獲位置時對于移動的距離上限進行設(shè)定,當(dāng)鼠標(biāo)的移動距離超過設(shè)定的閾值時,對這一段空白的間距進行直線擬合。并且在擬合時,需要對于直線斜率不存時的情況單獨處理。為使后續(xù)訓(xùn)練過程中更易于處理,對于錄入的圖像進行二值化處理并取反為黑底白字,同時重新調(diào)整圖片的大小為35*35*3(長*寬*通道數(shù),為避免與通道數(shù)放在第一位的表述方式混淆,如無特殊說明本文保持這種圖片尺寸的表述方式)。程序框圖如圖2.1所示:圖2.1字符錄入部分的程序框圖Fig.2.1Programblockdiagramofcharacterenteringpart
內(nèi)蒙古大學(xué)碩士學(xué)位論文7制作完成的簡單錄入窗口如圖2.2所示。圖2.2手寫體新蒙文的錄入窗口Fig.2.2InputwindowofhandwritingMongolianCyrillicCharacter為保證數(shù)據(jù)集有較好的廣泛性,在字符錄入時,尋找了15位同學(xué)進行協(xié)助,每人為68個字符(大寫字符33個以及小寫字符35個,其中有兩個字符無大小寫形式區(qū)分)每個字符提供10個樣本,構(gòu)成了共計4950個數(shù)據(jù)的大寫字符樣本集和共計5250個數(shù)據(jù)的小寫字符樣本集。其中С字符的樣本集如圖2.3所示,圖示樣本集為經(jīng)過抽取測試集樣本后的訓(xùn)練集樣本,因此總計不足150個。從圖2.3中可以看出,采集的樣本不僅在筆跡粗細(xì),大小上存在區(qū)別,在字符的大小與位置上也存在不同,為識別工作增加了難度。圖2.3部分手寫體字符樣本Fig.2.3Somehandwritingcharactersamples新蒙文字符部分字符在大小寫的字體寫法上具有高度的相似性,如圖2.4所示。圖2.4(a)字符Ж的手寫體圖2.4(b)字符Й的手寫體Fig.2.4(a)HandwritingcharacterЖFig.2.4(b)HandwritingcharacterЖ
【參考文獻】:
期刊論文
[1]基于改進Inception卷積神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別[J]. 余圣新,夏成蹊,唐澤恬,丁召,楊晨. 計算機應(yīng)用與軟件. 2019(12)
[2]深度卷積記憶網(wǎng)絡(luò)時空數(shù)據(jù)模型[J]. 秦超,高曉光,萬開方. 自動化學(xué)報. 2020(03)
[3]基于改進inception的脫機手寫漢字識別[J]. 陳站,邱衛(wèi)根,張立臣. 計算機應(yīng)用研究. 2020(04)
[4]一種HOG特征模板匹配算法[J]. 崔偉清,黨長春,張旺,王洪洲,羅勇牙. 機械管理開發(fā). 2018(11)
[5]人工智能在手寫字符識別領(lǐng)域的應(yīng)用[J]. 譚仁杰. 中國新通信. 2018(20)
[6]基于神經(jīng)網(wǎng)絡(luò)對手寫字符的研究[J]. 王澤天. 科技經(jīng)濟導(dǎo)刊. 2018(29)
[7]計算機技術(shù)在手寫體漢字識別方面的應(yīng)用及發(fā)展趨勢[J]. 陳擎國. 科技傳播. 2018(19)
[8]Gabor濾波器參數(shù)設(shè)置[J]. 孔銳,張冰. 控制與決策. 2012(08)
[9]改進的HOG和Gabor,LBP性能比較[J]. 向征,譚恒良,馬爭鳴. 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2012(06)
[10]一種采用Gabor小波的紋理特征提取方法[J]. 張剛,馬宗民. 中國圖象圖形學(xué)報. 2010(02)
博士論文
[1]基于圖像分析和深度學(xué)習(xí)的船名標(biāo)識字符檢測與識別研究[D]. 劉寶龍.浙江大學(xué) 2018
[2]西里爾蒙古文—漢文機器翻譯系統(tǒng)的實現(xiàn)[D]. 烏日力嘎.內(nèi)蒙古大學(xué) 2015
碩士論文
[1]基于深度學(xué)習(xí)的中文OCR算法與系統(tǒng)實現(xiàn)[D]. 馮海.中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進技術(shù)研究院) 2019
[2]彈丸運動參數(shù)激光陰影照相測試技術(shù)研究[D]. 張文博.西安工業(yè)大學(xué) 2019
[3]基于深度學(xué)習(xí)的手寫漢字識別的研究[D]. 蘇日婭.內(nèi)蒙古大學(xué) 2019
[4]基于LSTM模型的數(shù)學(xué)公式手寫體識別技術(shù)的研究與實現(xiàn)[D]. 王奕松.電子科技大學(xué) 2018
[5]藏文音節(jié)字手寫識別[D]. 袁道昱.西安電子科技大學(xué) 2017
[6]圖像中的文本檢測與識別研究[D]. 楊彬.東南大學(xué) 2017
[7]基于雙向長短時記憶遞歸神經(jīng)網(wǎng)絡(luò)的聯(lián)機手寫數(shù)字公式字符識別[D]. 商俊蓓.華南理工大學(xué) 2015
[8]多字體印刷蒙文字識別技術(shù)的研究[D]. 李偉.內(nèi)蒙古大學(xué) 2004
本文編號:2982919
【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁數(shù)】:85 頁
【學(xué)位級別】:碩士
【部分圖文】:
新蒙文的鍵盤式輸入法
內(nèi)蒙古大學(xué)碩士學(xué)位論文6第二章字符樣本的錄入與數(shù)據(jù)集的制作由于在制作分類器時并沒有一個完備的手寫體新蒙文字符樣本庫與語料庫,受限于設(shè)計算法的需求,設(shè)計初期首先要做的就是構(gòu)建一個適合于網(wǎng)絡(luò)訓(xùn)練需求的樣本集。2.1字符的錄入字符錄入部分的工作是通過MATLAB編程完成,除此之外淺層神經(jīng)網(wǎng)絡(luò)的設(shè)計部分也在MATLAB環(huán)境下完成。字符錄入部分的設(shè)計思路是通過生成坐標(biāo)系,對鼠標(biāo)左鍵按下時的位置收錄作為點集,通過點集確定繪制區(qū)域,并將其與坐標(biāo)系結(jié)合生成圖像。為防止在鼠標(biāo)滑動較快時導(dǎo)致點不夠密集,由此引發(fā)生成的圖像存在斷線的情況,需要在每次捕獲位置時對于移動的距離上限進行設(shè)定,當(dāng)鼠標(biāo)的移動距離超過設(shè)定的閾值時,對這一段空白的間距進行直線擬合。并且在擬合時,需要對于直線斜率不存時的情況單獨處理。為使后續(xù)訓(xùn)練過程中更易于處理,對于錄入的圖像進行二值化處理并取反為黑底白字,同時重新調(diào)整圖片的大小為35*35*3(長*寬*通道數(shù),為避免與通道數(shù)放在第一位的表述方式混淆,如無特殊說明本文保持這種圖片尺寸的表述方式)。程序框圖如圖2.1所示:圖2.1字符錄入部分的程序框圖Fig.2.1Programblockdiagramofcharacterenteringpart
內(nèi)蒙古大學(xué)碩士學(xué)位論文7制作完成的簡單錄入窗口如圖2.2所示。圖2.2手寫體新蒙文的錄入窗口Fig.2.2InputwindowofhandwritingMongolianCyrillicCharacter為保證數(shù)據(jù)集有較好的廣泛性,在字符錄入時,尋找了15位同學(xué)進行協(xié)助,每人為68個字符(大寫字符33個以及小寫字符35個,其中有兩個字符無大小寫形式區(qū)分)每個字符提供10個樣本,構(gòu)成了共計4950個數(shù)據(jù)的大寫字符樣本集和共計5250個數(shù)據(jù)的小寫字符樣本集。其中С字符的樣本集如圖2.3所示,圖示樣本集為經(jīng)過抽取測試集樣本后的訓(xùn)練集樣本,因此總計不足150個。從圖2.3中可以看出,采集的樣本不僅在筆跡粗細(xì),大小上存在區(qū)別,在字符的大小與位置上也存在不同,為識別工作增加了難度。圖2.3部分手寫體字符樣本Fig.2.3Somehandwritingcharactersamples新蒙文字符部分字符在大小寫的字體寫法上具有高度的相似性,如圖2.4所示。圖2.4(a)字符Ж的手寫體圖2.4(b)字符Й的手寫體Fig.2.4(a)HandwritingcharacterЖFig.2.4(b)HandwritingcharacterЖ
【參考文獻】:
期刊論文
[1]基于改進Inception卷積神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字識別[J]. 余圣新,夏成蹊,唐澤恬,丁召,楊晨. 計算機應(yīng)用與軟件. 2019(12)
[2]深度卷積記憶網(wǎng)絡(luò)時空數(shù)據(jù)模型[J]. 秦超,高曉光,萬開方. 自動化學(xué)報. 2020(03)
[3]基于改進inception的脫機手寫漢字識別[J]. 陳站,邱衛(wèi)根,張立臣. 計算機應(yīng)用研究. 2020(04)
[4]一種HOG特征模板匹配算法[J]. 崔偉清,黨長春,張旺,王洪洲,羅勇牙. 機械管理開發(fā). 2018(11)
[5]人工智能在手寫字符識別領(lǐng)域的應(yīng)用[J]. 譚仁杰. 中國新通信. 2018(20)
[6]基于神經(jīng)網(wǎng)絡(luò)對手寫字符的研究[J]. 王澤天. 科技經(jīng)濟導(dǎo)刊. 2018(29)
[7]計算機技術(shù)在手寫體漢字識別方面的應(yīng)用及發(fā)展趨勢[J]. 陳擎國. 科技傳播. 2018(19)
[8]Gabor濾波器參數(shù)設(shè)置[J]. 孔銳,張冰. 控制與決策. 2012(08)
[9]改進的HOG和Gabor,LBP性能比較[J]. 向征,譚恒良,馬爭鳴. 計算機輔助設(shè)計與圖形學(xué)學(xué)報. 2012(06)
[10]一種采用Gabor小波的紋理特征提取方法[J]. 張剛,馬宗民. 中國圖象圖形學(xué)報. 2010(02)
博士論文
[1]基于圖像分析和深度學(xué)習(xí)的船名標(biāo)識字符檢測與識別研究[D]. 劉寶龍.浙江大學(xué) 2018
[2]西里爾蒙古文—漢文機器翻譯系統(tǒng)的實現(xiàn)[D]. 烏日力嘎.內(nèi)蒙古大學(xué) 2015
碩士論文
[1]基于深度學(xué)習(xí)的中文OCR算法與系統(tǒng)實現(xiàn)[D]. 馮海.中國科學(xué)院大學(xué)(中國科學(xué)院深圳先進技術(shù)研究院) 2019
[2]彈丸運動參數(shù)激光陰影照相測試技術(shù)研究[D]. 張文博.西安工業(yè)大學(xué) 2019
[3]基于深度學(xué)習(xí)的手寫漢字識別的研究[D]. 蘇日婭.內(nèi)蒙古大學(xué) 2019
[4]基于LSTM模型的數(shù)學(xué)公式手寫體識別技術(shù)的研究與實現(xiàn)[D]. 王奕松.電子科技大學(xué) 2018
[5]藏文音節(jié)字手寫識別[D]. 袁道昱.西安電子科技大學(xué) 2017
[6]圖像中的文本檢測與識別研究[D]. 楊彬.東南大學(xué) 2017
[7]基于雙向長短時記憶遞歸神經(jīng)網(wǎng)絡(luò)的聯(lián)機手寫數(shù)字公式字符識別[D]. 商俊蓓.華南理工大學(xué) 2015
[8]多字體印刷蒙文字識別技術(shù)的研究[D]. 李偉.內(nèi)蒙古大學(xué) 2004
本文編號:2982919
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2982919.html
最近更新
教材專著