大詞匯量脫機(jī)手寫(xiě)蒙古文整詞識(shí)別研究
發(fā)布時(shí)間:2021-05-20 00:56
近年來(lái),隨著數(shù)字化技術(shù)的飛速發(fā)展,越來(lái)越多的蒙古文手寫(xiě)文獻(xiàn)資源被轉(zhuǎn)換成圖像格式加以保存。然而,圖像格式的蒙古文手寫(xiě)文獻(xiàn)資源并不適合詞頻統(tǒng)計(jì)、內(nèi)容分析、編輯與檢索。因此,本文針對(duì)脫機(jī)手寫(xiě)蒙古文識(shí)別問(wèn)題開(kāi)展相關(guān)研究,為挖掘和利用蒙古文手寫(xiě)文獻(xiàn)資源提供便利。蒙古文獨(dú)特的構(gòu)詞方式導(dǎo)致其詞匯量巨大,據(jù)統(tǒng)計(jì)蒙古文詞匯量可達(dá)數(shù)百萬(wàn),常用詞匯也有幾十萬(wàn)。此外,本文所關(guān)注的脫機(jī)手寫(xiě)蒙古文是非受限書(shū)寫(xiě),在這種條件下,單詞書(shū)寫(xiě)變形非常嚴(yán)重,這使得脫機(jī)手寫(xiě)蒙古文識(shí)別任務(wù)極具挑戰(zhàn)性。針對(duì)蒙古文詞匯量巨大、書(shū)寫(xiě)變形嚴(yán)重等特點(diǎn),本文提出了適合于蒙古文構(gòu)詞特點(diǎn)和書(shū)寫(xiě)方式的整詞識(shí)別方法。本文的主要工作如下:(1)采用目前文字識(shí)別領(lǐng)域最為流行的卷積循環(huán)神經(jīng)網(wǎng)絡(luò)與連接時(shí)序分類器相結(jié)合的模型(Convolution Recurrent Neural Network-Connectionist Temporal Classification,CRNN-CTC),實(shí)現(xiàn)了脫機(jī)手寫(xiě)蒙古文整詞識(shí)別。在相關(guān)脫機(jī)手寫(xiě)蒙古文數(shù)據(jù)集上進(jìn)行測(cè)試,并與該數(shù)據(jù)集上性能最佳的深度神經(jīng)網(wǎng)絡(luò)與隱馬爾科夫相結(jié)合的模型(Deep Neural Network...
【文章來(lái)源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 手寫(xiě)識(shí)別方法分類及蒙古文特點(diǎn)分析
1.3 脫機(jī)手寫(xiě)蒙古文識(shí)別研究現(xiàn)狀
1.4 本文的研究重點(diǎn)
1.5 本文的結(jié)構(gòu)安排
第二章 相關(guān)模型介紹
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
2.1.3 卷積神經(jīng)網(wǎng)絡(luò)的總結(jié)
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.1 LSTM
2.2.3 GRU
2.3 連接時(shí)序分類器
2.3.1 CTC的原理
2.3.2 CTC的特點(diǎn)
2.4 注意力機(jī)制
2.4.1 注意力機(jī)制簡(jiǎn)介
2.4.2 手寫(xiě)蒙古文識(shí)別中的注意力機(jī)制
第三章 CRNN-CTC模型的脫機(jī)手寫(xiě)蒙古文整詞識(shí)別
3.1 小詞匯量脫機(jī)手寫(xiě)蒙古文數(shù)據(jù)集
3.1.1 實(shí)驗(yàn)數(shù)據(jù)集
3.1.2 數(shù)據(jù)預(yù)處理
3.2 CRNN-CTC模型
3.2.1 模型結(jié)構(gòu)介紹
3.2.2 模型訓(xùn)練補(bǔ)充說(shuō)明
3.3 實(shí)驗(yàn)結(jié)果與分析
3.3.1 模型性能檢測(cè)標(biāo)準(zhǔn)
3.3.2 結(jié)果與分析
3.4 本章小結(jié)
第四章 序列到序列模型的脫機(jī)手寫(xiě)蒙古文整詞識(shí)別
4.1 大詞匯量手寫(xiě)蒙古文數(shù)據(jù)集
4.1.1 數(shù)據(jù)預(yù)處理
4.1.2 實(shí)驗(yàn)數(shù)據(jù)集
4.2 具有注意力機(jī)制的序列到序列模型
4.2.1 模型結(jié)構(gòu)介紹
4.2.2 后處理
4.2.3 幀序列生成方式
4.3 不同的幀序列生成方式實(shí)驗(yàn)
4.3.1 幀重疊方式實(shí)驗(yàn)結(jié)果與分析
4.3.2 幀不重疊方式實(shí)驗(yàn)結(jié)果與分析
4.4 數(shù)據(jù)增強(qiáng)實(shí)驗(yàn)
4.4.1 數(shù)據(jù)增強(qiáng)方法
4.4.2 數(shù)據(jù)增強(qiáng)結(jié)果與分析
4.5 基于大詞匯量手寫(xiě)蒙古文數(shù)據(jù)集的對(duì)比實(shí)驗(yàn)
4.5.1 幀重疊方式實(shí)驗(yàn)結(jié)果與分析
4.5.2 幀不重疊方式實(shí)驗(yàn)結(jié)果與分析
4.5.3 數(shù)據(jù)增強(qiáng)實(shí)驗(yàn)結(jié)果與分析
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]蒙文文檔圖像的傾斜檢測(cè)方法[J]. 魏宏喜,高光來(lái). 內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版). 2007(04)
博士論文
[1]蒙古文古籍圖像檢索技術(shù)研究[D]. 魏宏喜.內(nèi)蒙古大學(xué) 2012
碩士論文
[1]聯(lián)機(jī)手寫(xiě)蒙古文字識(shí)別技術(shù)的研究[D]. 白文榮.內(nèi)蒙古大學(xué) 2007
[2]印刷體蒙古文字識(shí)別中關(guān)鍵技術(shù)的研究[D]. 魏宏喜.內(nèi)蒙古大學(xué) 2006
[3]聯(lián)機(jī)手寫(xiě)蒙古文字識(shí)別技術(shù)的研究與實(shí)現(xiàn)[D]. 吳偉.內(nèi)蒙古大學(xué) 2005
本文編號(hào):3196767
【文章來(lái)源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 手寫(xiě)識(shí)別方法分類及蒙古文特點(diǎn)分析
1.3 脫機(jī)手寫(xiě)蒙古文識(shí)別研究現(xiàn)狀
1.4 本文的研究重點(diǎn)
1.5 本文的結(jié)構(gòu)安排
第二章 相關(guān)模型介紹
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
2.1.3 卷積神經(jīng)網(wǎng)絡(luò)的總結(jié)
2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.2.1 LSTM
2.2.3 GRU
2.3 連接時(shí)序分類器
2.3.1 CTC的原理
2.3.2 CTC的特點(diǎn)
2.4 注意力機(jī)制
2.4.1 注意力機(jī)制簡(jiǎn)介
2.4.2 手寫(xiě)蒙古文識(shí)別中的注意力機(jī)制
第三章 CRNN-CTC模型的脫機(jī)手寫(xiě)蒙古文整詞識(shí)別
3.1 小詞匯量脫機(jī)手寫(xiě)蒙古文數(shù)據(jù)集
3.1.1 實(shí)驗(yàn)數(shù)據(jù)集
3.1.2 數(shù)據(jù)預(yù)處理
3.2 CRNN-CTC模型
3.2.1 模型結(jié)構(gòu)介紹
3.2.2 模型訓(xùn)練補(bǔ)充說(shuō)明
3.3 實(shí)驗(yàn)結(jié)果與分析
3.3.1 模型性能檢測(cè)標(biāo)準(zhǔn)
3.3.2 結(jié)果與分析
3.4 本章小結(jié)
第四章 序列到序列模型的脫機(jī)手寫(xiě)蒙古文整詞識(shí)別
4.1 大詞匯量手寫(xiě)蒙古文數(shù)據(jù)集
4.1.1 數(shù)據(jù)預(yù)處理
4.1.2 實(shí)驗(yàn)數(shù)據(jù)集
4.2 具有注意力機(jī)制的序列到序列模型
4.2.1 模型結(jié)構(gòu)介紹
4.2.2 后處理
4.2.3 幀序列生成方式
4.3 不同的幀序列生成方式實(shí)驗(yàn)
4.3.1 幀重疊方式實(shí)驗(yàn)結(jié)果與分析
4.3.2 幀不重疊方式實(shí)驗(yàn)結(jié)果與分析
4.4 數(shù)據(jù)增強(qiáng)實(shí)驗(yàn)
4.4.1 數(shù)據(jù)增強(qiáng)方法
4.4.2 數(shù)據(jù)增強(qiáng)結(jié)果與分析
4.5 基于大詞匯量手寫(xiě)蒙古文數(shù)據(jù)集的對(duì)比實(shí)驗(yàn)
4.5.1 幀重疊方式實(shí)驗(yàn)結(jié)果與分析
4.5.2 幀不重疊方式實(shí)驗(yàn)結(jié)果與分析
4.5.3 數(shù)據(jù)增強(qiáng)實(shí)驗(yàn)結(jié)果與分析
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]蒙文文檔圖像的傾斜檢測(cè)方法[J]. 魏宏喜,高光來(lái). 內(nèi)蒙古大學(xué)學(xué)報(bào)(自然科學(xué)版). 2007(04)
博士論文
[1]蒙古文古籍圖像檢索技術(shù)研究[D]. 魏宏喜.內(nèi)蒙古大學(xué) 2012
碩士論文
[1]聯(lián)機(jī)手寫(xiě)蒙古文字識(shí)別技術(shù)的研究[D]. 白文榮.內(nèi)蒙古大學(xué) 2007
[2]印刷體蒙古文字識(shí)別中關(guān)鍵技術(shù)的研究[D]. 魏宏喜.內(nèi)蒙古大學(xué) 2006
[3]聯(lián)機(jī)手寫(xiě)蒙古文字識(shí)別技術(shù)的研究與實(shí)現(xiàn)[D]. 吳偉.內(nèi)蒙古大學(xué) 2005
本文編號(hào):3196767
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3196767.html
最近更新
教材專著