中文連續(xù)手寫識(shí)別中若干問題研究
發(fā)布時(shí)間:2020-12-15 06:36
中文連續(xù)手寫識(shí)別是利用計(jì)算機(jī)對(duì)輸入的中文手寫文本信息進(jìn)行自動(dòng)識(shí)別,提取出相應(yīng)的文字內(nèi)容。在隨著以人工智能等為核心驅(qū)動(dòng)力的第四次工業(yè)革命到來,手寫識(shí)別在許多人機(jī)交互場(chǎng)景中都扮演著重要角色:如快遞自動(dòng)分發(fā)、智能閱卷、信息錄入等等。特別地,我們國(guó)家人口眾多且在世界上占據(jù)越來越重要的地位,研究中文這種特定的文字識(shí)別就顯得尤為重要。然而相對(duì)于孤立字識(shí)別而言,連續(xù)文字識(shí)別隸屬于序列求解問題的一種,如何進(jìn)行有效建模本身就是研究的一個(gè)難點(diǎn)。自20世紀(jì)以來,研究者們便基于統(tǒng)計(jì)建模的方法提出了許多解決思路。這些方法按照是否需要對(duì)圖片進(jìn)行顯示地預(yù)切分可以分為過切方法和非切分方法。一方面,準(zhǔn)確地尋找分割點(diǎn)往往成為過切分方法的性能瓶頸;另一方面,受限于傳統(tǒng)分類器的表征能力,不同方法的識(shí)別性能一直沒有取得很大的進(jìn)展。近年來,隨著可利用的海量數(shù)據(jù)的獲得以及深度學(xué)習(xí)技術(shù)的突飛猛進(jìn),無論對(duì)以預(yù)切分為代表的過切法還是對(duì)無顯示分割的方法,連續(xù)手寫識(shí)別的性能都有了極大的提升。盡管基于深度學(xué)習(xí)的已有方法相比傳統(tǒng)方法獲得了明顯性能的改進(jìn),但是仍然有一些值得進(jìn)一步研究的地方。第一是如何將傳統(tǒng)序列模型與深度學(xué)習(xí)技術(shù)更有效結(jié)合來實(shí)現(xiàn)對(duì)...
【文章來源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:104 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖2.1基于過切分的連續(xù)手寫中文文本識(shí)別流程圖及中間結(jié)果示意圖(Wang??etal.,?2011)??對(duì)應(yīng)的求解的數(shù)學(xué)公式即:??
;第三,傳統(tǒng)??GMM-HMM的方法分類器過弱,且對(duì)在特征選擇、訓(xùn)練準(zhǔn)則、語言模型等方面??的新進(jìn)展沒有全面涉及。??為了解決以上問題,本論文提出基于DNN-HMM的中文連續(xù)手寫識(shí)別方法。??該方法中每一個(gè)孤立字符用一個(gè)HMM表征,因此文本行可以用級(jí)聯(lián)的HMM??自然表示:??火月象??C-\?;二\??!?S1?:?<?S2?V,S3?)?:?S4?)?(?S5?;>?????SI?S2?S3?S4?S5?????SI?S2?S3?S4?S5?????■:細(xì)j們m??圖3.1基于HMM的中文文本行建模??考慮到DNN,我們對(duì)式(3.1)進(jìn)行進(jìn)一步分解:??26??
第3章基于深度神經(jīng)網(wǎng)絡(luò)-隱馬爾科夫模型的中文連續(xù)手寫識(shí)別方法??DNN-HMM以及LM給出最終的識(shí)別結(jié)果。??訓(xùn)練階段??f圖片廣、???*綱早取—.GMM-HMM?_/?GMM-?(??、樣jJ?1酬疋¥?1最大似然訓(xùn)練?t?HMM?I/-???*?強(qiáng)制對(duì)齊?*???分中貞???1?^rnm卜廠序列訓(xùn)練I???*?重對(duì)齊?* ̄??CNN-HMM??/?CNN-?(??交叉熵訓(xùn)練?HMM?^?j??卜T??重對(duì)齊?????f ̄ ̄文本廣、?語言模型 ̄_J?i五古模型??^?數(shù)據(jù)、j1?箚練?1?口口模??識(shí)別階段?…—丨_—??r未知樣本r?j——?特征提取?一?識(shí)別器?????v?V?y?丨?I?丨?識(shí)別結(jié)果????分?貞????圖3.2?DNN-HMM訓(xùn)練-識(shí)別系統(tǒng)??我們?cè)谙旅嫘≌鹿?jié)逐一詳細(xì)介紹流程圖的各個(gè)部分。??3.?2.?1特征提取??由以上可以看出,對(duì)DNN的訓(xùn)練基于每一幀有監(jiān)督的訓(xùn)練且不涉及HMM。??因此在訓(xùn)練DNN之前,需要先基于最大似然估計(jì)(Maximum?likelihood,?ML)進(jìn)??行GMM-HMM訓(xùn)練且為每一幀賦予它所對(duì)應(yīng)的狀態(tài)級(jí)標(biāo)注。由于GMM-HMM??建模能力相對(duì)較弱,如果直接用原始圖像幀作為觀測(cè)序列會(huì)因維數(shù)太高、區(qū)分??度低使得GMM-HMM無法很好擬合,導(dǎo)致性能較差。另一方面,手寫文本行??通常文字分布非常不規(guī)則,為了提取到有效地區(qū)分性特征用于GMM-HMM建??模,我們結(jié)合前人的研宄,開發(fā)出圖3.3所示的一套對(duì)離線中文文本行的特征??提取流程:??28??
【參考文獻(xiàn)】:
期刊論文
[1]SCUT-IRAC最新手寫體漢字圖像樣本庫(kù)[J]. 金連文. 中文信息. 1998(01)
[2]手寫體漢字識(shí)別中的一種新的特征提取方法——彈性網(wǎng)格方向分解特征[J]. 金連文,徐秉錚. 電路與系統(tǒng)學(xué)報(bào). 1997(03)
[3]一種基于段化的手寫漢字特征點(diǎn)提取方法及其實(shí)現(xiàn)[J]. 周昌樂,張雄偉. 電子學(xué)報(bào). 1997(05)
[4]基于模糊方向線素特征的手寫體漢字識(shí)別[J]. 馬少平,夏瑩,朱小燕. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 1997(03)
本文編號(hào):2917830
【文章來源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:104 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖2.1基于過切分的連續(xù)手寫中文文本識(shí)別流程圖及中間結(jié)果示意圖(Wang??etal.,?2011)??對(duì)應(yīng)的求解的數(shù)學(xué)公式即:??
;第三,傳統(tǒng)??GMM-HMM的方法分類器過弱,且對(duì)在特征選擇、訓(xùn)練準(zhǔn)則、語言模型等方面??的新進(jìn)展沒有全面涉及。??為了解決以上問題,本論文提出基于DNN-HMM的中文連續(xù)手寫識(shí)別方法。??該方法中每一個(gè)孤立字符用一個(gè)HMM表征,因此文本行可以用級(jí)聯(lián)的HMM??自然表示:??火月象??C-\?;二\??!?S1?:?<?S2?V,S3?)?:?S4?)?(?S5?;>?????SI?S2?S3?S4?S5?????SI?S2?S3?S4?S5?????■:細(xì)j們m??圖3.1基于HMM的中文文本行建模??考慮到DNN,我們對(duì)式(3.1)進(jìn)行進(jìn)一步分解:??26??
第3章基于深度神經(jīng)網(wǎng)絡(luò)-隱馬爾科夫模型的中文連續(xù)手寫識(shí)別方法??DNN-HMM以及LM給出最終的識(shí)別結(jié)果。??訓(xùn)練階段??f圖片廣、???*綱早取—.GMM-HMM?_/?GMM-?(??、樣jJ?1酬疋¥?1最大似然訓(xùn)練?t?HMM?I/-???*?強(qiáng)制對(duì)齊?*???分中貞???1?^rnm卜廠序列訓(xùn)練I???*?重對(duì)齊?* ̄??CNN-HMM??/?CNN-?(??交叉熵訓(xùn)練?HMM?^?j??卜T??重對(duì)齊?????f ̄ ̄文本廣、?語言模型 ̄_J?i五古模型??^?數(shù)據(jù)、j1?箚練?1?口口模??識(shí)別階段?…—丨_—??r未知樣本r?j——?特征提取?一?識(shí)別器?????v?V?y?丨?I?丨?識(shí)別結(jié)果????分?貞????圖3.2?DNN-HMM訓(xùn)練-識(shí)別系統(tǒng)??我們?cè)谙旅嫘≌鹿?jié)逐一詳細(xì)介紹流程圖的各個(gè)部分。??3.?2.?1特征提取??由以上可以看出,對(duì)DNN的訓(xùn)練基于每一幀有監(jiān)督的訓(xùn)練且不涉及HMM。??因此在訓(xùn)練DNN之前,需要先基于最大似然估計(jì)(Maximum?likelihood,?ML)進(jìn)??行GMM-HMM訓(xùn)練且為每一幀賦予它所對(duì)應(yīng)的狀態(tài)級(jí)標(biāo)注。由于GMM-HMM??建模能力相對(duì)較弱,如果直接用原始圖像幀作為觀測(cè)序列會(huì)因維數(shù)太高、區(qū)分??度低使得GMM-HMM無法很好擬合,導(dǎo)致性能較差。另一方面,手寫文本行??通常文字分布非常不規(guī)則,為了提取到有效地區(qū)分性特征用于GMM-HMM建??模,我們結(jié)合前人的研宄,開發(fā)出圖3.3所示的一套對(duì)離線中文文本行的特征??提取流程:??28??
【參考文獻(xiàn)】:
期刊論文
[1]SCUT-IRAC最新手寫體漢字圖像樣本庫(kù)[J]. 金連文. 中文信息. 1998(01)
[2]手寫體漢字識(shí)別中的一種新的特征提取方法——彈性網(wǎng)格方向分解特征[J]. 金連文,徐秉錚. 電路與系統(tǒng)學(xué)報(bào). 1997(03)
[3]一種基于段化的手寫漢字特征點(diǎn)提取方法及其實(shí)現(xiàn)[J]. 周昌樂,張雄偉. 電子學(xué)報(bào). 1997(05)
[4]基于模糊方向線素特征的手寫體漢字識(shí)別[J]. 馬少平,夏瑩,朱小燕. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 1997(03)
本文編號(hào):2917830
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2917830.html
最近更新
教材專著