天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類博士論文 >

中文連續(xù)手寫識(shí)別中若干問題研究

發(fā)布時(shí)間:2020-12-15 06:36
  中文連續(xù)手寫識(shí)別是利用計(jì)算機(jī)對(duì)輸入的中文手寫文本信息進(jìn)行自動(dòng)識(shí)別,提取出相應(yīng)的文字內(nèi)容。在隨著以人工智能等為核心驅(qū)動(dòng)力的第四次工業(yè)革命到來,手寫識(shí)別在許多人機(jī)交互場(chǎng)景中都扮演著重要角色:如快遞自動(dòng)分發(fā)、智能閱卷、信息錄入等等。特別地,我們國(guó)家人口眾多且在世界上占據(jù)越來越重要的地位,研究中文這種特定的文字識(shí)別就顯得尤為重要。然而相對(duì)于孤立字識(shí)別而言,連續(xù)文字識(shí)別隸屬于序列求解問題的一種,如何進(jìn)行有效建模本身就是研究的一個(gè)難點(diǎn)。自20世紀(jì)以來,研究者們便基于統(tǒng)計(jì)建模的方法提出了許多解決思路。這些方法按照是否需要對(duì)圖片進(jìn)行顯示地預(yù)切分可以分為過切方法和非切分方法。一方面,準(zhǔn)確地尋找分割點(diǎn)往往成為過切分方法的性能瓶頸;另一方面,受限于傳統(tǒng)分類器的表征能力,不同方法的識(shí)別性能一直沒有取得很大的進(jìn)展。近年來,隨著可利用的海量數(shù)據(jù)的獲得以及深度學(xué)習(xí)技術(shù)的突飛猛進(jìn),無論對(duì)以預(yù)切分為代表的過切法還是對(duì)無顯示分割的方法,連續(xù)手寫識(shí)別的性能都有了極大的提升。盡管基于深度學(xué)習(xí)的已有方法相比傳統(tǒng)方法獲得了明顯性能的改進(jìn),但是仍然有一些值得進(jìn)一步研究的地方。第一是如何將傳統(tǒng)序列模型與深度學(xué)習(xí)技術(shù)更有效結(jié)合來實(shí)現(xiàn)對(duì)... 

【文章來源】:中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:104 頁(yè)

【學(xué)位級(jí)別】:博士

【部分圖文】:

中文連續(xù)手寫識(shí)別中若干問題研究


圖2.1基于過切分的連續(xù)手寫中文文本識(shí)別流程圖及中間結(jié)果示意圖(Wang??etal.,?2011)??對(duì)應(yīng)的求解的數(shù)學(xué)公式即:??

中文,建模,語言模型,特征選擇


;第三,傳統(tǒng)??GMM-HMM的方法分類器過弱,且對(duì)在特征選擇、訓(xùn)練準(zhǔn)則、語言模型等方面??的新進(jìn)展沒有全面涉及。??為了解決以上問題,本論文提出基于DNN-HMM的中文連續(xù)手寫識(shí)別方法。??該方法中每一個(gè)孤立字符用一個(gè)HMM表征,因此文本行可以用級(jí)聯(lián)的HMM??自然表示:??火月象??C-\?;二\??!?S1?:?<?S2?V,S3?)?:?S4?)?(?S5?;>?????SI?S2?S3?S4?S5?????SI?S2?S3?S4?S5?????■:細(xì)j們m??圖3.1基于HMM的中文文本行建模??考慮到DNN,我們對(duì)式(3.1)進(jìn)行進(jìn)一步分解:??26??

流程圖,章節(jié),識(shí)別系統(tǒng),流程圖


第3章基于深度神經(jīng)網(wǎng)絡(luò)-隱馬爾科夫模型的中文連續(xù)手寫識(shí)別方法??DNN-HMM以及LM給出最終的識(shí)別結(jié)果。??訓(xùn)練階段??f圖片廣、???*綱早取—.GMM-HMM?_/?GMM-?(??、樣jJ?1酬疋¥?1最大似然訓(xùn)練?t?HMM?I/-???*?強(qiáng)制對(duì)齊?*???分中貞???1?^rnm卜廠序列訓(xùn)練I???*?重對(duì)齊?* ̄??CNN-HMM??/?CNN-?(??交叉熵訓(xùn)練?HMM?^?j??卜T??重對(duì)齊?????f ̄ ̄文本廣、?語言模型 ̄_J?i五古模型??^?數(shù)據(jù)、j1?箚練?1?口口模??識(shí)別階段?…—丨_—??r未知樣本r?j——?特征提取?一?識(shí)別器?????v?V?y?丨?I?丨?識(shí)別結(jié)果????分?貞????圖3.2?DNN-HMM訓(xùn)練-識(shí)別系統(tǒng)??我們?cè)谙旅嫘≌鹿?jié)逐一詳細(xì)介紹流程圖的各個(gè)部分。??3.?2.?1特征提取??由以上可以看出,對(duì)DNN的訓(xùn)練基于每一幀有監(jiān)督的訓(xùn)練且不涉及HMM。??因此在訓(xùn)練DNN之前,需要先基于最大似然估計(jì)(Maximum?likelihood,?ML)進(jìn)??行GMM-HMM訓(xùn)練且為每一幀賦予它所對(duì)應(yīng)的狀態(tài)級(jí)標(biāo)注。由于GMM-HMM??建模能力相對(duì)較弱,如果直接用原始圖像幀作為觀測(cè)序列會(huì)因維數(shù)太高、區(qū)分??度低使得GMM-HMM無法很好擬合,導(dǎo)致性能較差。另一方面,手寫文本行??通常文字分布非常不規(guī)則,為了提取到有效地區(qū)分性特征用于GMM-HMM建??模,我們結(jié)合前人的研宄,開發(fā)出圖3.3所示的一套對(duì)離線中文文本行的特征??提取流程:??28??

【參考文獻(xiàn)】:
期刊論文
[1]SCUT-IRAC最新手寫體漢字圖像樣本庫(kù)[J]. 金連文.  中文信息. 1998(01)
[2]手寫體漢字識(shí)別中的一種新的特征提取方法——彈性網(wǎng)格方向分解特征[J]. 金連文,徐秉錚.  電路與系統(tǒng)學(xué)報(bào). 1997(03)
[3]一種基于段化的手寫漢字特征點(diǎn)提取方法及其實(shí)現(xiàn)[J]. 周昌樂,張雄偉.  電子學(xué)報(bào). 1997(05)
[4]基于模糊方向線素特征的手寫體漢字識(shí)別[J]. 馬少平,夏瑩,朱小燕.  清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 1997(03)



本文編號(hào):2917830

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2917830.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7b09f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com