中文連續(xù)手寫識(shí)別中若干問題研究

發(fā)布時(shí)間：2020-12-15 06:36

　　中文連續(xù)手寫識(shí)別是利用計(jì)算機(jī)對(duì)輸入的中文手寫文本信息進(jìn)行自動(dòng)識(shí)別,提取出相應(yīng)的文字內(nèi)容。在隨著以人工智能等為核心驅(qū)動(dòng)力的第四次工業(yè)革命到來,手寫識(shí)別在許多人機(jī)交互場(chǎng)景中都扮演著重要角色:如快遞自動(dòng)分發(fā)、智能閱卷、信息錄入等等。特別地,我們國(guó)家人口眾多且在世界上占據(jù)越來越重要的地位,研究中文這種特定的文字識(shí)別就顯得尤為重要。然而相對(duì)于孤立字識(shí)別而言,連續(xù)文字識(shí)別隸屬于序列求解問題的一種,如何進(jìn)行有效建模本身就是研究的一個(gè)難點(diǎn)。自20世紀(jì)以來,研究者們便基于統(tǒng)計(jì)建模的方法提出了許多解決思路。這些方法按照是否需要對(duì)圖片進(jìn)行顯示地預(yù)切分可以分為過切方法和非切分方法。一方面,準(zhǔn)確地尋找分割點(diǎn)往往成為過切分方法的性能瓶頸;另一方面,受限于傳統(tǒng)分類器的表征能力,不同方法的識(shí)別性能一直沒有取得很大的進(jìn)展。近年來,隨著可利用的海量數(shù)據(jù)的獲得以及深度學(xué)習(xí)技術(shù)的突飛猛進(jìn),無論對(duì)以預(yù)切分為代表的過切法還是對(duì)無顯示分割的方法,連續(xù)手寫識(shí)別的性能都有了極大的提升。盡管基于深度學(xué)習(xí)的已有方法相比傳統(tǒng)方法獲得了明顯性能的改進(jìn),但是仍然有一些值得進(jìn)一步研究的地方。第一是如何將傳統(tǒng)序列模型與深度學(xué)習(xí)技術(shù)更有效結(jié)合來實(shí)現(xiàn)對(duì)...

【文章來源】：中國(guó)科學(xué)技術(shù)大學(xué)安徽省 211工程院校 985工程院校

【文章頁(yè)數(shù)】：104 頁(yè)

【學(xué)位級(jí)別】：博士

【部分圖文】：

圖２．１基于過切分的連續(xù)手寫中文文本識(shí)別流程圖及中間結(jié)果示意圖（Ｗａｎｇ??ｅｔａｌ．，?２０１１）??對(duì)應(yīng)的求解的數(shù)學(xué)公式即：??

中文,建模,語言模型,特征選擇

；第三，傳統(tǒng)??ＧＭＭ－ＨＭＭ的方法分類器過弱，且對(duì)在特征選擇、訓(xùn)練準(zhǔn)則、語言模型等方面??的新進(jìn)展沒有全面涉及。??為了解決以上問題，本論文提出基于ＤＮＮ－ＨＭＭ的中文連續(xù)手寫識(shí)別方法。??該方法中每一個(gè)孤立字符用一個(gè)ＨＭＭ表征，因此文本行可以用級(jí)聯(lián)的ＨＭＭ??自然表示：??火月象??Ｃ－＼?；二＼??！?Ｓ１?：?＜?Ｓ２?Ｖ，Ｓ３?）?：?Ｓ４?）?（?Ｓ５?；＞?？？？?ＳＩ?Ｓ２?Ｓ３?Ｓ４?Ｓ５?？？？?ＳＩ?Ｓ２?Ｓ３?Ｓ４?Ｓ５?????■：細(xì)ｊ們ｍ??圖３．１基于ＨＭＭ的中文文本行建模??考慮到ＤＮＮ，我們對(duì)式（３．１）進(jìn)行進(jìn)一步分解：??２６??

流程圖,章節(jié),識(shí)別系統(tǒng),流程圖

第３章基于深度神經(jīng)網(wǎng)絡(luò)－隱馬爾科夫模型的中文連續(xù)手寫識(shí)別方法??ＤＮＮ－ＨＭＭ以及ＬＭ給出最終的識(shí)別結(jié)果。??訓(xùn)練階段??ｆ圖片廣、?？?＊綱早取—．ＧＭＭ－ＨＭＭ?＿／?ＧＭＭ－?（??、樣ｊＪ?１酬疋￥?１最大似然訓(xùn)練?ｔ?ＨＭＭ?Ｉ／－???＊?強(qiáng)制對(duì)齊?＊???分中貞???１?＾ｒｎｍ卜廠序列訓(xùn)練Ｉ???＊?重對(duì)齊?＊￣??ＣＮＮ－ＨＭＭ??／?ＣＮＮ－?（??交叉熵訓(xùn)練?ＨＭＭ?＾?ｊ??卜Ｔ??重對(duì)齊?？???ｆ￣￣文本廣、?語言模型￣＿Ｊ?ｉ五古模型??＾?數(shù)據(jù)、ｊ１?箚練?１?口口模??識(shí)別階段?…—丨＿—??ｒ未知樣本ｒ?ｊ——？特征提取?一？識(shí)別器??？??ｖ?Ｖ?ｙ?丨?Ｉ?丨?識(shí)別結(jié)果???？分？貞????圖３．２?ＤＮＮ－ＨＭＭ訓(xùn)練－識(shí)別系統(tǒng)??我們?cè)谙旅嫘≌鹿?jié)逐一詳細(xì)介紹流程圖的各個(gè)部分。??３．?２．?１特征提取??由以上可以看出，對(duì)ＤＮＮ的訓(xùn)練基于每一幀有監(jiān)督的訓(xùn)練且不涉及ＨＭＭ。??因此在訓(xùn)練ＤＮＮ之前，需要先基于最大似然估計(jì)（Ｍａｘｉｍｕｍ?ｌｉｋｅｌｉｈｏｏｄ，?ＭＬ）進(jìn)??行ＧＭＭ－ＨＭＭ訓(xùn)練且為每一幀賦予它所對(duì)應(yīng)的狀態(tài)級(jí)標(biāo)注。由于ＧＭＭ－ＨＭＭ??建模能力相對(duì)較弱，如果直接用原始圖像幀作為觀測(cè)序列會(huì)因維數(shù)太高、區(qū)分??度低使得ＧＭＭ－ＨＭＭ無法很好擬合，導(dǎo)致性能較差。另一方面，手寫文本行??通常文字分布非常不規(guī)則，為了提取到有效地區(qū)分性特征用于ＧＭＭ－ＨＭＭ建??模，我們結(jié)合前人的研宄，開發(fā)出圖３．３所示的一套對(duì)離線中文文本行的特征??提取流程：??２８??

【參考文獻(xiàn)】：
期刊論文
[1]SCUT-IRAC最新手寫體漢字圖像樣本庫(kù)[J]. 金連文.  中文信息. 1998(01)
[2]手寫體漢字識(shí)別中的一種新的特征提取方法——彈性網(wǎng)格方向分解特征[J]. 金連文,徐秉錚.  電路與系統(tǒng)學(xué)報(bào). 1997(03)
[3]一種基于段化的手寫漢字特征點(diǎn)提取方法及其實(shí)現(xiàn)[J]. 周昌樂,張雄偉.  電子學(xué)報(bào). 1997(05)
[4]基于模糊方向線素特征的手寫體漢字識(shí)別[J]. 馬少平,夏瑩,朱小燕.  清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 1997(03)

本文編號(hào)：2917830

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/shoufeilunwen/xxkjbs/2917830.html

上一篇：SDN/NFV網(wǎng)絡(luò)中服務(wù)功能鏈的路由和資源優(yōu)化研究
下一篇：改進(jìn)PHT樣條及其應(yīng)用

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

中文連續(xù)手寫識(shí)別中若干問題研究