天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于注意力機(jī)制的中文識(shí)別算法研究

發(fā)布時(shí)間:2021-03-25 07:50
  文字作為人類最偉大的發(fā)明之一,不僅是人類語(yǔ)言的書面表達(dá)形式,更是一種精神、文化的傳承。而圖像作為一種重要的信息載體,不僅攜帶著色彩、紋理、結(jié)構(gòu)等信息,通常還存在大量文字,其中文字往往包含更豐富的語(yǔ)義信息,能夠?qū)D像場(chǎng)景的理解提供重要線索。可以說文字在日常生活中隨處可見,如何對(duì)圖像中的文字進(jìn)行識(shí)別和理解具有重要的研究意義,也有著廣闊的實(shí)際應(yīng)用場(chǎng)景。如手寫票據(jù)識(shí)別、車牌識(shí)別、拍照翻譯等應(yīng)用,可以大大提高人類生產(chǎn)效率,給人們的生活帶來(lái)幫助和便捷。盡管傳統(tǒng)的文檔文字識(shí)別技術(shù)已經(jīng)非常成熟,但是由于手寫風(fēng)格的巨大差異和自然場(chǎng)景復(fù)雜的背景,準(zhǔn)確地識(shí)別手寫漢字以及自然場(chǎng)景圖片中的文字仍然是非常有挑戰(zhàn)性的任務(wù)。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,計(jì)算機(jī)視覺領(lǐng)域迎來(lái)重大突破。本文借助深度學(xué)習(xí)技術(shù),結(jié)合中文的特性,展開對(duì)手寫漢字字符和自然場(chǎng)景中文文本的識(shí)別研究,主要研究?jī)?nèi)容如下:(1)提出了一種基于多對(duì)比注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行手寫漢字字符識(shí)別。此方法對(duì)同一張輸入圖片學(xué)習(xí)多個(gè)注意力區(qū)域,并且在多個(gè)損失函數(shù)的監(jiān)督下,使模型的注意力能夠定位到字符有區(qū)分性的區(qū)域,同時(shí)讓同類字符定位到的這些區(qū)域特征盡量相似以減小手寫... 

【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:62 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于注意力機(jī)制的中文識(shí)別算法研究


印刷體漢字(左圖)與手寫體漢字(右圖)示例

文字,場(chǎng)景,文檔,示例


華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文圖 1.2 文檔文字(左圖)與自然場(chǎng)景文字(右圖)示例如圖1.2, 相比文檔文字的背景簡(jiǎn)單、字體單一,自然場(chǎng)景文字具有高度的復(fù)雜性和不確定性,主要表現(xiàn)在以下幾個(gè)方面:(1)自然場(chǎng)景文字背景復(fù)雜。場(chǎng)景文字可能出現(xiàn)在包含任何背景的圖像中,包括但不限于網(wǎng)絡(luò)截屏、路標(biāo)、廣告牌、玻璃,甚至懸在半空中的建筑物。尤其是一些干擾強(qiáng)、噪聲大的背景,如發(fā)光的廣告牌、透明的玻璃、以及包含類似文字的物體(如柵欄、草地等)的背景,使得區(qū)分文本與背景區(qū)域的難度大大增加。部分場(chǎng)景文字圖片難點(diǎn)示例如圖1.3所示。圖 1.3 自然場(chǎng)景文字難點(diǎn)示例2

自然場(chǎng)景,文字,難點(diǎn),示例


強(qiáng)、噪聲大的背景,如發(fā)光的廣告牌、透明的玻璃、以及包含類似文字的物體(如柵欄、草地等)的背景,使得區(qū)分文本與背景區(qū)域的難度大大增加。部分場(chǎng)景文字圖片難點(diǎn)示例如圖1.3所示。圖 1.3 自然場(chǎng)景文字難點(diǎn)示例2


本文編號(hào):3099337

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3099337.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c5390***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com