天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機應(yīng)用論文 >

基于2D注意力機制的不規(guī)則場景文本識別算法

發(fā)布時間:2021-07-03 00:57
  識別不規(guī)則場景文本是光學(xué)字符識別(OCR)問題中較為困難的子問題,該問題對學(xué)術(shù)界所提出的字符識別算法非常具有挑戰(zhàn)性。目前,工業(yè)上實際應(yīng)用的算法分為三類:將不規(guī)則場景文本通過薄板樣條函數(shù)插值(thin plate splines)成規(guī)則場景文本后,再進行識別,即由2D布局轉(zhuǎn)成1D布局;提取2D圖像特征,通過卷積神經(jīng)網(wǎng)絡(luò)和帶有循環(huán)注意力機制神經(jīng)網(wǎng)絡(luò),降維成1D特征序列,再進行識別;將2D圖像轉(zhuǎn)換為1D特征序列,然后通過從自然語言處理領(lǐng)域借鑒過來的聯(lián)結(jié)主義時間分類器(connectionist temporal classification)算法,進行識別。盡管上述方法取得了較好的表現(xiàn),但是準(zhǔn)確率和魯棒性仍然受限于2D到1D轉(zhuǎn)換過程中空間信息的丟失。本文將2D布局的不規(guī)則場景文本通過2D注意力機制,直接預(yù)測字符序列。本文提出將不規(guī)則場景文本識別分為2D特征提取模塊、關(guān)系注意力模塊和并行注意力模塊,共計三個模塊。其中,對于2D特征提取模塊,本文將在現(xiàn)有文本圖像2D特征提取算法的基礎(chǔ)上,進行算法改進,在獲取上下文語義信息的同時,保留2D空間信息,避免了2D到1D轉(zhuǎn)換過程中,空間信息的丟失,該部分... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:56 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于2D注意力機制的不規(guī)則場景文本識別算法


基于單個字符的識別方法

識別方法,單詞


基于單詞分類的識別方法

注意力機制,識別方法,文本識別,場景


圖 1-4 基于注意力機制的識別方法[14]場景文本識別,不規(guī)則場景文本識別也吸引了很多注意力,成為研究]等人提出用聯(lián)合的網(wǎng)絡(luò)去識別不規(guī)則場景文本。首先


本文編號:3261535

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3261535.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1cef5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com