天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于語(yǔ)義分割壓縮編碼的中文文本識(shí)別

發(fā)布時(shí)間:2021-10-18 07:40
  圖像文本識(shí)別作為環(huán)境感知型的一種計(jì)算機(jī)視覺(jué)任務(wù),廣泛用于自動(dòng)化紙質(zhì)文檔識(shí)別、自動(dòng)駕駛和場(chǎng)景語(yǔ)義理解等任務(wù)中。近些年,基于深度學(xué)習(xí)的文本識(shí)別方法逐漸成為研究人員關(guān)注的熱點(diǎn)。與傳統(tǒng)文本識(shí)別方法不同,現(xiàn)有主流的處理范式是將文本圖片視為一個(gè)整體,直接對(duì)圖片進(jìn)行特征提取,最后通過(guò)特征解碼得到文本識(shí)別的結(jié)果。然而,最近有研究表明上述方法在特征提取的過(guò)程中,會(huì)丟失字符的空間結(jié)構(gòu)信息。因此通過(guò)保留二維信息的一種基于語(yǔ)義分割的文本識(shí)別方法逐漸被研究人員所關(guān)注。由于中文文字類別較多,基于語(yǔ)義分割的文本識(shí)別方法在中文文本識(shí)別任務(wù)上存在模型空間占用大,模型訓(xùn)練速度慢等問(wèn)題。針對(duì)此問(wèn)題,本文提出通過(guò)壓縮語(yǔ)義分割的編碼空間,來(lái)減少模型空間占用。同時(shí)通過(guò)將中文字符結(jié)構(gòu)信息融入編碼,來(lái)增加編碼的語(yǔ)義信息。據(jù)調(diào)研,本文是首個(gè)在語(yǔ)義分割模型上使用非one-hot編碼的工作,因此為快速驗(yàn)證本文提出的編碼在語(yǔ)義分割模型上的可訓(xùn)練性,本課題選擇簡(jiǎn)單場(chǎng)景下的離線中文單字手寫體數(shù)據(jù)對(duì)編碼壓縮效果進(jìn)行驗(yàn)證。結(jié)果表明基于漢字結(jié)構(gòu)的分層編碼壓縮方式,既能有效的降低模型存儲(chǔ)空間,又達(dá)到了較高的識(shí)別準(zhǔn)確率。自然場(chǎng)景中,文本識(shí)別往往需要同時(shí)對(duì)... 

【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:59 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于語(yǔ)義分割壓縮編碼的中文文本識(shí)別


AlexNet網(wǎng)絡(luò)架構(gòu)[36]

架構(gòu)圖,架構(gòu),卷積,卷積核


哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文競(jìng)賽上設(shè)計(jì)了一種名為VGG[37]的網(wǎng)絡(luò)架構(gòu)。以VGG-16架構(gòu)為例,其中有5個(gè)卷積塊共16層卷積層,每個(gè)卷積層都使用3×3的卷積核,以及1×1的卷積步長(zhǎng)。與AlexNet相比,VGG-16在加深模型深度的同時(shí),也由于大量使用小卷積核的原因減少了模型整體的參數(shù)量。VGG-16的架構(gòu)如圖2-2所示。圖2-2VGG-16網(wǎng)絡(luò)架構(gòu)[37]VGG架構(gòu)證明了越深的模型越有可能獲得更好的識(shí)別效果,然而梯度消失或是梯度爆炸問(wèn)題使得深層網(wǎng)絡(luò)比較難以訓(xùn)練。因此,He等人[38]設(shè)計(jì)了一種名為ResNet的網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)在卷積塊之間增加跳躍連接的方式將上一層卷積層的輸出結(jié)果直接送入下一層卷積層來(lái)解決深層網(wǎng)絡(luò)的訓(xùn)練問(wèn)題。跳躍連接的結(jié)構(gòu)如圖2-3所示。通過(guò)跳躍連接,ResNet的模型層數(shù)可以更深,同時(shí)其參數(shù)量也比VGG-16更少,上述優(yōu)勢(shì)使ResNet成為大多數(shù)計(jì)算機(jī)視覺(jué)任務(wù)的骨架網(wǎng)絡(luò)。圖2-3跳躍連接結(jié)構(gòu)[38]研究人員除了通過(guò)增加網(wǎng)絡(luò)深度的方式來(lái)改進(jìn)模型之外,Christian等人[39]通過(guò)擴(kuò)展網(wǎng)絡(luò)的寬度設(shè)計(jì)了一種名為GoogLeNet的網(wǎng)絡(luò)結(jié)構(gòu)。inception作為GoogLeNet的基本組成結(jié)構(gòu),每個(gè)inception中包含了四種不同尺寸的卷積核,分別以不同大小的感受野來(lái)從輸入中提取特征,最后通過(guò)1×1卷積核將上述四種卷積核的輸出拼接在一起作為inception的輸出,其結(jié)構(gòu)如圖2-4所示。因?yàn)镚oogLeNet-8-

連接結(jié)構(gòu),卷積,卷積核


哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文競(jìng)賽上設(shè)計(jì)了一種名為VGG[37]的網(wǎng)絡(luò)架構(gòu)。以VGG-16架構(gòu)為例,其中有5個(gè)卷積塊共16層卷積層,每個(gè)卷積層都使用3×3的卷積核,以及1×1的卷積步長(zhǎng)。與AlexNet相比,VGG-16在加深模型深度的同時(shí),也由于大量使用小卷積核的原因減少了模型整體的參數(shù)量。VGG-16的架構(gòu)如圖2-2所示。圖2-2VGG-16網(wǎng)絡(luò)架構(gòu)[37]VGG架構(gòu)證明了越深的模型越有可能獲得更好的識(shí)別效果,然而梯度消失或是梯度爆炸問(wèn)題使得深層網(wǎng)絡(luò)比較難以訓(xùn)練。因此,He等人[38]設(shè)計(jì)了一種名為ResNet的網(wǎng)絡(luò)結(jié)構(gòu),通過(guò)在卷積塊之間增加跳躍連接的方式將上一層卷積層的輸出結(jié)果直接送入下一層卷積層來(lái)解決深層網(wǎng)絡(luò)的訓(xùn)練問(wèn)題。跳躍連接的結(jié)構(gòu)如圖2-3所示。通過(guò)跳躍連接,ResNet的模型層數(shù)可以更深,同時(shí)其參數(shù)量也比VGG-16更少,上述優(yōu)勢(shì)使ResNet成為大多數(shù)計(jì)算機(jī)視覺(jué)任務(wù)的骨架網(wǎng)絡(luò)。圖2-3跳躍連接結(jié)構(gòu)[38]研究人員除了通過(guò)增加網(wǎng)絡(luò)深度的方式來(lái)改進(jìn)模型之外,Christian等人[39]通過(guò)擴(kuò)展網(wǎng)絡(luò)的寬度設(shè)計(jì)了一種名為GoogLeNet的網(wǎng)絡(luò)結(jié)構(gòu)。inception作為GoogLeNet的基本組成結(jié)構(gòu),每個(gè)inception中包含了四種不同尺寸的卷積核,分別以不同大小的感受野來(lái)從輸入中提取特征,最后通過(guò)1×1卷積核將上述四種卷積核的輸出拼接在一起作為inception的輸出,其結(jié)構(gòu)如圖2-4所示。因?yàn)镚oogLeNet-8-


本文編號(hào):3442485

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3442485.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4b142***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com