課程學(xué)習(xí)在場(chǎng)景文字識(shí)別任務(wù)中的應(yīng)用研究
發(fā)布時(shí)間:2021-04-18 14:29
場(chǎng)景文字識(shí)別一直是一個(gè)極具挑戰(zhàn)性的問題,理解場(chǎng)景文字的內(nèi)容在交通,社交,定位等領(lǐng)域都有著巨大的應(yīng)用價(jià)值,已然成為當(dāng)前研究的熱點(diǎn)。但是由于場(chǎng)景文字識(shí)別不同于傳統(tǒng)意義上的文檔文字識(shí)別,文字表現(xiàn)形式豐富,存在著遮擋、彎曲、藝術(shù)字等問題嚴(yán)重影響到模型對(duì)字符特征的準(zhǔn)確提取,識(shí)別率始終不盡人意。為了得到字符識(shí)別率更高的深度學(xué)習(xí)模型,人們采用去改變模型的網(wǎng)絡(luò)結(jié)構(gòu)、損失函數(shù),對(duì)圖片中扭曲的字符進(jìn)行修正等等方式。但不同于以往的工作,本文采用分類問題中取得顯著成果的課程學(xué)習(xí)方法,改變?cè)须S機(jī)從數(shù)據(jù)集中選取樣本訓(xùn)練的方式,以難度提升的樣本順序訓(xùn)練模型,提升了當(dāng)前主流場(chǎng)景文字識(shí)別算法的效果。與傳統(tǒng)的訓(xùn)練方式相比,使用課程學(xué)習(xí)方法訓(xùn)練場(chǎng)景文字識(shí)別模型,可以使得模型在訓(xùn)練初期學(xué)習(xí)到更加精確的特征,加快了模型的收斂速度,并且最終在測(cè)試集上得到更高的字符識(shí)別準(zhǔn)確率。使用課程學(xué)習(xí)方法,需要解決兩個(gè)問題:如何定義數(shù)據(jù)集樣本的難度,在得到數(shù)據(jù)集樣本的難度后如何訓(xùn)練模型。圍繞這兩個(gè)關(guān)鍵問題,本文主要工作如下:(1)提出了使用預(yù)訓(xùn)練模型定義場(chǎng)景文字圖片難度的辦法,并對(duì)比使用不同數(shù)據(jù)集子集參數(shù)配置訓(xùn)練模型的結(jié)果。該方法首先對(duì)Sy...
【文章來(lái)源】:河南大學(xué)河南省
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
卷積操作示意圖
第2章相關(guān)工作9圖2-2池化操作示意圖假設(shè)池化層輸入圖像尺寸為W×H,其中W為圖像的寬,H為圖像的高,池化卷積核的尺寸為(F×F),S為步長(zhǎng),那么經(jīng)過池化操作后的圖像寬高大小計(jì)算公式如(2-3)所示。()()1WHFWHS(2-3)2.1.3全鏈接層全鏈接層通常處于卷積神經(jīng)網(wǎng)絡(luò)的最后一層,其作用是對(duì)于前部網(wǎng)絡(luò)提取的特征進(jìn)行加權(quán)處理。全連接層的結(jié)構(gòu)就如同它名命名一般,會(huì)將本層的神經(jīng)元與前一層的所有神經(jīng)元相連,這也意味著全鏈接這種結(jié)構(gòu)將具有最多的參數(shù),與此同時(shí)也占用更多的內(nèi)存空間。假設(shè)我們把卷積層、激活函數(shù)、池化層的作用理解為將原始數(shù)據(jù)映射到隱層特征空間,那么全鏈接層的意義是在于將提取的特征映射到樣本標(biāo)記空間。簡(jiǎn)單全鏈接層網(wǎng)絡(luò)結(jié)構(gòu)示意如圖(2-3)所示。圖2-3全鏈接網(wǎng)絡(luò)示意圖
第2章相關(guān)工作9圖2-2池化操作示意圖假設(shè)池化層輸入圖像尺寸為W×H,其中W為圖像的寬,H為圖像的高,池化卷積核的尺寸為(F×F),S為步長(zhǎng),那么經(jīng)過池化操作后的圖像寬高大小計(jì)算公式如(2-3)所示。()()1WHFWHS(2-3)2.1.3全鏈接層全鏈接層通常處于卷積神經(jīng)網(wǎng)絡(luò)的最后一層,其作用是對(duì)于前部網(wǎng)絡(luò)提取的特征進(jìn)行加權(quán)處理。全連接層的結(jié)構(gòu)就如同它名命名一般,會(huì)將本層的神經(jīng)元與前一層的所有神經(jīng)元相連,這也意味著全鏈接這種結(jié)構(gòu)將具有最多的參數(shù),與此同時(shí)也占用更多的內(nèi)存空間。假設(shè)我們把卷積層、激活函數(shù)、池化層的作用理解為將原始數(shù)據(jù)映射到隱層特征空間,那么全鏈接層的意義是在于將提取的特征映射到樣本標(biāo)記空間。簡(jiǎn)單全鏈接層網(wǎng)絡(luò)結(jié)構(gòu)示意如圖(2-3)所示。圖2-3全鏈接網(wǎng)絡(luò)示意圖
本文編號(hào):3145634
【文章來(lái)源】:河南大學(xué)河南省
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
卷積操作示意圖
第2章相關(guān)工作9圖2-2池化操作示意圖假設(shè)池化層輸入圖像尺寸為W×H,其中W為圖像的寬,H為圖像的高,池化卷積核的尺寸為(F×F),S為步長(zhǎng),那么經(jīng)過池化操作后的圖像寬高大小計(jì)算公式如(2-3)所示。()()1WHFWHS(2-3)2.1.3全鏈接層全鏈接層通常處于卷積神經(jīng)網(wǎng)絡(luò)的最后一層,其作用是對(duì)于前部網(wǎng)絡(luò)提取的特征進(jìn)行加權(quán)處理。全連接層的結(jié)構(gòu)就如同它名命名一般,會(huì)將本層的神經(jīng)元與前一層的所有神經(jīng)元相連,這也意味著全鏈接這種結(jié)構(gòu)將具有最多的參數(shù),與此同時(shí)也占用更多的內(nèi)存空間。假設(shè)我們把卷積層、激活函數(shù)、池化層的作用理解為將原始數(shù)據(jù)映射到隱層特征空間,那么全鏈接層的意義是在于將提取的特征映射到樣本標(biāo)記空間。簡(jiǎn)單全鏈接層網(wǎng)絡(luò)結(jié)構(gòu)示意如圖(2-3)所示。圖2-3全鏈接網(wǎng)絡(luò)示意圖
第2章相關(guān)工作9圖2-2池化操作示意圖假設(shè)池化層輸入圖像尺寸為W×H,其中W為圖像的寬,H為圖像的高,池化卷積核的尺寸為(F×F),S為步長(zhǎng),那么經(jīng)過池化操作后的圖像寬高大小計(jì)算公式如(2-3)所示。()()1WHFWHS(2-3)2.1.3全鏈接層全鏈接層通常處于卷積神經(jīng)網(wǎng)絡(luò)的最后一層,其作用是對(duì)于前部網(wǎng)絡(luò)提取的特征進(jìn)行加權(quán)處理。全連接層的結(jié)構(gòu)就如同它名命名一般,會(huì)將本層的神經(jīng)元與前一層的所有神經(jīng)元相連,這也意味著全鏈接這種結(jié)構(gòu)將具有最多的參數(shù),與此同時(shí)也占用更多的內(nèi)存空間。假設(shè)我們把卷積層、激活函數(shù)、池化層的作用理解為將原始數(shù)據(jù)映射到隱層特征空間,那么全鏈接層的意義是在于將提取的特征映射到樣本標(biāo)記空間。簡(jiǎn)單全鏈接層網(wǎng)絡(luò)結(jié)構(gòu)示意如圖(2-3)所示。圖2-3全鏈接網(wǎng)絡(luò)示意圖
本文編號(hào):3145634
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3145634.html
最近更新
教材專著