天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于EAST與ASTER的自然場(chǎng)景圖像中文本檢測(cè)與識(shí)別研究

發(fā)布時(shí)間:2021-08-31 15:12
  伴隨著互聯(lián)網(wǎng)時(shí)代的到來(lái),自然場(chǎng)景圖片的獲取與存儲(chǔ)越來(lái)越便捷,自然場(chǎng)景圖片記錄著人們的生活以及重要的信息。圖片中的文字蘊(yùn)含有豐富的語(yǔ)義信息,如何從自然場(chǎng)景圖像中準(zhǔn)確的提取出文字在視頻檢索、車(chē)牌識(shí)別、導(dǎo)航系統(tǒng)、工業(yè)生產(chǎn)自動(dòng)化等領(lǐng)域具有重要的應(yīng)用價(jià)值。不同于文檔圖像,自然場(chǎng)景圖像的背景復(fù)雜、圖片的清晰度差異大,文字區(qū)域的規(guī)則多樣化使得傳統(tǒng)的OCR技術(shù)無(wú)法應(yīng)用到自然場(chǎng)景中的文字識(shí)別上。近年來(lái)基于深度學(xué)習(xí)的技術(shù)滲透到各個(gè)應(yīng)用場(chǎng)景,本文結(jié)合現(xiàn)有流行的EAST文本檢測(cè)算法和ASTER文本識(shí)別技術(shù),對(duì)自然場(chǎng)景圖片中文字的提取進(jìn)行了研究。首先,針對(duì)感受野能力不足的問(wèn)題,本文實(shí)現(xiàn)了一種改進(jìn)的EAST文本檢測(cè)模型,該模型利用深度殘差網(wǎng)絡(luò)抓取更深層的圖像特征,特征融合前在輸出步長(zhǎng)為8和16的特征映射層后加入ASPP模塊進(jìn)行感受野的擴(kuò)張,接著通過(guò)雙線性上采樣到合適尺寸與淺層的特征映射串聯(lián)進(jìn)行特征融合,最后通過(guò)卷積輸出到輸出層。在網(wǎng)絡(luò)的訓(xùn)練上,本文修改了損失函數(shù)通過(guò)結(jié)合Focal Loss和Dice loss兩大損失函數(shù)進(jìn)行網(wǎng)絡(luò)的訓(xùn)練。通過(guò)在實(shí)驗(yàn)數(shù)據(jù)上的檢測(cè)證明該模型能很好地完成在自然場(chǎng)景下的文本檢測(cè)功能。然后,... 

【文章來(lái)源】:武漢郵電科學(xué)研究院湖北省

【文章頁(yè)數(shù)】:75 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于EAST與ASTER的自然場(chǎng)景圖像中文本檢測(cè)與識(shí)別研究


驗(yàn)證集上損失函數(shù)值

基于EAST與ASTER的自然場(chǎng)景圖像中文本檢測(cè)與識(shí)別研究


整流網(wǎng)絡(luò)實(shí)

基于EAST與ASTER的自然場(chǎng)景圖像中文本檢測(cè)與識(shí)別研究


ASTER與本文識(shí)別算法訓(xùn)練Loss下降過(guò)程

【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)EAST的自然場(chǎng)景文本定位算法[J]. 楊飚,杜曉宇.  計(jì)算機(jī)工程與應(yīng)用. 2019(18)
[2]卷積神經(jīng)網(wǎng)絡(luò)CNN算法在文本分類上的應(yīng)用研究[J]. 侯小培,高迎.  科技與創(chuàng)新. 2019(04)
[3]自然場(chǎng)景圖像中的文本檢測(cè)綜述[J]. 王潤(rùn)民,桑農(nóng),丁丁,陳杰,葉齊祥,高常鑫,劉麗.  自動(dòng)化學(xué)報(bào). 2018(12)
[4]復(fù)雜場(chǎng)景文本段識(shí)別[J]. 王孝男,張利,何思楠.  計(jì)算機(jī)應(yīng)用研究. 2019(09)
[5]卷積神經(jīng)網(wǎng)絡(luò)在車(chē)輛識(shí)別中的應(yīng)用[J]. 彭清,季桂樹(shù),謝林江,張少波.  計(jì)算機(jī)科學(xué)與探索. 2018(02)
[6]基于深度學(xué)習(xí)方法的復(fù)雜場(chǎng)景下車(chē)輛目標(biāo)檢測(cè)[J]. 宋煥生,張向清,鄭寶峰,嚴(yán)騰.  計(jì)算機(jī)應(yīng)用研究. 2018(04)
[7]卷積神經(jīng)網(wǎng)絡(luò)在印章編號(hào)識(shí)別中的應(yīng)用[J]. 陽(yáng)哲.  現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2016(04)

博士論文
[1]基于卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算機(jī)視覺(jué)關(guān)鍵技術(shù)研究[D]. 李彥冬.電子科技大學(xué) 2017
[2]面向不平衡數(shù)據(jù)的支持向量機(jī)分類方法研究[D]. 楊智明.哈爾濱工業(yè)大學(xué) 2009

碩士論文
[1]自然場(chǎng)景圖像中的文本檢測(cè)與識(shí)別技術(shù)研究[D]. 周鵬飛.西安理工大學(xué) 2019
[2]基于深度學(xué)習(xí)的自然場(chǎng)景文本檢測(cè)算法研究[D]. 張艾萱.北方工業(yè)大學(xué) 2019
[3]文本檢測(cè)模型在視頻場(chǎng)景中的字幕召回問(wèn)題研究[D]. 劉鈺濤.華中科技大學(xué) 2019
[4]復(fù)雜自然場(chǎng)景中文本檢測(cè)技術(shù)的研究[D]. 黃梅玲.南京郵電大學(xué) 2018
[5]基于深度學(xué)習(xí)的自然場(chǎng)景文本定位與識(shí)別研究[D]. 張平.西安電子科技大學(xué) 2018
[6]自然場(chǎng)景下的文本檢測(cè)算法研究[D]. 王志元.江西理工大學(xué) 2018
[7]基于深度學(xué)習(xí)的自然場(chǎng)景文本檢測(cè)與識(shí)別[D]. 方清.電子科技大學(xué) 2018
[8]基于卷積神經(jīng)網(wǎng)絡(luò)的ECG身份識(shí)別技術(shù)研究[D]. 徐雯靜.東北林業(yè)大學(xué) 2016
[9]自然場(chǎng)景中的文本檢測(cè)研究[D]. 劉可豹.北京交通大學(xué) 2015



本文編號(hào):3375116

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3375116.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶72801***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com