自然場(chǎng)景圖像下文本檢測(cè)的研究
發(fā)布時(shí)間:2023-02-19 13:55
自然場(chǎng)景圖像中的文本可以簡(jiǎn)潔地表達(dá)豐富的信息,幫助人們更好地理解場(chǎng)景,因此對(duì)自然場(chǎng)景圖像進(jìn)行文本檢測(cè)是一項(xiàng)非常有價(jià)值的研究課題。本文以ICDAR-2013的聚焦場(chǎng)景數(shù)據(jù)集以及ICDAR-2015的偶然場(chǎng)景數(shù)據(jù)集為研究對(duì)象,分別對(duì)基于最大穩(wěn)定極值區(qū)域的文本檢測(cè)算法和基于深度學(xué)習(xí)的文本檢測(cè)算法進(jìn)行了研究,論文的主要工作如下:首先,針對(duì)基于最大穩(wěn)定極值區(qū)域的文本檢測(cè)算法中,支持向量機(jī)結(jié)合方向梯度直方圖特征對(duì)候選字符區(qū)域分類精度不夠的問(wèn)題,提出基于最大穩(wěn)定極值區(qū)域與殘差網(wǎng)絡(luò)結(jié)合的文本檢測(cè)算法,使用殘差網(wǎng)絡(luò)ResNet-18對(duì)候選字符區(qū)域進(jìn)行分類,取得了更好的字符分類精度和文本檢測(cè)結(jié)果。其次,針對(duì)文本區(qū)域是任意四邊形描述,使得通用目標(biāo)檢測(cè)網(wǎng)絡(luò)single shot d etector的學(xué)習(xí)方法不再適合文本檢測(cè)任務(wù)的問(wèn)題,使用頂點(diǎn)回歸的學(xué)習(xí)方法直接預(yù)測(cè)默認(rèn)框四個(gè)頂點(diǎn)坐標(biāo)的絕對(duì)差量,并提出基于曼哈頓距離的區(qū)域空間相似度度量方法將網(wǎng)絡(luò)訓(xùn)練迭代一次消耗在正負(fù)默認(rèn)框判斷上的時(shí)間由1分30秒減少到0.1秒,大幅提高了網(wǎng)絡(luò)訓(xùn)練效率和文本檢測(cè)的精度。然后,針對(duì)基于頂點(diǎn)回歸與曼哈頓距離度量的文本檢測(cè)網(wǎng)絡(luò)對(duì)豎向文本...
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 論文的主要工作
1.4 論文的組織結(jié)構(gòu)
2 基于最大穩(wěn)定極值區(qū)域與殘差網(wǎng)絡(luò)的文本檢測(cè)算法
2.1 引言
2.2 基于最大穩(wěn)定極值區(qū)域與殘差網(wǎng)絡(luò)的文本檢測(cè)算法
2.3 實(shí)驗(yàn)結(jié)果與分析
2.4 本章小結(jié)
3 基于頂點(diǎn)回歸與曼哈頓距離度量的文本檢測(cè)網(wǎng)絡(luò)
3.1 引言
3.2 基于頂點(diǎn)回歸與曼哈頓距離度量的文本檢測(cè)網(wǎng)絡(luò)
3.3 實(shí)驗(yàn)結(jié)果與分析
3.4 本章小結(jié)
4 基于多核旋轉(zhuǎn)模塊的文本檢測(cè)網(wǎng)絡(luò)
4.1 引言
4.2 基于多核旋轉(zhuǎn)模塊的文本檢測(cè)網(wǎng)絡(luò)
4.3 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
5 基于多任務(wù)學(xué)習(xí)的文本檢測(cè)網(wǎng)絡(luò)
5.1 引言
5.2 基于多任務(wù)學(xué)習(xí)的文本檢測(cè)網(wǎng)絡(luò)
5.3 實(shí)驗(yàn)結(jié)果與分析
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
致謝
參考文獻(xiàn)
發(fā)表論文和參加科研情況說(shuō)明
本文編號(hào):3746346
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 論文的主要工作
1.4 論文的組織結(jié)構(gòu)
2 基于最大穩(wěn)定極值區(qū)域與殘差網(wǎng)絡(luò)的文本檢測(cè)算法
2.1 引言
2.2 基于最大穩(wěn)定極值區(qū)域與殘差網(wǎng)絡(luò)的文本檢測(cè)算法
2.3 實(shí)驗(yàn)結(jié)果與分析
2.4 本章小結(jié)
3 基于頂點(diǎn)回歸與曼哈頓距離度量的文本檢測(cè)網(wǎng)絡(luò)
3.1 引言
3.2 基于頂點(diǎn)回歸與曼哈頓距離度量的文本檢測(cè)網(wǎng)絡(luò)
3.3 實(shí)驗(yàn)結(jié)果與分析
3.4 本章小結(jié)
4 基于多核旋轉(zhuǎn)模塊的文本檢測(cè)網(wǎng)絡(luò)
4.1 引言
4.2 基于多核旋轉(zhuǎn)模塊的文本檢測(cè)網(wǎng)絡(luò)
4.3 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
5 基于多任務(wù)學(xué)習(xí)的文本檢測(cè)網(wǎng)絡(luò)
5.1 引言
5.2 基于多任務(wù)學(xué)習(xí)的文本檢測(cè)網(wǎng)絡(luò)
5.3 實(shí)驗(yàn)結(jié)果與分析
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
致謝
參考文獻(xiàn)
發(fā)表論文和參加科研情況說(shuō)明
本文編號(hào):3746346
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3746346.html
最近更新
教材專著