基于多任務(wù)級(jí)聯(lián)的場景文本檢測算法研究
發(fā)布時(shí)間:2023-03-24 21:32
文字是重要的信息傳遞載體,能表達(dá)高級(jí)語義信息,場景文本作為重要的表現(xiàn)形式在生活中大量出現(xiàn)。近年來,在學(xué)術(shù)界和工業(yè)界,場景文本檢測已成為理論研究和應(yīng)用的熱點(diǎn)。場景文本檢測是OCR的重要環(huán)節(jié),被廣泛地應(yīng)用于車牌檢測識(shí)別、卡證票據(jù)檢測識(shí)別、場景文本情感分析等。由于深度學(xué)習(xí)的發(fā)展,基于深度學(xué)習(xí)的方法在解決場景文本檢測問題中占據(jù)主要地位。但場景文本復(fù)雜,現(xiàn)有方法仍存在不足,例如尺度變化、種類多樣(不同語種和文本類型)、方向任意(多方向、彎曲等)、文本視覺特征雜亂(結(jié)構(gòu)共性少)等。針對以上問題,本文通過分析基于檢測和基于分割的場景文本檢測方法,建立兩種多任務(wù)級(jí)聯(lián)的場景文本檢測方案。上下文模塊與輔助回歸的方法主要用于解決多方向文本檢測問題。在場景文本特征提取和特征融合方面,主要利用上采樣特征融合方法,多分支上下文模塊等提取有鑒別力的圖像文本特征;在二次檢測框架中,該模塊有利于提取更好的候選區(qū)域;在多任務(wù)級(jí)聯(lián)方法上,主要結(jié)合坐標(biāo)對齊的場景文本檢測和實(shí)例分割的方法,增加基于中心點(diǎn)和角點(diǎn)的輔助回歸方法,改進(jìn)了一般的實(shí)例分割分支,提高了多方向文本檢測的準(zhǔn)確率。特征金字塔融合的場景文本檢測方法不僅能用于解決多...
【文章頁數(shù)】:61 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及研究的目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于手工特征的文本檢測
1.2.2 深度學(xué)習(xí)檢測方法
1.2.3 深度學(xué)習(xí)分割方法
1.3 本文的主要研究內(nèi)容
1.4 本文的組織結(jié)構(gòu)
第2章 上下文模塊與輔助回歸的多方向文本檢測
2.1 引言
2.2 特征提取網(wǎng)絡(luò)
2.3 上采樣特征融合
2.4 多分支上下文模塊
2.4.1 卷積核與特征提取
2.4.2 上下文模塊設(shè)計(jì)
2.5 基于二次檢測器的文本檢測網(wǎng)絡(luò)
2.5.1 RPN候選區(qū)域提取方法
2.5.2 文本目標(biāo)分類
2.5.3 文本目標(biāo)回歸
2.6 基于中心點(diǎn)與角點(diǎn)輔助回歸的掩膜分割分支
2.6.1 實(shí)例分割方法
2.6.2 輔助回歸方法
2.7 本章小結(jié)
第3章 特征金字塔融合的多方向及彎曲文本檢測
3.1 引言
3.2 基于特征金字塔的特征提取融合
3.2.1 特征金字塔網(wǎng)絡(luò)
3.2.2 候選文本目標(biāo)非極大抑制
3.2.3 候選文本目標(biāo)在線難例挖掘
3.2.4 同步批歸一化
3.2.5 文本區(qū)域后處理
3.3 實(shí)例分割的彎曲文本檢測
3.4 本章小結(jié)
第4章 實(shí)驗(yàn)結(jié)果及分析
4.1 引言
4.2 數(shù)據(jù)集及特點(diǎn)
4.3 模型選擇和訓(xùn)練
4.3.1 數(shù)據(jù)預(yù)處理方法
4.3.2 多方向文本檢測模型訓(xùn)練和測試
4.3.3 多方向及彎曲文本檢測模型訓(xùn)練和測試
4.4 實(shí)驗(yàn)結(jié)果及分析
4.4.1 評(píng)價(jià)指標(biāo)計(jì)算方法
4.4.2 特征融合方法對比實(shí)驗(yàn)
4.4.3 多方向文本檢測模型實(shí)驗(yàn)結(jié)果
4.4.4 多方向及彎曲文本檢測模型實(shí)驗(yàn)結(jié)果
4.5 模型對比分析
4.6 模型應(yīng)用場景分析
4.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3769885
【文章頁數(shù)】:61 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景及研究的目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于手工特征的文本檢測
1.2.2 深度學(xué)習(xí)檢測方法
1.2.3 深度學(xué)習(xí)分割方法
1.3 本文的主要研究內(nèi)容
1.4 本文的組織結(jié)構(gòu)
第2章 上下文模塊與輔助回歸的多方向文本檢測
2.1 引言
2.2 特征提取網(wǎng)絡(luò)
2.3 上采樣特征融合
2.4 多分支上下文模塊
2.4.1 卷積核與特征提取
2.4.2 上下文模塊設(shè)計(jì)
2.5 基于二次檢測器的文本檢測網(wǎng)絡(luò)
2.5.1 RPN候選區(qū)域提取方法
2.5.2 文本目標(biāo)分類
2.5.3 文本目標(biāo)回歸
2.6 基于中心點(diǎn)與角點(diǎn)輔助回歸的掩膜分割分支
2.6.1 實(shí)例分割方法
2.6.2 輔助回歸方法
2.7 本章小結(jié)
第3章 特征金字塔融合的多方向及彎曲文本檢測
3.1 引言
3.2 基于特征金字塔的特征提取融合
3.2.1 特征金字塔網(wǎng)絡(luò)
3.2.2 候選文本目標(biāo)非極大抑制
3.2.3 候選文本目標(biāo)在線難例挖掘
3.2.4 同步批歸一化
3.2.5 文本區(qū)域后處理
3.3 實(shí)例分割的彎曲文本檢測
3.4 本章小結(jié)
第4章 實(shí)驗(yàn)結(jié)果及分析
4.1 引言
4.2 數(shù)據(jù)集及特點(diǎn)
4.3 模型選擇和訓(xùn)練
4.3.1 數(shù)據(jù)預(yù)處理方法
4.3.2 多方向文本檢測模型訓(xùn)練和測試
4.3.3 多方向及彎曲文本檢測模型訓(xùn)練和測試
4.4 實(shí)驗(yàn)結(jié)果及分析
4.4.1 評(píng)價(jià)指標(biāo)計(jì)算方法
4.4.2 特征融合方法對比實(shí)驗(yàn)
4.4.3 多方向文本檢測模型實(shí)驗(yàn)結(jié)果
4.4.4 多方向及彎曲文本檢測模型實(shí)驗(yàn)結(jié)果
4.5 模型對比分析
4.6 模型應(yīng)用場景分析
4.7 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3769885
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3769885.html
最近更新
教材專著