基于深度卷積神經(jīng)網(wǎng)絡(luò)的不規(guī)則形狀文字行檢測方法研究
發(fā)布時間:2021-01-02 00:14
基于場景圖像的自動文字檢測是光學字符識別系統(tǒng)的第一步,是光學字符識別系統(tǒng)可以應(yīng)用于各行各業(yè)的重要保證。自然場景文字檢測技術(shù)已經(jīng)成為計算機視覺和模式識別領(lǐng)域的研究熱點,在日常生活和工作中如場景理解、產(chǎn)品檢索、自動駕駛、地圖制作、圖像視頻監(jiān)控和文檔檢索系統(tǒng)等領(lǐng)域都有著廣泛的應(yīng)用,給人們的生活和工作提供了極大的便利。此外,隨著大數(shù)據(jù)的爆發(fā)和計算機計算能力的提高,深度學習得到了快速的發(fā)展,并從學術(shù)研究領(lǐng)域迅速落地到工業(yè)界。深度學習的優(yōu)勢是不需要手工設(shè)計特定任務(wù)的特征,可以根據(jù)任務(wù)自動的從大量數(shù)據(jù)中學習特征,同時學到的特征有較好的魯棒性和識別性能。由于深度學習具有上述優(yōu)勢,因此基于深度學習的場景文字檢測方法取得了很大的進步,對于形狀和長度比較規(guī)則的場景文字已經(jīng)取得了不錯的檢測效果。但是由于卷積神經(jīng)網(wǎng)絡(luò)的感受野以及矩形框、四邊形等簡單的文字目標表達方式的限制,過去的場景文字行檢測方法在遇到很長的文字行和不規(guī)則形狀的文字行時,其檢測性能還不夠好,極端場景的文字檢測還存在不少挑戰(zhàn)。為了解決以上問題,本文針對性地設(shè)計了一個原創(chuàng)的文字檢測器,該檢測器包括了一個初級文字檢測器、一個迭代修正模塊和一個形狀表達...
【文章來源】:廈門大學福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【部分圖文】:
圖1.1文字行檢測中遇到的兩種挑戰(zhàn)
對稱鄰城漣波字符提取算法流程
圖2.3基于RGB-D的字符提取算法流程丨圳
【參考文獻】:
期刊論文
[1]一種基于SWT面向RGB-D圖像的高效字符檢測算法[J]. 宋云濤,劉燁,王源彬,陳雁秋. 微型電腦應(yīng)用. 2015(09)
[2]復(fù)雜彩色圖像中的字符提取算法[J]. 劉新星,汪增福. 模式識別與人工智能. 2006(06)
本文編號:2952262
【文章來源】:廈門大學福建省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【部分圖文】:
圖1.1文字行檢測中遇到的兩種挑戰(zhàn)
對稱鄰城漣波字符提取算法流程
圖2.3基于RGB-D的字符提取算法流程丨圳
【參考文獻】:
期刊論文
[1]一種基于SWT面向RGB-D圖像的高效字符檢測算法[J]. 宋云濤,劉燁,王源彬,陳雁秋. 微型電腦應(yīng)用. 2015(09)
[2]復(fù)雜彩色圖像中的字符提取算法[J]. 劉新星,汪增福. 模式識別與人工智能. 2006(06)
本文編號:2952262
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2952262.html
最近更新
教材專著