自然場(chǎng)景文字鑒別和檢測(cè)算法研究
發(fā)布時(shí)間:2021-10-12 11:33
隨著多媒體信息時(shí)代的來(lái)臨,每天都會(huì)有各種各樣的信息在大量產(chǎn)生并傳播,而文字則是這些信息最重要的載體之一。因此,能夠有效地檢測(cè)到在自然場(chǎng)景條件下的文字,對(duì)于計(jì)算機(jī)理解圖像中包含的高層語(yǔ)義信息十分重要,具有巨大的研究和應(yīng)用價(jià)值。自然場(chǎng)景文字檢測(cè)在車輛自動(dòng)駕駛、智能導(dǎo)航、可視化交互、智能機(jī)器人等諸多應(yīng)用場(chǎng)景有著廣闊的前景和需求。目前,雖有大量算法應(yīng)用于自然場(chǎng)景文字檢測(cè),但是大多數(shù)算法模型基于傳統(tǒng)的人工設(shè)計(jì)特征和淺層模型,往往無(wú)法有效地學(xué)習(xí)到高層的語(yǔ)義特征并很好地對(duì)它們之間的關(guān)系進(jìn)行建模。隨著深度學(xué)習(xí)(Deep Learning)的提出和廣泛應(yīng)用,得益于深度卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的自動(dòng)學(xué)習(xí)特征能力和特征建模能力,深度學(xué)習(xí)在很多領(lǐng)域取得了成功,學(xué)術(shù)界與工業(yè)界開(kāi)始著手將深度學(xué)習(xí)應(yīng)用到自然場(chǎng)景文字檢測(cè)算法里。本文針對(duì)自然場(chǎng)景下的文字所具有的幾種特性如:尺寸變化大、寬高比例變化大、背景復(fù)雜易混淆、圖片模糊、變形、光照不足等,以及根據(jù)現(xiàn)有算法模型的不足,在已有的相關(guān)理論和技術(shù)的基礎(chǔ)上,提出與構(gòu)建了一個(gè)基于深度卷積神經(jīng)網(wǎng)絡(luò)的自然場(chǎng)景下文字檢測(cè)系統(tǒng),并用實(shí)驗(yàn)對(duì)模型的文字檢測(cè)效果進(jìn)行驗(yàn)證。本文的主要工作包括以下幾個(gè)...
【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:93 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文提出的文字檢測(cè)系統(tǒng)總體流程圖
圖 2-2 Faster RCNN 算法流程示意圖[39]出使得物體檢測(cè)任務(wù)進(jìn)入了端到端的時(shí)代,時(shí) RPN 的提出使得網(wǎng)絡(luò)能夠在幾乎不花費(fèi)取物體候選框,大大提升了物體檢測(cè)算法的迅速成為最為流行的物體檢測(cè)算法框架之一檢測(cè)算法的檢測(cè)效果非常好,然而由于其為N 提取區(qū)域候選框和候選框的分類回歸兩階以做到實(shí)時(shí)檢測(cè)。而 SSD 作為一階段(On的同時(shí),很好地解決了物體檢測(cè)算法檢測(cè)速
圖 2-4 YOLO 算法檢測(cè)結(jié)果生成示意圖[41]雖然檢測(cè)速度很快,但 YOLO 也有其缺點(diǎn),一般來(lái)說(shuō),YOLO 對(duì)于尺寸較的效果較差,對(duì)于寬高比例不尋常的物體泛化能力不夠強(qiáng),并且定位也不夠體檢測(cè)算法準(zhǔn)確。 自然場(chǎng)景文字檢測(cè)算法相關(guān)工作在本章中,首先會(huì)對(duì)自然場(chǎng)景文字檢測(cè)任務(wù)作總體的概述,介紹該任務(wù)的定價(jià)值和需要達(dá)到的目標(biāo)。然后對(duì)學(xué)術(shù)界為研究相關(guān)問(wèn)題所提出的數(shù)據(jù)集進(jìn)介紹。最后闡述該領(lǐng)域近年來(lái)提出的一些最新研究成果并介紹其中的典型算.1 任務(wù)概述在早期階段,OCR 的概念被定義為將印刷體的字符從紙質(zhì)文檔中識(shí)別出來(lái)發(fā)展至今,識(shí)字,已不再僅限于識(shí)別書(shū)本上的文字,而是要識(shí)別真實(shí)世界開(kāi)
【參考文獻(xiàn)】:
期刊論文
[1]《新一代人工智能發(fā)展規(guī)劃》解讀[J]. 陳震. 科學(xué)中國(guó)人. 2017(30)
碩士論文
[1]自然場(chǎng)景文字檢測(cè)方法研究[D]. 徐海良.南京大學(xué) 2016
本文編號(hào):3432497
【文章來(lái)源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:93 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文提出的文字檢測(cè)系統(tǒng)總體流程圖
圖 2-2 Faster RCNN 算法流程示意圖[39]出使得物體檢測(cè)任務(wù)進(jìn)入了端到端的時(shí)代,時(shí) RPN 的提出使得網(wǎng)絡(luò)能夠在幾乎不花費(fèi)取物體候選框,大大提升了物體檢測(cè)算法的迅速成為最為流行的物體檢測(cè)算法框架之一檢測(cè)算法的檢測(cè)效果非常好,然而由于其為N 提取區(qū)域候選框和候選框的分類回歸兩階以做到實(shí)時(shí)檢測(cè)。而 SSD 作為一階段(On的同時(shí),很好地解決了物體檢測(cè)算法檢測(cè)速
圖 2-4 YOLO 算法檢測(cè)結(jié)果生成示意圖[41]雖然檢測(cè)速度很快,但 YOLO 也有其缺點(diǎn),一般來(lái)說(shuō),YOLO 對(duì)于尺寸較的效果較差,對(duì)于寬高比例不尋常的物體泛化能力不夠強(qiáng),并且定位也不夠體檢測(cè)算法準(zhǔn)確。 自然場(chǎng)景文字檢測(cè)算法相關(guān)工作在本章中,首先會(huì)對(duì)自然場(chǎng)景文字檢測(cè)任務(wù)作總體的概述,介紹該任務(wù)的定價(jià)值和需要達(dá)到的目標(biāo)。然后對(duì)學(xué)術(shù)界為研究相關(guān)問(wèn)題所提出的數(shù)據(jù)集進(jìn)介紹。最后闡述該領(lǐng)域近年來(lái)提出的一些最新研究成果并介紹其中的典型算.1 任務(wù)概述在早期階段,OCR 的概念被定義為將印刷體的字符從紙質(zhì)文檔中識(shí)別出來(lái)發(fā)展至今,識(shí)字,已不再僅限于識(shí)別書(shū)本上的文字,而是要識(shí)別真實(shí)世界開(kāi)
【參考文獻(xiàn)】:
期刊論文
[1]《新一代人工智能發(fā)展規(guī)劃》解讀[J]. 陳震. 科學(xué)中國(guó)人. 2017(30)
碩士論文
[1]自然場(chǎng)景文字檢測(cè)方法研究[D]. 徐海良.南京大學(xué) 2016
本文編號(hào):3432497
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3432497.html
最近更新
教材專著