基于稀疏表示與形態(tài)成分分析的場(chǎng)景圖像文本檢測(cè)方法研究
發(fā)布時(shí)間:2019-09-11 12:27
【摘要】:隨著互聯(lián)網(wǎng)和智能手機(jī)的快速發(fā)展,圖像和視頻數(shù)據(jù)急劇增加,圖像檢索和圖像分類(lèi)成為計(jì)算機(jī)視覺(jué)領(lǐng)域中重要的研究點(diǎn)。由于圖像和視頻中往往含有大量的文本,這些文本攜帶的語(yǔ)意信息在圖像檢索和分類(lèi)中很可能起著重要的作用,因而對(duì)于圖像中文字識(shí)別的研究成為一項(xiàng)重要的任務(wù)。對(duì)于場(chǎng)景圖像,文字識(shí)別的好壞嚴(yán)重依賴(lài)于文本區(qū)域的檢測(cè),因而文本區(qū)域檢測(cè)技術(shù)也吸引了大量研究者的關(guān)注。場(chǎng)景圖像文本檢測(cè)受復(fù)雜背景、噪聲污染和文字的多種形態(tài)的干擾,檢測(cè)的準(zhǔn)確率偏低,漏檢誤檢的現(xiàn)象非常普遍。本文針對(duì)這些問(wèn)題展開(kāi)研究,主要完成了以下研究工作:(1)針對(duì)復(fù)雜背景與噪聲干擾的影響,本文做了相關(guān)研究,提出了基于稀疏表示與形態(tài)成分分析的場(chǎng)景圖像文本檢測(cè)的方法。該方法首先利用形態(tài)成分分析與稀疏表示的方法學(xué)習(xí)具有判別性的文字和背景字典,然后通過(guò)學(xué)習(xí)的字典重構(gòu)出待檢測(cè)圖像中的文字部分,最后在重構(gòu)的圖像上進(jìn)行文本檢測(cè)。該方法通過(guò)學(xué)習(xí)的過(guò)完備字典把文字檢測(cè)問(wèn)題轉(zhuǎn)化成稀疏和魯棒表示的問(wèn)題。(2)對(duì)于基于稀疏表示與形態(tài)成分分析的場(chǎng)景圖像文本檢測(cè)方法中字典學(xué)習(xí)速度慢及適應(yīng)能力不足的缺點(diǎn),本文提出了基于在線判別字典學(xué)習(xí)的場(chǎng)景圖像文本檢測(cè)方法。在線判別字典學(xué)習(xí)的方法每次更新字典時(shí)只隨機(jī)選擇一個(gè)訓(xùn)練樣本進(jìn)行訓(xùn)練,可以用于動(dòng)態(tài)樣本庫(kù)的訓(xùn)練,與前一種字典學(xué)習(xí)方法相比較減少了字典學(xué)習(xí)的計(jì)算量并提高了字典的適應(yīng)性。(3)本文在公開(kāi)數(shù)據(jù)庫(kù)ICDAR2003/2011/2013和MSRA-TD500上進(jìn)行實(shí)驗(yàn),結(jié)果表明,本文提出的方法與當(dāng)下流行的方法相比,對(duì)于場(chǎng)景圖像文本檢測(cè)問(wèn)題具有較好的魯棒性,取得較高的準(zhǔn)確率和召回率;本文還對(duì)提出的兩種方法進(jìn)行對(duì)比,結(jié)果表明基于在線判別字典學(xué)習(xí)的文本檢測(cè)方法與第一種方法相比不管是在字典學(xué)習(xí)準(zhǔn)確率上還是在檢測(cè)效果方面,均取得了較好的結(jié)果。
【圖文】:
提出的方法中,單獨(dú)訓(xùn)練的兩個(gè)冗余字典即文字字典和背景字典,,其中,逡逑文字字典能夠稀疏地表示圖像中的文字部分,不能稀疏地表示圖像中的背景部分,逡逑反之亦然;方法流程如圖1.2所示,橘紅框中的流程圖表示字典學(xué)習(xí)流程,綠框逡逑中的內(nèi)容為稀疏系數(shù)求解流程,深紅框?yàn)槲谋緳z測(cè)流程圖。逡逑典-學(xué)7邐J邐j邐|逡逑_邋_邋^邐?
本文編號(hào):2534413
【圖文】:
提出的方法中,單獨(dú)訓(xùn)練的兩個(gè)冗余字典即文字字典和背景字典,,其中,逡逑文字字典能夠稀疏地表示圖像中的文字部分,不能稀疏地表示圖像中的背景部分,逡逑反之亦然;方法流程如圖1.2所示,橘紅框中的流程圖表示字典學(xué)習(xí)流程,綠框逡逑中的內(nèi)容為稀疏系數(shù)求解流程,深紅框?yàn)槲谋緳z測(cè)流程圖。逡逑典-學(xué)7邐J邐j邐|逡逑_邋_邋^邐?
本文編號(hào):2534413
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2534413.html
最近更新
教材專(zhuān)著