基于稀疏表示與形態(tài)成分分析的場景圖像文本檢測方法研究
發(fā)布時(shí)間:2019-09-11 12:27
【摘要】:隨著互聯(lián)網(wǎng)和智能手機(jī)的快速發(fā)展,圖像和視頻數(shù)據(jù)急劇增加,圖像檢索和圖像分類成為計(jì)算機(jī)視覺領(lǐng)域中重要的研究點(diǎn)。由于圖像和視頻中往往含有大量的文本,這些文本攜帶的語意信息在圖像檢索和分類中很可能起著重要的作用,因而對于圖像中文字識別的研究成為一項(xiàng)重要的任務(wù)。對于場景圖像,文字識別的好壞嚴(yán)重依賴于文本區(qū)域的檢測,因而文本區(qū)域檢測技術(shù)也吸引了大量研究者的關(guān)注。場景圖像文本檢測受復(fù)雜背景、噪聲污染和文字的多種形態(tài)的干擾,檢測的準(zhǔn)確率偏低,漏檢誤檢的現(xiàn)象非常普遍。本文針對這些問題展開研究,主要完成了以下研究工作:(1)針對復(fù)雜背景與噪聲干擾的影響,本文做了相關(guān)研究,提出了基于稀疏表示與形態(tài)成分分析的場景圖像文本檢測的方法。該方法首先利用形態(tài)成分分析與稀疏表示的方法學(xué)習(xí)具有判別性的文字和背景字典,然后通過學(xué)習(xí)的字典重構(gòu)出待檢測圖像中的文字部分,最后在重構(gòu)的圖像上進(jìn)行文本檢測。該方法通過學(xué)習(xí)的過完備字典把文字檢測問題轉(zhuǎn)化成稀疏和魯棒表示的問題。(2)對于基于稀疏表示與形態(tài)成分分析的場景圖像文本檢測方法中字典學(xué)習(xí)速度慢及適應(yīng)能力不足的缺點(diǎn),本文提出了基于在線判別字典學(xué)習(xí)的場景圖像文本檢測方法。在線判別字典學(xué)習(xí)的方法每次更新字典時(shí)只隨機(jī)選擇一個訓(xùn)練樣本進(jìn)行訓(xùn)練,可以用于動態(tài)樣本庫的訓(xùn)練,與前一種字典學(xué)習(xí)方法相比較減少了字典學(xué)習(xí)的計(jì)算量并提高了字典的適應(yīng)性。(3)本文在公開數(shù)據(jù)庫ICDAR2003/2011/2013和MSRA-TD500上進(jìn)行實(shí)驗(yàn),結(jié)果表明,本文提出的方法與當(dāng)下流行的方法相比,對于場景圖像文本檢測問題具有較好的魯棒性,取得較高的準(zhǔn)確率和召回率;本文還對提出的兩種方法進(jìn)行對比,結(jié)果表明基于在線判別字典學(xué)習(xí)的文本檢測方法與第一種方法相比不管是在字典學(xué)習(xí)準(zhǔn)確率上還是在檢測效果方面,均取得了較好的結(jié)果。
【圖文】:
提出的方法中,單獨(dú)訓(xùn)練的兩個冗余字典即文字字典和背景字典,,其中,逡逑文字字典能夠稀疏地表示圖像中的文字部分,不能稀疏地表示圖像中的背景部分,逡逑反之亦然;方法流程如圖1.2所示,橘紅框中的流程圖表示字典學(xué)習(xí)流程,綠框逡逑中的內(nèi)容為稀疏系數(shù)求解流程,深紅框?yàn)槲谋緳z測流程圖。逡逑典-學(xué)7邐J邐j邐|逡逑_邋_邋^邐?
本文編號:2534413
【圖文】:
提出的方法中,單獨(dú)訓(xùn)練的兩個冗余字典即文字字典和背景字典,,其中,逡逑文字字典能夠稀疏地表示圖像中的文字部分,不能稀疏地表示圖像中的背景部分,逡逑反之亦然;方法流程如圖1.2所示,橘紅框中的流程圖表示字典學(xué)習(xí)流程,綠框逡逑中的內(nèi)容為稀疏系數(shù)求解流程,深紅框?yàn)槲谋緳z測流程圖。逡逑典-學(xué)7邐J邐j邐|逡逑_邋_邋^邐?
本文編號:2534413
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2534413.html
最近更新
教材專著