改進(jìn)的超像素和Graph cuts的圖像分割方法研究
本文關(guān)鍵詞:改進(jìn)的超像素和Graph cuts的圖像分割方法研究
更多相關(guān)文章: 超像素 圖割 文本分割 自然場(chǎng)景
【摘要】:在自然圖像中存在大量的文本信息,如交通指示標(biāo)志,廣告宣傳牌,商家招牌,建筑物標(biāo)示,街道編號(hào)等,這些文本信息屬于高層視覺(jué)元素,為場(chǎng)景的理解、分析提供豐富而關(guān)鍵的線索,因此研究出一種自動(dòng)識(shí)別文本信息的工具,進(jìn)而對(duì)文本進(jìn)行后續(xù)的相關(guān)檢索、分析有重要意義?蓱(yīng)用于圖像檢索,智能監(jiān)控,盲人導(dǎo)航等領(lǐng)域。圖像分割作為計(jì)算機(jī)視覺(jué)領(lǐng)域基礎(chǔ)但是關(guān)鍵的一個(gè)步驟,實(shí)現(xiàn)文本的自動(dòng)識(shí)別自然離不開(kāi)對(duì)圖像中的文本進(jìn)行分割。自然場(chǎng)景圖像由于背景較為復(fù)雜,且圖像易受拍攝角度及光線的影響而產(chǎn)生變形、模糊、斷裂等現(xiàn)象,因此傳統(tǒng)的文檔分割技術(shù)應(yīng)用于復(fù)雜自然場(chǎng)景文本分割時(shí)效果不佳,更有效的針對(duì)復(fù)雜自然場(chǎng)景的文本分割技術(shù)仍是目前計(jì)算機(jī)視覺(jué)和文檔分析領(lǐng)域的研究熱點(diǎn)之一。本文針對(duì)復(fù)雜背景圖像中的文本分割進(jìn)行相關(guān)研究,主要工作有以下幾部分:受超像素這一概念的啟發(fā),為了減少圖像局部信息冗余,提高圖模型效率,本文用超像素區(qū)域代替像素點(diǎn)構(gòu)建加權(quán)圖模型。因此本文首先介紹了超像素這一新近概念的發(fā)展背景和歷史,通過(guò)梳理各種超像素的生成方法,評(píng)價(jià)其適用各種場(chǎng)景的優(yōu)缺點(diǎn)后,選擇出適用于本文的基于SLIC超像素生成算法并進(jìn)行適當(dāng)改進(jìn)。在簡(jiǎn)要介紹圖割基本原理的基礎(chǔ)上,分析能量函數(shù)的構(gòu)造,歸納出基于圖割的圖像分割步驟。其次,針對(duì)場(chǎng)景文本的復(fù)雜性,提出一種基于改進(jìn)的超像素和Graph Cuts的場(chǎng)景文本分割方法。該方法用預(yù)分割后的超像素代替像素點(diǎn)構(gòu)件圖模型,運(yùn)用兩種模型(GMMs模型和基于SVM的后驗(yàn)概率模型)代替單一GMMs模型構(gòu)建文本和背景模型,并采用EM算法自適應(yīng)學(xué)習(xí)GMMs模型的參數(shù)。最后在Matlab R2010軟件環(huán)境中使用實(shí)驗(yàn)室數(shù)據(jù)庫(kù)進(jìn)行了文本圖像分割測(cè)試,并結(jié)合使用光學(xué)字符識(shí)別軟件(OCR)對(duì)分割后的識(shí)別效果進(jìn)行實(shí)驗(yàn),結(jié)果表明:本文設(shè)計(jì)的算法可以獲得較好的分割效果,有一定的應(yīng)用價(jià)值。
【關(guān)鍵詞】:超像素 圖割 文本分割 自然場(chǎng)景
【學(xué)位授予單位】:山東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41
【目錄】:
- 摘要6-7
- ABSTRACT7-9
- 第一章 緒論9-19
- 1.1 課題背景和意義9-13
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀13-17
- 1.3 本文的主要工作17
- 1.4 本文的內(nèi)容安排17-19
- 第二章 超像素概念及算法發(fā)展19-34
- 2.1 常用超像素生成算法評(píng)價(jià)標(biāo)準(zhǔn)21-24
- 2.1.1 直觀角度評(píng)價(jià)標(biāo)準(zhǔn)21-22
- 2.1.2 定量評(píng)價(jià)標(biāo)準(zhǔn)22-24
- 2.2 幾種典型的超像素生成算法24-30
- 2.2.1 基于圖論的超像素分割算法24-28
- 2.2.2 基于梯度下降的超像素分割算法28-30
- 2.3 改進(jìn)的SLIC超像素生成算法30-33
- 2.3.1 紋理特征選取30
- 2.3.2 局部特征融合及超像素分割30-32
- 2.3.3 實(shí)驗(yàn)結(jié)果及分析32-33
- 2.4 本章小結(jié)33-34
- 第三章 圖割理論在圖像分割中的應(yīng)用34-42
- 3.1 圖割的基本理論34-37
- 3.1.1 圖的基本概念34-36
- 3.1.2 最大流/最小割定理36-37
- 3.2 基于Graph cuts的圖像分割原理37-40
- 3.2.1 圖的構(gòu)造37-38
- 3.2.2 能量函數(shù)的構(gòu)造38-40
- 3.3 基于圖割的圖像分割步驟40-41
- 3.4 本章小結(jié)41-42
- 第四章 改進(jìn)的超像素和Graph Cuts的自然圖像文本內(nèi)容的分割42-51
- 4.1 基于超像素區(qū)域的圖割模型42-47
- 4.1.1 區(qū)域代價(jià)函數(shù)的定義43-46
- 4.1.2 鄰域代價(jià)函數(shù)的定義46-47
- 4.1.3 本文算法步驟47
- 4.2 實(shí)驗(yàn)結(jié)果及分析47-50
- 4.3 本章小結(jié)50-51
- 第五章 總結(jié)與展望51-53
- 5.1 工作總結(jié)51
- 5.2 研究展望51-53
- 參考文獻(xiàn)53-56
- 攻讀碩士學(xué)位期間的論文發(fā)表情況56-57
- 致謝57
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前9條
1 邱娟;謝昊;張傳林;;基于優(yōu)化Gabor濾波器和GMRF的筆跡特征提取方法[J];計(jì)算機(jī)工程與應(yīng)用;2015年17期
2 王春瑤;陳俊周;李煒;;超像素分割算法研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2014年01期
3 劉毅;黃兵;孫懷江;夏德深;;結(jié)合CS-LBP紋理特征的快速圖割算法[J];計(jì)算機(jī)科學(xué);2013年05期
4 曾巒;顧大龍;;一種基于扇形區(qū)域分割的SIFT特征描述符[J];自動(dòng)化學(xué)報(bào);2012年09期
5 鐘金琴;辜麗川;檀結(jié)慶;李瑩瑩;;基于分裂EM算法的GMM參數(shù)估計(jì)[J];計(jì)算機(jī)工程與應(yīng)用;2012年34期
6 陳樹(shù)越;張世林;;基于灰度差分和二維最大熵閾值的新聞字幕檢測(cè)[J];計(jì)算機(jī)應(yīng)用研究;2011年08期
7 韓守東;趙勇;陶文兵;桑農(nóng);;基于高斯超像素的快速Graph Cuts圖像分割方法[J];自動(dòng)化學(xué)報(bào);2011年01期
8 李敏花;王春恒;肖柏華;柏猛;;一種基于條件隨機(jī)場(chǎng)的復(fù)雜背景圖像文本抽取方法[J];模式識(shí)別與人工智能;2009年06期
9 王歡良;韓紀(jì)慶;鄭鐵然;;高斯混合分布之間K-L散度的近似計(jì)算[J];自動(dòng)化學(xué)報(bào);2008年05期
,本文編號(hào):590091
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/590091.html