基于PCA_SIFT在圖像檢索上改進(jìn)算法的研究
第 1 章 緒論
1.1 研究背景
近年來(lái),隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展、Internet 的廣泛普及和大容量存儲(chǔ)器的迅猛發(fā)展,多媒體技術(shù)、計(jì)算機(jī)視覺(jué)也得以廣泛的應(yīng)用[1], 電子掃描儀、數(shù)字相機(jī)等的普及使得數(shù)字圖片信息迅猛增加[2],數(shù)字圖像的應(yīng)用包含了國(guó)防軍工、工業(yè)制造、交通運(yùn)輸、醫(yī)療衛(wèi)生、日常娛樂(lè)等生活中的各個(gè)方面。因此,如果不對(duì)每天所產(chǎn)生的海量數(shù)字圖片信息進(jìn)行有效的組織管理和整理分類,將無(wú)法進(jìn)行高效率的檢索查詢[3]。而在實(shí)際生活中,在海量的數(shù)字圖片信息中進(jìn)行高效準(zhǔn)確的檢索不僅具有理論意義,而且具有極大的實(shí)際工業(yè)應(yīng)用方面的意義[4]。事實(shí)上,如何在海量圖片數(shù)據(jù)庫(kù)中快速準(zhǔn)確高效的進(jìn)行檢索已經(jīng)成為了如今的熱點(diǎn)話題[5]。人們都在致力于在實(shí)際應(yīng)用中提高檢索速度的同時(shí)并保證現(xiàn)有的準(zhǔn)確率或者提高準(zhǔn)確率[6]。目前為止,圖像檢索從基于關(guān)鍵字等信息的文本信息的圖像檢索發(fā)展到了基于顏色分布等內(nèi)容信息的圖像檢索兩個(gè)階段[7]。
...............
1.2 研究現(xiàn)狀
現(xiàn)如今圖像檢索研究主要有三個(gè)方向,立足于文本、立足于圖像內(nèi)容、結(jié)合文本和內(nèi)容[20]。 而且已有很多成熟的圖像檢索方法,例如關(guān)鍵詞查找、瀏覽查找、特征輸入查找、草圖查找及示例查詢等[21]。基于以上方法,已有很多圖像檢索系統(tǒng)面世,經(jīng)典的圖像檢索系統(tǒng)有 Virage 公司的 VIR(Visual Information Retrieval)圖像搜索引擎,哥倫比亞大學(xué)的 VisualSEEk 和 Webseek,麻省理工學(xué)院(MIT)多媒體實(shí)驗(yàn)室開(kāi)發(fā)的 Photobook 等等[22]。
...............
第 2 章 尺度不變特征變換算法
2.1 尺度空間極值檢測(cè)
在提取 SIFT 描述子時(shí),首先在圖像所有的尺度空間上對(duì)描述子進(jìn)行定位,定位找到的是在圖像所有的點(diǎn)中,區(qū)分性較好的點(diǎn),這樣的點(diǎn)一般可以取到某些情況下的極大值或極小值。這一步驟可以用高斯差分金字塔來(lái)進(jìn)行實(shí)現(xiàn)。高斯差分金字塔可以識(shí)別出潛在的對(duì)于方向和尺度不變的興趣點(diǎn),從而找到特征點(diǎn),并可以得到良好的效果。利用逐級(jí)濾波器,即高斯金字塔,可以有效地檢測(cè)樣本點(diǎn),使這些點(diǎn)可以在后續(xù)的算法中可以有效得被檢測(cè)到。檢測(cè)特征點(diǎn)的第一步就是檢測(cè)并確定特征點(diǎn)所在尺度空間的具體位置。這種位置信息得以讓同一物體在不同的角度下得到可重復(fù)的特征。檢測(cè)到的位置對(duì)于圖像尺度變化是不變的。目前的研究已經(jīng)證明只有高斯函數(shù)所構(gòu)建的核是可用于模擬尺度空間的。計(jì)算公式如公式(1)。一幅圖像的尺度空間可以定義為一個(gè)函數(shù)L,這個(gè)空間是由不同尺度的高斯核G與輸入圖像I進(jìn)行卷積計(jì)算得到的。其中, 代表尺度的參數(shù),它的不同的取值可以得到不同的尺度下的圖像。通過(guò)多次的卷積計(jì)算,從而得到了具有不同尺度的高斯金字塔。
...............
2.2 關(guān)鍵點(diǎn)的主方向提取
Schmid 和 Mohr 提出,每個(gè)關(guān)鍵點(diǎn)的一個(gè)或多個(gè)方向的分配是基于其梯度方向的。之后所有的運(yùn)算都是基于其所分配到的尺度,梯度和空間位置的,而主方向是由該點(diǎn)的梯度值和梯度幅值決定的。如圖 2.3 所示,在一幅圖像內(nèi),對(duì)于每個(gè)關(guān)鍵點(diǎn),取其周圍的 16*16 共 256 個(gè)像素的梯度值,并求其正切。再用這些正切值乘以其梯度幅值,隨后映射到單位直方圖中,每個(gè)單位直方圖代表 10°的范圍,,因此共計(jì) 36 個(gè)。選取單位直方圖中的累積的最大值作為該關(guān)鍵點(diǎn)的主方向,同時(shí)可以將單位直方圖的累計(jì)值大于最大值的五分之四的方向作為另一個(gè)關(guān)鍵點(diǎn)。
...............
第 3 章 主要成分分析算法................12
3.1 方差計(jì)算 ...............12
3.2 協(xié)方差計(jì)算 ................13
第 4 章 PCA-SIFT 算法的改進(jìn)設(shè)計(jì)..................15
4.1 總體流程設(shè)計(jì)................15
4.2 分層流程設(shè)計(jì) .................16
第 5 章 實(shí)驗(yàn)介紹與測(cè)試結(jié)果 ...............25
5.1 實(shí)驗(yàn)平臺(tái)及環(huán)境介紹................25
5.2 實(shí)驗(yàn)數(shù)據(jù)介紹...............27
第 5 章 實(shí)驗(yàn)介紹與測(cè)試結(jié)果
5.1 實(shí)驗(yàn)平臺(tái)及環(huán)境介紹
本文提出的改進(jìn)算法利用 MATLAB 進(jìn)行了實(shí)現(xiàn)。在 Matkab2014a 的編譯器上,本文作者按照前文的設(shè)計(jì)步驟,對(duì)改進(jìn)的PCA-SITF 進(jìn)行了實(shí)現(xiàn),并對(duì)針對(duì)不同的維度進(jìn)行了測(cè)試,記錄了相應(yīng)的匹配點(diǎn)個(gè)數(shù),通過(guò)折線圖進(jìn)行了比對(duì)。綜合匹配時(shí)間來(lái)進(jìn)行篩選,得到了較為滿意的結(jié)果。選用 Matlab 進(jìn)行算法的實(shí)現(xiàn),是因?yàn)?Matlab 其本身提供了豐富的圖像處理方面的函數(shù),不需要進(jìn)行手動(dòng)的配置,圖像方面的主要函數(shù)如表 5.1 所示,表中給出了 Matlab 提供的部分圖像處理所應(yīng)用的函數(shù),利用這些相關(guān)函數(shù),可以對(duì)圖像檢索,圖像拼接,圖像邊緣檢測(cè)等各個(gè)子領(lǐng)域的圖像檢索問(wèn)題進(jìn)行解決。
...............
5.2 實(shí)驗(yàn)數(shù)據(jù)介紹
本實(shí)驗(yàn)采用的圖像庫(kù)是在圖像特征描述子方面最為常用的數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)提供了 4 組圖像,對(duì)于每組圖像,都提供了一幅原始圖像和另外 4 幅加入了不同程度的不同干擾因素的圖像,用以利用新的算法對(duì)圖像進(jìn)行多個(gè)方面不同程度的測(cè)試。本算法選取添加了干擾的圖像與原圖像進(jìn)行匹配,并進(jìn)行了相應(yīng)的總結(jié)。在本節(jié)中對(duì)于具體的圖像庫(kù)進(jìn)行了舉例說(shuō)明如圖 5.1 所示。在圖 5.1 中左側(cè)為原始圖像,右側(cè)為進(jìn)行了一定角度變換的圖像,類似的圖像在該組中還有 3 幅。在圖 5.2,圖 5.3 和圖 5.4 中,相應(yīng)的圖的左側(cè)都是原始的圖像,右側(cè)分別進(jìn)行了壓縮變換,光強(qiáng)變換和模糊變換。
...............
結(jié)論
本文在第一章緒論中主要介紹了相關(guān)研究背景,還介紹了有關(guān)圖像檢索的研究現(xiàn)狀,包括立足于文本、立足于圖像內(nèi)容、結(jié)合文本和內(nèi)容的的三個(gè)方向。對(duì)顏色特征、形狀特征和紋理特征進(jìn)行的相關(guān)的介紹。并給出了現(xiàn)有的圖像檢索的例子。著重提出了現(xiàn)在研究和應(yīng)用中常用的尺度不變特征變換算法(SIFT)和主要成分分析算法(PCA),這兩點(diǎn)也是本文實(shí)驗(yàn)方法中的立足點(diǎn),在本章的第三小節(jié)主要說(shuō)明了全文的總體結(jié)構(gòu)安排和創(chuàng)新點(diǎn)。在第二章對(duì) SIFT 描述子進(jìn)行了詳細(xì)的介紹,包括算法的基本原理和對(duì)圖像提取特征點(diǎn)的過(guò)程都進(jìn)行了詳細(xì)的分步細(xì)化解釋。揭示了 SIFT 描述子作為局部圖像特征有極好的魯棒性原因,從原理上解釋了其對(duì)于旋轉(zhuǎn)、尺度變換和光照變化情況下的不變性。充分驗(yàn)證了作為應(yīng)用最為廣泛的特征描述子所特有的穩(wěn)定性,在多種噪音的影響下依然能夠保證其有效性。SIFT 算法特別適合應(yīng)用在海量數(shù)據(jù)中進(jìn)行高速匹配,而且可以保證極高的準(zhǔn)確率。而且 SIFT 算法可以和很多其他形式的特征進(jìn)行聯(lián)合操作,更好的適用于圖像檢索中。
參考文獻(xiàn)(略)
本文編號(hào):582821
本文鏈接:http://sikaile.net/wenshubaike/kjzx/582821.html