基于多特征分類的目標檢測算法研究
發(fā)布時間:2021-09-29 00:50
隨著科技的發(fā)展和網(wǎng)絡(luò)通訊的廣泛應(yīng)用,圖像信息爆炸式的增長使人們對圖像處理技術(shù)的需求日漸擴大,目標檢測也隨之成為當前機器視覺領(lǐng)域和計算機領(lǐng)域的研究重點。精確的目標檢測是后續(xù)圖像識別、跟蹤、匹配、檢索等智能分析處理過程順利進行的必要條件。但在目標檢測過程中往往存在檢測場景復(fù)雜、陰影遮擋、光照變化以及單一特征信息利用不充分等問題。為有效避免外部干擾,提高復(fù)雜場景下目標檢測的準確性,本文對基于多特征分類的目標檢測算法進行了深入研究,主要研究內(nèi)容如下:(1)對單一特征的提取方法進行了研究與分析,著重研究了紋理特征提取中的LBP(Local Binary Pattern)方法,邊緣特征提取中的Canny算子和Sobel算子,以及顏色特征提取中的顏色直方圖和顏色矩的相關(guān)概念。為方便后續(xù)圖像預(yù)處理階段的研究和分類算法的改進,對稀疏理論和支持向量機的基本理論進行了深入研究。(2)在圖像預(yù)處理階段,研究了噪聲的分類、常見的幾種噪聲和去噪對比算法——Wiener濾波、LPG-PCA(Principal Component Analysis with Local Pixel Grouping)和K-SVD之后...
【文章來源】:山東理工大學山東省
【文章頁數(shù)】:77 頁
【學位級別】:碩士
【部分圖文】:
基于模板匹配的目標檢測方法流程示意圖
山東理工大學碩士學位論文第一章緒論4模型對于平移和縮放都是不變的,但它們對旋轉(zhuǎn)高度敏感[16]。解決旋轉(zhuǎn)問題的最常用解決方案是通過添加旋轉(zhuǎn)圖像來增強訓練數(shù)據(jù),但是,對于大型數(shù)據(jù)集,數(shù)據(jù)擴充并不總是可行的方案。此外,通過向現(xiàn)有訓練數(shù)據(jù)集添加更多數(shù)據(jù),數(shù)據(jù)的大小會增加,并且系統(tǒng)需要在擴充的數(shù)據(jù)集上進行重新訓練?紤]到這些問題,在訓練數(shù)據(jù)有限的許多應(yīng)用中或在測試集中的數(shù)據(jù)可能發(fā)生許多變化(例如旋轉(zhuǎn)和噪聲)的情況下,仍然需要手工制作的特征。因此,本文利用多特征融合的方式——多核學習(MKL)技術(shù)拓展手工制作的特征來克服單一特征的缺陷,并通過對SVM分類器參數(shù)的優(yōu)化提高其分類性能,使目標檢測效果達到實際需求。圖1.2基于圖像分類的目標檢測方法流程示意圖Fig.1.2Schematicdiagramofobjectdetectionmethodbasedonimageclassification1.2.2目標檢測應(yīng)用領(lǐng)域研究現(xiàn)狀目標檢測作為機器視覺領(lǐng)域的核心問題之一,在大規(guī)模圖像檢索、車輛自動駕駛、視覺人機交互、機器人環(huán)境感知、智能視頻監(jiān)控、醫(yī)學圖像分析等領(lǐng)域都有廣泛的應(yīng)用。(1)自動駕駛領(lǐng)域國外發(fā)達國家早在20世紀70年代就已經(jīng)開始對無人駕駛技術(shù)的研究,Google公司就是其突出代表,隨后各個企業(yè)也紛紛加入,特斯拉公司后來者居上,在自動化
山東理工大學碩士學位論文第二章相關(guān)理論和算法9第二章相關(guān)理論和算法2.1紋理特征提取圖像紋理是區(qū)域具有的典型特征之一,是在圖像計算中經(jīng)過量化的圖像特征。它體現(xiàn)的是物體表面的機構(gòu)組織排列屬性,描述了圖像或者圖像的區(qū)域所對應(yīng)景物的表面性質(zhì)。紋理特征提取分為基于統(tǒng)計數(shù)據(jù)和基于結(jié)構(gòu)這兩種方法,前者適用于人工合成的紋理識別,后者則是適用于交通圖像的紋理識別。常用的特征描述子有LBP、HOG、Harris等,下面以LBP為例,介紹原始LBP及其變種。2.1.1原始的LBPLBP是Ojala等人[35]在1994年首次提出并于2002年進一步完善的特征提取方法,它是一個非常強大的局部紋理描述器。原始的LBP算子定義為在3*3的窗口內(nèi),通過比較窗口的中心像素的灰度值與相鄰的8個像素的灰度值來標記位置,標記周圍像素值大于中心像素值的位置為1,反之,標記為0。這樣就可以得到一個8位的二進制數(shù),為了方便表示,通常也會將其轉(zhuǎn)化為10進制,即LBP碼(共256種)。將得到的數(shù)值作為窗口中心像素點的LBP值以反映這個區(qū)域里的紋理信息。下圖2.1是LBP算子的示意圖。圖2.1LBP算子示意圖Fig.2.1SchematicdiagramofLBPoperator此時,窗口中心像素點的LBP值為10(01111100)124。81(,)(()())2pccpLBPxysIpIc(2.1)式中,p表示在3*3的窗口中除中心像素以外的第p個像素點,I(p)表示該鄰域內(nèi)的第p個像素點的灰度值,I(c)表示的是中心像素點的灰度值。s(x)由式(2.2)定義:
本文編號:3412870
【文章來源】:山東理工大學山東省
【文章頁數(shù)】:77 頁
【學位級別】:碩士
【部分圖文】:
基于模板匹配的目標檢測方法流程示意圖
山東理工大學碩士學位論文第一章緒論4模型對于平移和縮放都是不變的,但它們對旋轉(zhuǎn)高度敏感[16]。解決旋轉(zhuǎn)問題的最常用解決方案是通過添加旋轉(zhuǎn)圖像來增強訓練數(shù)據(jù),但是,對于大型數(shù)據(jù)集,數(shù)據(jù)擴充并不總是可行的方案。此外,通過向現(xiàn)有訓練數(shù)據(jù)集添加更多數(shù)據(jù),數(shù)據(jù)的大小會增加,并且系統(tǒng)需要在擴充的數(shù)據(jù)集上進行重新訓練?紤]到這些問題,在訓練數(shù)據(jù)有限的許多應(yīng)用中或在測試集中的數(shù)據(jù)可能發(fā)生許多變化(例如旋轉(zhuǎn)和噪聲)的情況下,仍然需要手工制作的特征。因此,本文利用多特征融合的方式——多核學習(MKL)技術(shù)拓展手工制作的特征來克服單一特征的缺陷,并通過對SVM分類器參數(shù)的優(yōu)化提高其分類性能,使目標檢測效果達到實際需求。圖1.2基于圖像分類的目標檢測方法流程示意圖Fig.1.2Schematicdiagramofobjectdetectionmethodbasedonimageclassification1.2.2目標檢測應(yīng)用領(lǐng)域研究現(xiàn)狀目標檢測作為機器視覺領(lǐng)域的核心問題之一,在大規(guī)模圖像檢索、車輛自動駕駛、視覺人機交互、機器人環(huán)境感知、智能視頻監(jiān)控、醫(yī)學圖像分析等領(lǐng)域都有廣泛的應(yīng)用。(1)自動駕駛領(lǐng)域國外發(fā)達國家早在20世紀70年代就已經(jīng)開始對無人駕駛技術(shù)的研究,Google公司就是其突出代表,隨后各個企業(yè)也紛紛加入,特斯拉公司后來者居上,在自動化
山東理工大學碩士學位論文第二章相關(guān)理論和算法9第二章相關(guān)理論和算法2.1紋理特征提取圖像紋理是區(qū)域具有的典型特征之一,是在圖像計算中經(jīng)過量化的圖像特征。它體現(xiàn)的是物體表面的機構(gòu)組織排列屬性,描述了圖像或者圖像的區(qū)域所對應(yīng)景物的表面性質(zhì)。紋理特征提取分為基于統(tǒng)計數(shù)據(jù)和基于結(jié)構(gòu)這兩種方法,前者適用于人工合成的紋理識別,后者則是適用于交通圖像的紋理識別。常用的特征描述子有LBP、HOG、Harris等,下面以LBP為例,介紹原始LBP及其變種。2.1.1原始的LBPLBP是Ojala等人[35]在1994年首次提出并于2002年進一步完善的特征提取方法,它是一個非常強大的局部紋理描述器。原始的LBP算子定義為在3*3的窗口內(nèi),通過比較窗口的中心像素的灰度值與相鄰的8個像素的灰度值來標記位置,標記周圍像素值大于中心像素值的位置為1,反之,標記為0。這樣就可以得到一個8位的二進制數(shù),為了方便表示,通常也會將其轉(zhuǎn)化為10進制,即LBP碼(共256種)。將得到的數(shù)值作為窗口中心像素點的LBP值以反映這個區(qū)域里的紋理信息。下圖2.1是LBP算子的示意圖。圖2.1LBP算子示意圖Fig.2.1SchematicdiagramofLBPoperator此時,窗口中心像素點的LBP值為10(01111100)124。81(,)(()())2pccpLBPxysIpIc(2.1)式中,p表示在3*3的窗口中除中心像素以外的第p個像素點,I(p)表示該鄰域內(nèi)的第p個像素點的灰度值,I(c)表示的是中心像素點的灰度值。s(x)由式(2.2)定義:
本文編號:3412870
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3412870.html
最近更新
教材專著