超復(fù)數(shù)DCT變換域下的場景分類算法研究
發(fā)布時間:2021-01-24 18:30
隨著計算機及多媒體設(shè)備的普及,每天都會有海量的數(shù)字圖像產(chǎn)生、發(fā)布和共享,這給人們的生活提供極大便利的同時也對人們迅速地從浩如煙海的圖像數(shù)據(jù)中尋找到自己所需要的信息帶來了挑戰(zhàn)。如何有效地分析、組織和管理圖像數(shù)據(jù),實現(xiàn)基于內(nèi)容的場景分類已成為圖像處理領(lǐng)域的研究熱點。研究的難點在于如何使計算機能夠從人類的認(rèn)知角度理解場景圖像的語義信息。為了提高場景分類的速度和準(zhǔn)確率,結(jié)合DCT紋理特性以及超復(fù)數(shù)彩色空間并行性,本文先對DCT變換進(jìn)行了研究,在提出三種DCT變換域下的場景分類算法的基礎(chǔ)上,最終引入超復(fù)數(shù)提出了一種超復(fù)數(shù)DCT變換域下的場景分類算法。本文的主要研究內(nèi)容包括*:(1)針對現(xiàn)有場景分類算法都是在非壓縮域?qū)崿F(xiàn)并且分類速度慢的問題,提出了一種DCT變換域的快速場景分類算法。DCT變換后頻域系數(shù)具有能量集中性和多尺度多分辨率特征,該特征能夠很好地反映圖像紋理特征并且易于量化分析,若選擇合適的變換塊大小,DCT變換還具有較好的快速性。本文根據(jù)這些特征對場景圖像進(jìn)行DCT變換后提取頻域系數(shù)進(jìn)行分類實驗,實驗結(jié)果表明該算法很好地提高了場景分類的速度。(2)為了進(jìn)一步提高場景分類準(zhǔn)確率,根據(jù)譜殘差...
【文章來源】:蘭州理工大學(xué)甘肅省
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
場景分類示意圖
(c)觀察尺度變化 (d)光照變化圖 1.2 不同條件下的場景圖像 最近幾年,國內(nèi)外的很多高校和科研單位都對場景分類進(jìn)行了深入地研究。國外,有麻省理工學(xué)院、斯坦福大學(xué)、牛津大學(xué)和卡內(nèi)基梅隆大學(xué)等;國內(nèi)主要中科院、清華大學(xué)和南京大學(xué)等。計算機視覺領(lǐng)域的一些頂級期刊,如 PAMI,IJCV,CVIU 及 PR 等發(fā)表了很多場景分類的成果;ICCV,CVPR 及 ICCV 等著名的計算機視覺領(lǐng)域的國際會議也相繼出版了大量很有價值的研究成果。根據(jù)獲取圖像內(nèi)容信息的方式不同,可以將現(xiàn)有的場景分類方法分為三類:(1) 基于圖像底層特征與中高層詞匯建模的方法;(2) 基于圖像局部與全局建模的方法;(3) 基于圖像空域與頻域建模的方法。1.2.1 基于圖像底層特征與中高層詞匯建模的場景分類方法目前多數(shù)場景分類方法主要集中在人類視覺感知的基本層次,根據(jù)在圖像場景特征提取過程中是否構(gòu)建了圖像特征與場景對象之間的映射關(guān)系可以把現(xiàn)有的場景分類方法分成以下兩類:(1) 基于底層特征的分類方法
主要分為目標(biāo)視覺詞匯表達(dá)法和局部詞匯概念法。目標(biāo)視覺詞匯表達(dá)法對場景的描述主要通過識別場景中包含的一些目標(biāo),通常需要對圖像進(jìn)行分割后獲取一些有代表性的區(qū)域(如天空、人、汽車、草地、建筑物等),利用分類器對這些局部區(qū)域分類后進(jìn)行標(biāo)記,然后通過定義后的局部信息完成對整幅場景圖像的分類。Fan[9]使用場景圖像中一些比較常見的顯著性目標(biāo)對圖像進(jìn)行分類;Fredembach[10]和 Carson[11]對圖像進(jìn)行不同區(qū)域的分割,通過判斷分割出區(qū)域的類別及不同區(qū)域間的布局關(guān)系來得到場景類別。局部詞匯概念法通過檢測圖像局部描述子獲取圖像中層屬性表示圖像類別,該方法不需要對圖像分割,通過局部描述子表示圖像內(nèi)容信息。局部語義概念法最具代表性的就是 BoW(Bag-of-Words)[12-14],根據(jù)視覺詞匯的直方圖匹配進(jìn)行場景分類。值得注意的是,許多研究者在 BoW 基礎(chǔ)上用概率生成模型來進(jìn)行建模,通過概率生成模型將圖像的高維BoW 表示映射到低維的語義表示上,主要有 pLSA 模型[15-16]和 LDA 模型[17-18]。這兩類方法是對圖像特征進(jìn)行提取分析后,在不同的層次上描述場景內(nèi)容從而完成對場景圖像的分類。1.2.2 基于圖像局部與全局特征的場景分類方法
本文編號:2997723
【文章來源】:蘭州理工大學(xué)甘肅省
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
場景分類示意圖
(c)觀察尺度變化 (d)光照變化圖 1.2 不同條件下的場景圖像 最近幾年,國內(nèi)外的很多高校和科研單位都對場景分類進(jìn)行了深入地研究。國外,有麻省理工學(xué)院、斯坦福大學(xué)、牛津大學(xué)和卡內(nèi)基梅隆大學(xué)等;國內(nèi)主要中科院、清華大學(xué)和南京大學(xué)等。計算機視覺領(lǐng)域的一些頂級期刊,如 PAMI,IJCV,CVIU 及 PR 等發(fā)表了很多場景分類的成果;ICCV,CVPR 及 ICCV 等著名的計算機視覺領(lǐng)域的國際會議也相繼出版了大量很有價值的研究成果。根據(jù)獲取圖像內(nèi)容信息的方式不同,可以將現(xiàn)有的場景分類方法分為三類:(1) 基于圖像底層特征與中高層詞匯建模的方法;(2) 基于圖像局部與全局建模的方法;(3) 基于圖像空域與頻域建模的方法。1.2.1 基于圖像底層特征與中高層詞匯建模的場景分類方法目前多數(shù)場景分類方法主要集中在人類視覺感知的基本層次,根據(jù)在圖像場景特征提取過程中是否構(gòu)建了圖像特征與場景對象之間的映射關(guān)系可以把現(xiàn)有的場景分類方法分成以下兩類:(1) 基于底層特征的分類方法
主要分為目標(biāo)視覺詞匯表達(dá)法和局部詞匯概念法。目標(biāo)視覺詞匯表達(dá)法對場景的描述主要通過識別場景中包含的一些目標(biāo),通常需要對圖像進(jìn)行分割后獲取一些有代表性的區(qū)域(如天空、人、汽車、草地、建筑物等),利用分類器對這些局部區(qū)域分類后進(jìn)行標(biāo)記,然后通過定義后的局部信息完成對整幅場景圖像的分類。Fan[9]使用場景圖像中一些比較常見的顯著性目標(biāo)對圖像進(jìn)行分類;Fredembach[10]和 Carson[11]對圖像進(jìn)行不同區(qū)域的分割,通過判斷分割出區(qū)域的類別及不同區(qū)域間的布局關(guān)系來得到場景類別。局部詞匯概念法通過檢測圖像局部描述子獲取圖像中層屬性表示圖像類別,該方法不需要對圖像分割,通過局部描述子表示圖像內(nèi)容信息。局部語義概念法最具代表性的就是 BoW(Bag-of-Words)[12-14],根據(jù)視覺詞匯的直方圖匹配進(jìn)行場景分類。值得注意的是,許多研究者在 BoW 基礎(chǔ)上用概率生成模型來進(jìn)行建模,通過概率生成模型將圖像的高維BoW 表示映射到低維的語義表示上,主要有 pLSA 模型[15-16]和 LDA 模型[17-18]。這兩類方法是對圖像特征進(jìn)行提取分析后,在不同的層次上描述場景內(nèi)容從而完成對場景圖像的分類。1.2.2 基于圖像局部與全局特征的場景分類方法
本文編號:2997723
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2997723.html
最近更新
教材專著