天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類博士論文 >

圖像語義表達(dá)與度量學(xué)習(xí)技術(shù)研究

發(fā)布時間:2019-05-24 00:24
【摘要】:隨著互聯(lián)網(wǎng)和多媒體技術(shù)的飛速發(fā)展及廣泛應(yīng)用,尤其是智能手機等新興移動終端的迅速普及,使得數(shù)字圖像資源的規(guī)模呈爆炸式增長。面對海量的圖像信息,如何準(zhǔn)確、高效地實現(xiàn)圖像資源的標(biāo)注、分類、檢索等各項工作,已成為當(dāng)前智能信息處理的研究熱點,其關(guān)鍵是圖像語義表達(dá)與度量學(xué)習(xí)。目前的主流解決方案是,在圖像局部特征提取的基礎(chǔ)之上生成視覺詞典,建立中層語義表示模型,實現(xiàn)圖像語義表達(dá),進而對圖像之間的距離進行度量。為此,本文分別研究了K-Means聚類、哈希映射和學(xué)習(xí)編碼等視覺詞典生成方式,在此基礎(chǔ)上研究與之對應(yīng)的中層語義表示模型,包括視覺詞袋模型、視覺語言模型和學(xué)習(xí)編碼模型,提出了新的圖像語義表達(dá)方法,最后探索了距離度量學(xué)習(xí)方法。論文的主要貢獻體現(xiàn)在6個方面:(1)研究了基于K-Means聚類的視覺詞典生成方式,針對檢測算子產(chǎn)生大量相似性關(guān)鍵點以及生成的視覺詞典中包含視覺停用詞的問題,提出一種基于關(guān)鍵點過濾和卡方模型的視覺詞典生成方法。首先,提取圖像特征并根據(jù)關(guān)鍵點之間的近鄰關(guān)系濾除一些噪聲關(guān)鍵點,降低計算消耗,提高特征代表性;然后,采用近似K-Means聚類生成初始視覺詞典;最后,采用卡方模型統(tǒng)計視覺單詞與各訓(xùn)練圖像類別的相關(guān)性,去除詞典中的視覺停用詞,得到優(yōu)化后的視覺詞典。實驗結(jié)果表明,新方法降低了計算消耗,增強了視覺詞典的區(qū)分性和語義分辨能力。(2)在基于關(guān)鍵點過濾和卡方模型的視覺詞典生成方法基礎(chǔ)上,研究與之對應(yīng)的中層語義表示模型,針對特征點與視覺單詞映射匹配時量化誤差嚴(yán)重,而導(dǎo)致視覺詞匯直方圖對圖像語義表達(dá)能力不強的問題,設(shè)計一種近義詞自適應(yīng)軟分配策略來構(gòu)建視覺詞匯直方圖,提出了一種基于近義詞自適應(yīng)軟分配和卡方模型的圖像語義表達(dá)方法。首先,該方法利用概率潛在語義分析模型(Probabilistic Latent Semantic Analysis, PLSA)分析圖像中視覺單詞的語義共生概率,發(fā)現(xiàn)圖像包含的語義主題,進而得到語義主題在某一視覺單詞上的概率分布;其次,引入K-L散度度量視覺單詞問的語義相關(guān)性,獲取語義相關(guān)的近義詞;然后,分析SIFT特征的模糊性,并設(shè)計白適應(yīng)軟分配策略實現(xiàn)SIFT特征點與若干語義相關(guān)的近義詞之間的軟映射;最后,采用卡方模型去除視覺停用詞,重構(gòu)視覺詞匯直方圖,實現(xiàn)圖像語義表達(dá)。分別利用非線性核SVM分類器和空間一致性度量準(zhǔn)則進行目標(biāo)分類和目標(biāo)檢索實驗,結(jié)果表明,新方法能夠有效地降低量化誤差,增強圖像語義表達(dá)的分辨能力,從而改善目標(biāo)分類和目標(biāo)檢索的性能。(3)研究了基于哈希映射的視覺詞典生成方式,針對哈希函數(shù)選取過程隨機性強而導(dǎo)致視覺詞典質(zhì)量不穩(wěn)定的問題,提出了一種基于弱監(jiān)督E2LSH的視覺詞典生成方法。首先,提取訓(xùn)練圖像庫的SIFT特征;然后,利用精確歐氏位置敏感哈希算法(Exact Euclusion Locality Sensitive Hashing, E2LSH)對處理高維數(shù)據(jù)的位置敏感性和高效性,對訓(xùn)練圖像集的特征點進行哈希映射,生成一組視覺詞典;最后,根據(jù)訓(xùn)練數(shù)據(jù)的先驗信息,采用弱監(jiān)督策略對E2LSH中哈希函數(shù)的選取進行監(jiān)督,以降低其隨機性,提高視覺詞典的區(qū)分性和擴展性。實驗結(jié)果表明,該方法能較好地降低哈希函數(shù)選取的隨機性,增強視覺詞典的穩(wěn)定性,從而更好地克服視覺單詞同義性和歧義性問題。(4)在基于弱監(jiān)督E2LSH的視覺詞典生成方法基礎(chǔ)上,研究與之對應(yīng)的中層語義表示模型,針對傳統(tǒng)視覺語言模型將背景區(qū)域單詞與目標(biāo)區(qū)域單詞賦予同樣權(quán)重,忽略了背景噪聲對目標(biāo)語義內(nèi)容表達(dá)不利影響的問題,構(gòu)建顯著圖加權(quán)視覺語言模型,提出了一種基于弱監(jiān)督E2LSH與顯著圖加權(quán)視覺語言模型的圖像語義表達(dá)方法。首先,利用GBVS (Graph-Based Visual Saliency)顯著度檢測算法對圖像進行顯著度檢測,得到圖像目標(biāo)的顯著圖;然后,利用弱監(jiān)督E2LSH完成圖像特征點與視覺單詞之間的映射并根據(jù)單詞所處區(qū)域的顯著度值為其分配相應(yīng)的權(quán)重;最后,利用顯著圖加權(quán)視覺語言模型為圖像目標(biāo)中層語義進行建模,實現(xiàn)圖像語義表達(dá)。目標(biāo)分類和目標(biāo)檢索實驗結(jié)果表明,該方法能夠有效地增強圖像目標(biāo)表達(dá)的語義分辨能力,進而改善復(fù)雜環(huán)境下目標(biāo)分類與檢索性能。(5)研究了基于學(xué)習(xí)編碼的視覺詞典生成方式及與之對應(yīng)的中層語義表示模型,針對當(dāng)前常用的學(xué)習(xí)編碼方式(稀疏編碼),只是一種淺層學(xué)習(xí)模型,而導(dǎo)致視覺詞典對圖像特征缺乏選擇性的問題,提出了一種基于深度學(xué)習(xí)編碼模型的圖像語義表達(dá)方法。首先,采用無監(jiān)督的受限玻爾茲曼機(Restricted Boltzmann Machine, RBM)對SIFT特征庫進行深度學(xué)習(xí)編碼,生成視覺詞典;然后,根據(jù)視覺詞典,學(xué)習(xí)得到每一個SIFT特征對應(yīng)的表示向量,并對其進行融合得到圖像的深度學(xué)習(xí)表示特征;最后,利用訓(xùn)練數(shù)據(jù)的類別標(biāo)簽信息對RBM網(wǎng)絡(luò)學(xué)習(xí)進行有監(jiān)督的微調(diào),重構(gòu)視覺詞典和圖像深度學(xué)習(xí)表示特征,實現(xiàn)圖像語義表達(dá)。利用線性核SVM分類器進行目標(biāo)分類實驗,結(jié)果表明,新方法能有效克服傳統(tǒng)稀疏編碼模型的缺點,有效地提升目標(biāo)分類性能。(6)研究了度量學(xué)習(xí)技術(shù),針對當(dāng)前距離度量學(xué)習(xí)方法計算復(fù)雜度高,難以適用于大規(guī)模數(shù)據(jù)的問題,提出了一種基于特征分組與特征值最優(yōu)化的距離度量學(xué)習(xí)方法。首先,引入特征分組算法,根據(jù)特征各維數(shù)之問相關(guān)性對圖像特征進行分組;然后,在一定的約束條件下,將傳統(tǒng)距離度量學(xué)習(xí)方法中求解半正定規(guī)劃(Semi-definite Programming, SDP)問題轉(zhuǎn)化為特征值最優(yōu)化問題(Eigenvalue Optimization);最后,在每次循環(huán)迭代中只需計算矩陣最大特征值對應(yīng)的特征向量,降低計算復(fù)雜度,提高度量空間的準(zhǔn)確性。在新的度量空間進行目標(biāo)分類與檢索實驗,結(jié)果表明,該方法能有效地降低計算復(fù)雜度,減少度量矩陣的學(xué)習(xí)時間,且能夠取得更好的分類和檢索結(jié)果。
[Abstract]:......
【學(xué)位授予單位】:解放軍信息工程大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2016
【分類號】:TP391.41

【參考文獻】

相關(guān)期刊論文 前10條

1 張瑞杰;魏福山;;結(jié)合Fisher判別分析和稀疏編碼的圖像場景分類[J];計算機輔助設(shè)計與圖形學(xué)學(xué)報;2015年05期

2 祝軍;趙杰煜;董振宇;;融合顯著信息的層次特征學(xué)習(xí)圖像分類[J];計算機研究與發(fā)展;2014年09期

3 趙仲秋;季海峰;高雋;胡東輝;吳信東;;基于稀疏編碼多尺度空間潛在語義分析的圖像分類[J];計算機學(xué)報;2014年06期

4 劉建偉;劉媛;羅雄麟;;深度學(xué)習(xí)研究進展[J];計算機應(yīng)用研究;2014年07期

5 張瑞杰;李弼程;魏福山;;基于多尺度上下文語義信息的圖像場景分類算法[J];電子學(xué)報;2014年04期

6 金聰;劉金安;金樞煒;;基于視覺語言模型的圖像語義挖掘研究[J];圖書情報工作;2013年05期

7 高毫林;彭天強;李弼程;郭志剛;;基于多表頻繁項投票和桶映射鏈的快速檢索方法[J];電子與信息學(xué)報;2012年11期

8 段菲;章毓晉;;基于多尺度稀疏表示的場景分類[J];計算機應(yīng)用研究;2012年10期

9 張瑞杰;郭志剛;李弼程;高毫林;;基于E~2LSH-MKL的視覺語義概念檢測[J];自動化學(xué)報;2012年10期

10 唐峰;孫錟鋒;蔣興浩;陸歡;;基于改進稀疏編碼模型的圖像分類算法[J];上海交通大學(xué)學(xué)報;2012年09期

相關(guān)博士學(xué)位論文 前2條

1 張瑞杰;基于局部語義概念表示的圖像場景分類技術(shù)研究[D];解放軍信息工程大學(xué);2013年

2 解文杰;基于中層語義表示的圖像場景分類研究[D];北京交通大學(xué);2011年

,

本文編號:2484385

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2484385.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6229a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com