天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類博士論文 >

基于局部特征的圖像表示模型理論與實(shí)踐

發(fā)布時(shí)間:2020-10-21 01:07
   圖像的分類和檢索一直是計(jì)算機(jī)視覺(jué)、模式識(shí)別和機(jī)器學(xué)習(xí)領(lǐng)域的核心課題之一。基于局部特征的圖像表示模型是圖像分類和檢索中最為有效和常用的方法。然而,由于眾所周知的語(yǔ)義鴻溝,以及局部特征在表達(dá)高級(jí)視覺(jué)概念方面的局限性,傳統(tǒng)的圖像表示模型通常存在許多缺陷,包括對(duì)細(xì)微噪聲的敏感性太強(qiáng)、特征編碼的空間結(jié)構(gòu)信息缺失、無(wú)法捕捉實(shí)際問(wèn)題中的興趣區(qū)域,等等。本文針對(duì)這些問(wèn)題進(jìn)行了充分的研究,討論和改進(jìn)了兩種基于局部特征的圖像表示模型,即視覺(jué)詞袋模型和深度卷積神經(jīng)網(wǎng)絡(luò)。從實(shí)際應(yīng)用的角度出發(fā),我們抽象出若干重要的科學(xué)問(wèn)題,并且利用創(chuàng)新性的方法解決這些問(wèn)題。我們將圖像表示模型拆分為多個(gè)模塊,包括特征抽取、特征編碼、特征組合以及后處理等,逐一進(jìn)行深入探索。在模塊化研究的基礎(chǔ)上,我們開(kāi)創(chuàng)性地提出一種能夠同時(shí)處理圖像分類和檢索任務(wù)的模型,完成了兩者的統(tǒng)一。最后,我們提出了兩個(gè)富有挑戰(zhàn)性的計(jì)算機(jī)視覺(jué)新問(wèn)題,并且提供了新穎的初步解決方案。本文的主要?jiǎng)?chuàng)新點(diǎn)包括以下六個(gè)方面:?提出一種局部特征強(qiáng)化算法:從圖像分類和檢索的實(shí)際情況出發(fā),論述局部特征的翻轉(zhuǎn)不變的必要性,并且設(shè)計(jì)了一種簡(jiǎn)單的解決方案。?提出一種利用空間位置信息強(qiáng)化特征編碼的算法:通過(guò)構(gòu)造幾何視覺(jué)短語(yǔ)和基于短語(yǔ)的池化算法,使得特征編碼具有描述局部特征組的能力。?提出兩種圖像空間匹配模型:針對(duì)特定圖像分類問(wèn)題(細(xì)粒度分類和場(chǎng)景分類)的特殊特征組合算法,提升了圖像表示的質(zhì)量。?提出兩種針對(duì)圖像檢索問(wèn)題的后處理算法:利用基于圖結(jié)構(gòu)和隨機(jī)游走理論的擴(kuò)散算法,大幅提升準(zhǔn)確率和召回率,并且應(yīng)用于大規(guī)模網(wǎng)絡(luò)圖像搜索。?提出一種統(tǒng)一的圖像分類和檢索模型:利用強(qiáng)有力的圖像表示和魯棒的距離計(jì)算方法,同時(shí)處理分類和檢索問(wèn)題,并且在兩類任務(wù)上都達(dá)到先進(jìn)水平。?提出兩個(gè)計(jì)算機(jī)視覺(jué)領(lǐng)域的新問(wèn)題:同時(shí)利用前面幾章的研究成果以及創(chuàng)新性的框架結(jié)構(gòu),對(duì)新問(wèn)題進(jìn)行探索,并且提出了初步的解決方案。本文所提出的方法大多具有很強(qiáng)的推廣性,能夠很方便地移植到其他應(yīng)用問(wèn)題中。我們的研究,為計(jì)算機(jī)視覺(jué)領(lǐng)域的科研人員提供了許多有價(jià)值的線索;我們提出的有趣而富有挑戰(zhàn)性的新問(wèn)題,也為我們未來(lái)的研究工作奠定了基礎(chǔ)。
【學(xué)位單位】:清華大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2015
【中圖分類】:TP391.41
【文章目錄】:
摘要
abstract
第1章 引言
    1.1 研究背景和現(xiàn)實(shí)意義
    1.2 研究現(xiàn)狀和難點(diǎn)
    1.3 全文的結(jié)構(gòu)和創(chuàng)新點(diǎn)
        1.3.1 本文的組織結(jié)構(gòu)
        1.3.2 本文的主要?jiǎng)?chuàng)新點(diǎn)
第2章 背景知識(shí)
    2.1 人工智能與計(jì)算機(jī)視覺(jué)
        2.1.1 典型問(wèn)題
        2.1.2 相關(guān)研究領(lǐng)域
    2.2 視覺(jué)詞袋模型
        2.2.1 描述子抽取
        2.2.2 視覺(jué)碼本訓(xùn)練
        2.2.3 特征編碼
        2.2.4 特征組合和圖像分類
        2.2.5 特征索引和圖像檢索
    2.3 卷積神經(jīng)網(wǎng)絡(luò)
        2.3.1 總體結(jié)構(gòu)
        2.3.2 網(wǎng)絡(luò)訓(xùn)練
        2.3.3 其他應(yīng)用
        2.3.4 網(wǎng)絡(luò)的快速計(jì)算
    2.4 其他知識(shí)
        2.4.1 圖像分割
        2.4.2 邊緣檢測(cè)
        2.4.3 物體檢測(cè)
        2.4.4 最近鄰搜索
第3章 局部特征的翻轉(zhuǎn)不變強(qiáng)化
    3.1 研究動(dòng)機(jī)
    3.2 翻轉(zhuǎn)不變性的重要性
    3.3 翻轉(zhuǎn)不變的局部特征
        3.3.1 局部特征的翻轉(zhuǎn)
        3.3.2 Max-SIFT特征
        3.3.3 RIDE算法
        3.3.4 將RIDE擴(kuò)展到其他局部特征
        3.3.5 圖像應(yīng)用
        3.3.6 與已有方法的對(duì)比
    3.4 實(shí)驗(yàn)部分
        3.4.1 數(shù)據(jù)集和基本設(shè)置
        3.4.2 局部特征的匹配
        3.4.3 細(xì)粒度物體識(shí)別
        3.4.4 全局翻轉(zhuǎn)和局部翻轉(zhuǎn)
        3.4.5 場(chǎng)景識(shí)別
        3.4.6 計(jì)算復(fù)雜度
    3.5 本章小結(jié)
第4章 局部特征的強(qiáng)化編碼
    4.1 研究動(dòng)機(jī)
    4.2 提取互補(bǔ)的局部特征
        4.2.1 SIFT和Edge-SIFT特征
        4.2.2 融合兩種特征
        4.2.3 實(shí)驗(yàn)和討論
        4.2.4 局限性
    4.3 幾何短語(yǔ)池化
        4.3.1 GPP算法
        4.3.2 GPP的深入解釋
        4.3.3 增強(qiáng)GPP的效果
        4.3.4 時(shí)間復(fù)雜度和稀疏性
        4.3.5 早期融合與后期融合
    4.4 基于邊緣的空間加權(quán)
        4.4.1 邊緣圖像的模糊化
        4.4.2 加權(quán)算法的效果和討論
        4.4.3 計(jì)算復(fù)雜度
    4.5 實(shí)驗(yàn)部分
        4.5.1 基本設(shè)置
        4.5.2 一般物體分類
        4.5.3 特定物體分類
        4.5.4 場(chǎng)景識(shí)別
        4.5.5 討論
    4.6 本章小結(jié)
第5章 圖像分類:局部特征的優(yōu)化組合
    5.1 研究動(dòng)機(jī)
    5.2 樸素的空間切分:空間金字塔匹配
        5.2.1 特征組合與指數(shù)子集
        5.2.2 標(biāo)準(zhǔn)的金字塔匹配
        5.2.3 推廣的規(guī)則匹配
        5.2.4 實(shí)驗(yàn)部分
        5.2.5 結(jié)論
    5.3 細(xì)粒度分類:層次化部件匹配
        5.3.1 問(wèn)題綜述
        5.3.2 細(xì)粒度分類數(shù)據(jù)集
        5.3.3 物體部件的切分
        5.3.4 層次化結(jié)構(gòu)學(xué)習(xí)
        5.3.5 幾何池化策略
        5.3.6 實(shí)驗(yàn)部分
        5.3.7 結(jié)論
    5.4 場(chǎng)景分類:朝向金字塔匹配
        5.4.1 問(wèn)題綜述
        5.4.2 朝向金字塔匹配
        5.4.3 計(jì)算3D朝向
        5.4.4 實(shí)驗(yàn)部分
        5.4.5 結(jié)論
    5.5 本章小結(jié)
第6章 圖像檢索:特征索引和后處理
    6.1 研究動(dòng)機(jī)
    6.2 異質(zhì)圖傳播算法
        6.2.1 問(wèn)題綜述
        6.2.2 異質(zhì)圖傳播
        6.2.3 實(shí)驗(yàn)部分
        6.2.4 結(jié)論
    6.3 圖像網(wǎng)絡(luò)算法
        6.3.1 問(wèn)題綜述
        6.3.2 Image Web數(shù)據(jù)結(jié)構(gòu)
        6.3.3 參數(shù)選擇過(guò)程的折中思想
        6.3.4 實(shí)驗(yàn)部分
        6.3.5 結(jié)論
    6.4 本章小結(jié)
第7章 統(tǒng)一的圖像分類和檢索模型
    7.1 研究動(dòng)機(jī)
    7.2 ONE算法
        7.2.1 統(tǒng)一的分類和檢索模型
        7.2.2 ONE算法
        7.2.3 感興趣的物體區(qū)域
        7.2.4 近似最近鄰搜索
        7.2.5 GPU加速
    7.3 實(shí)驗(yàn)部分
        7.3.1 數(shù)據(jù)集和實(shí)現(xiàn)細(xì)節(jié)
        7.3.2 模型和參數(shù)
        7.3.3 與現(xiàn)有方法對(duì)比
        7.3.4 時(shí)間和空間開(kāi)銷
    7.4 本章小結(jié)
第8章 新問(wèn)題的探索
    8.1 研究動(dòng)機(jī)
    8.2 細(xì)粒度圖像搜索
        8.2.1 問(wèn)題介紹
        8.2.2 問(wèn)題描述
        8.2.3 細(xì)粒度搜索系統(tǒng)
        8.2.4 實(shí)驗(yàn)部分
        8.2.5 結(jié)論
    8.3 基于視覺(jué)內(nèi)容的網(wǎng)頁(yè)質(zhì)量分析
        8.3.1 問(wèn)題介紹
        8.3.2 網(wǎng)頁(yè)質(zhì)量分析的相關(guān)工作
        8.3.3 問(wèn)題設(shè)定
        8.3.4 我們的算法
        8.3.5 實(shí)驗(yàn)部分
        8.3.6 結(jié)論
    8.4 本章小結(jié)
第9章 總結(jié)與展望
    9.1 本文的總結(jié)
    9.2 未來(lái)的展望
參考文獻(xiàn)
致謝
附錄A RIDE算法的補(bǔ)充說(shuō)明
    A.1 密集SIFT特征的朝向估計(jì)
        A.1.1 SIFT的實(shí)現(xiàn)
        A.1.2 重構(gòu)SIFT的整體朝向
    A.2 RIDE的推廣:RIDE-4和RIDE-8
        A.2.1 RIDE-2、RIDE-4和RIDE-8
        A.2.2 實(shí)驗(yàn)
個(gè)人簡(jiǎn)歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 黃巍;陳傳波;鄭運(yùn)平;吳雪麗;;可重疊矩形多值圖像表示及其上的幾何矩生成[J];計(jì)算機(jī)科學(xué);2008年10期

2 陶金金;黃秀清;陸云;高強(qiáng);;基于重疊矩形圖像表示方法的貝塞爾-傅里葉矩快速計(jì)算[J];軟件導(dǎo)刊;2013年07期

3 曹奎,馮玉才,王元珍;一種基于顏色的圖像表示及全局相似檢索技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;2001年09期

4 程兵,賈新春,鄭南寧,袁澤劍;基于水平差集的多精度圖像表示及繪制[J];西安交通大學(xué)學(xué)報(bào);2002年04期

5 黃巍;陳傳波;鄭運(yùn)平;吳雪麗;;基于非對(duì)稱逆布局圖像表示的近鄰尋找算法[J];計(jì)算機(jī)工程與科學(xué);2009年03期

6 舒振球;趙春霞;張浩峰;;局部敏感的稀疏概念編碼及其在圖像表示中的應(yīng)用[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào);2014年01期

7 康寅;楊文川;;圖像表示及在檢索系統(tǒng)中的應(yīng)用[J];軟件;2011年01期

8 宋彥;蔣兵;戴禮榮;;基于多視覺(jué)碼本的圖像表示[J];模式識(shí)別與人工智能;2013年10期

9 劉艷麗,曹奎;一種基于PCA的圖像表示與檢索技術(shù)[J];計(jì)算機(jī)應(yīng)用與軟件;2003年04期

10 張琳波;王春恒;肖柏華;邵允學(xué);;基于Bag-of-phrases的圖像表示方法[J];自動(dòng)化學(xué)報(bào);2012年01期


相關(guān)博士學(xué)位論文 前10條

1 江波;基于圖理論與稀疏約束模型的圖像表示、匹配與識(shí)別[D];安徽大學(xué);2015年

2 謝凌曦;基于局部特征的圖像表示模型理論與實(shí)踐[D];清華大學(xué);2015年

3 李大瑞;基于大規(guī)模視覺(jué)模式學(xué)習(xí)的高性能圖像表示[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年

4 黃巍;基于可重疊矩形子模式的圖像表示和操作方法研究[D];華中科技大學(xué);2008年

5 李亞峰;圖像表示的若干問(wèn)題研究[D];西安電子科技大學(xué);2011年

6 吳中;大規(guī)模圖像搜索中的圖像表示模型[D];清華大學(xué);2010年

7 肖延輝;基于矩陣分解的圖像表示理論及其應(yīng)用研究[D];北京交通大學(xué);2014年

8 吳雪麗;基于斜面分解的非對(duì)稱逆布局圖像表示方法與處理算法研究[D];華中科技大學(xué);2009年

9 鄭運(yùn)平;基于Gouraud陰影法和多子模式的NAM圖像表示方法研究[D];華中科技大學(xué);2008年

10 夏暉;矩形NAM圖像表示模型的存儲(chǔ)與運(yùn)算方法研究[D];華中科技大學(xué);2009年


相關(guān)碩士學(xué)位論文 前2條

1 焦緒國(guó);基于單層稀疏自編碼和支持向量機(jī)的場(chǎng)景分類[D];重慶大學(xué);2015年

2 陸永亮;基于偏微分方程和多邊形的非對(duì)稱逆布局圖像表示方法研究[D];華中科技大學(xué);2009年



本文編號(hào):2849410

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2849410.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶17c9b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com