天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于二值哈希和量化的近似最近鄰搜索研究

發(fā)布時間:2020-08-16 19:10
【摘要】:近似最近鄰搜索是多媒體與計算機視覺領(lǐng)域的基礎(chǔ)研究方向,在大規(guī)模圖像檢索、行人再識別等實際問題中獲得廣泛研究和應(yīng)用。給定一個查詢樣本,近似最近鄰搜索方法的目標是以次線性甚至常數(shù)時間復(fù)雜度從大規(guī)模數(shù)據(jù)集中返回查詢樣本的最近鄰。目前主流的近似最近鄰搜索技術(shù)可以分為三類,分別是基于樹的方法,基于二值哈希的方法和基于量化的方法。由于基于二值哈希的方法和基于量化的方法具有特征距離計算快和內(nèi)存占用低的優(yōu)勢,近年來獲得了更多的研究關(guān)注。其中,二值哈希方法將原始高維數(shù)據(jù)特征投影為低維二值碼,而量化方法將原始高維特征投影為碼本中最近的碼本單詞的整數(shù)索引。本文基于對二值哈希方法和量化方法的研究,提出了三種近似最近鄰檢索框架,應(yīng)用于圖像檢索任務(wù)。(1)基于線性距離約束的哈希通用框架。二值哈希方法通常需要學(xué)習一系列的哈希函數(shù)來產(chǎn)生規(guī)定長度的二值碼。本文提出一種基于線性距離約束的哈希通用框架,同時結(jié)合了成對保距約束和單點性約束學(xué)習哈希函數(shù)。本文設(shè)計了一種新穎的成對線性保距目標,保證原始的歐氏距離與漢明距離之間具有線性變換關(guān)系,充分體現(xiàn)了二值哈希方法的保距原則。基于不同的單點性約束,本文提出了五種方法去實例化該哈希通用框架。(2)深度有監(jiān)督量化框架;诹炕姆椒壳按蠖嗖捎脽o監(jiān)督的方式進行學(xué)習,忽略了數(shù)據(jù)集中樣本包含的語義信息,而且通常將特征學(xué)習和碼本學(xué)習分為兩個步驟進行,不能保證碼本與特征相匹配,影響了近似最近鄰檢索的準確度。本文提出了一種深度有監(jiān)督量化框架以解決該問題。該框架將卷積神經(jīng)網(wǎng)絡(luò)和量化網(wǎng)絡(luò)融合到一個統(tǒng)一的深度架構(gòu)中,同時學(xué)習圖像的深度特征和碼本;诓煌拇a本學(xué)習方法,本文提出了三種深度有監(jiān)督量化方法去實例化該深度有監(jiān)督量化框架。(3)基于生成對抗網(wǎng)絡(luò)的深度無監(jiān)督量化框架。目前深度哈希方法較少在無監(jiān)督情境下應(yīng)用,其主要原因是類別或標簽等語義信息的缺失給深度網(wǎng)絡(luò)的訓(xùn)練帶來難度。然而,在很多實際應(yīng)用中獲取標簽或類別等信息的代價是昂貴的甚至是不可能實現(xiàn)的。本文提出了一種新穎的深度無監(jiān)督量化方法,可以同時學(xué)習特征表達和量化器;谏蓪咕W(wǎng)絡(luò),量化器中每個聚類中心學(xué)習生成一張真實感的圖像。優(yōu)化目標是通過同時在圖像空間和特征空間進行聚類中心的優(yōu)化,使得獲得的聚類中心能夠自動抓取圖像分布,獲得區(qū)分性信息。綜上,本文主要研究圖像檢索中的二值哈希方法和量化方法,并提出了三種近似最近鄰檢索框架。在公共數(shù)據(jù)集上的測試結(jié)果表明,所提出框架的實例化方法相對于現(xiàn)有近似最近鄰搜索方法獲得了較大的檢索性能提升。
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2019
【分類號】:TP391.41
【圖文】:

哈希,二值,檢索方法,最近鄰


1.2.2基于二值哈希的方法逡逑基于哈希的方法中最為流行的是二值哈希方法。二值哈希方法的通用流程逡逑如圖1.2所示。二值哈希方法需要通過哈希函數(shù)將原始高維特征映射為低維漢明逡逑空間中的二值碼,原始高維特征之間的歐氏距離被二值碼之間的漢明距離近似逡逑代替。由于二值哈希方法在數(shù)據(jù)庫中僅僅需要存儲二進制碼,因此存儲空間占用逡逑比較低;另一方面,二值碼之間的漢明距離可以被現(xiàn)有CPU架構(gòu)中的指令高效逡逑地計算,因此漢明距離計算比較快。由于這兩方面的優(yōu)勢,二值哈希方法受到越逡逑來越多的關(guān)注和研宄。逡逑\逡逑W\逡逑t邐100邐10?逡逑O邐oootf^l邋00,11^逡逑?邋—邐逡逑oio邋on逡逑空間存儲:高維浮點型向量邐空間栜:低維二值碼逡逑si離計算:歐氏距離邐距離計算:漢明距離逡逑圖像s間逡逑圖1.2二值哈希方法流程。逡逑一般來說,二值哈希方法通常需要學(xué)習一系列的哈希函數(shù)來產(chǎn)生規(guī)定比特數(shù)逡逑目的二值碼。圖1.3展示了基于二值

檢索方法,最近鄰,碼本


一旦獲得了查詢樣本的量化結(jié)果(即碼本單詞索引),查詢樣本與數(shù)據(jù)逡逑庫中每個樣本之間的距離計算可以通過查表完成。綜上所述,量化方法作為一種逡逑特殊的哈希方法,同樣具有距離計算快、存儲空間占用低的優(yōu)勢。圖1.4介紹基逡逑于量化的近似最近鄰檢索的基本流程。逡逑數(shù)據(jù)'"庫邐/邐數(shù)ig庫逡逑線下邐——逡逑w±邐碼本—}邐逡逑°邋^邋so13逡逑B3逡逑查詢樣本邋^^邋p邐l*J ̄囡逐]■—逡逑'邋V邋’邐[疆]邐_逡逑圖1.4基于量化的近似最近鄰檢索方法。逡逑由于碼本單詞通常是與原始高維特征處于同一空間,均為高維浮點型向量,逡逑因此不同的碼本單詞對之間距離相等的概率非常低,可以克服二值哈希方法中逡逑不同二值碼對具有相同漢明距離的問題。另一方面,量化方法的優(yōu)化目標沒有類逡逑9逡逑

漢明距離,成對數(shù)據(jù),歐氏距離,映射圖


邋j)邋=邋L邋—邋bTbj邋—邋(l^xi邋-邋bi)r(l2,xl邋—邋bj).邐(2.4)逡逑對于該線性保距目標,本文給出一個可視化的解釋,見圖2.1。從逡逑ANN_SIFT1M數(shù)據(jù)集[66]中隨機選。保埃埃埃皩(shù)據(jù)點,并計算它們之間的歐氏逡逑距離。然后使用ITQ方法[9]生成每個數(shù)據(jù)點的二進制碼,碼長32比特,再計算逡逑I邐每對數(shù)據(jù)點之間的漢明距離。每對數(shù)據(jù)點用一個藍色的圓表示,紅色的實線通過逡逑;邐對這些距離對進行最小二乘擬合生成,即本文提出的線性保距目標采用的方法。逡逑所有的數(shù)據(jù)對分布在紅色的實線兩邊的一個長條形區(qū)域中?梢灾庇^地發(fā)現(xiàn):如逡逑果這個長條形區(qū)域向中間紅色實線收縮,也就是越窄,哈希函數(shù)的保距性能越逡逑好。這個收縮操作使得具有相同歐氏距離的數(shù)據(jù)對有更相似的漢明距離,間接地逡逑實現(xiàn)了保距目標。逡逑與本文的方法相似,BRE方法[1Q]也應(yīng)用了保距約束,但是BRE通過最小逡逑化歸一化的漢明距離和歸一化的歐氏距離之間的偏差實現(xiàn)保距。它可以被看成逡逑本文的線性保距目標在a邋=邐=邋0時的一個特例

【相似文獻】

相關(guān)期刊論文 前10條

1 姜大光;孫賀娟;易軍凱;;基于距離的相似最近鄰搜索算法研究[J];北京化工大學(xué)學(xué)報(自然科學(xué)版);2017年05期

2 程碧達;;靜音鉆[J];科學(xué)啟蒙;2017年Z1期

3 周屹;楊澤雪;邢傳軍;曲天偉;;一種連續(xù)最近鄰查詢的優(yōu)化方法[J];黑龍江工程學(xué)院學(xué)報(自然科學(xué)版);2013年04期

4 鄧瑾;周梅;;基于R樹及其變種的最近鄰查詢研究[J];現(xiàn)代計算機;2013年09期

5 王丹丹;郝忠孝;;道路網(wǎng)絡(luò)中的多類型K最近鄰查詢[J];計算機工程與應(yīng)用;2012年03期

6 劉文遠;杜穎;陳子軍;;不確定數(shù)據(jù)上范圍受限的最近鄰查詢算法[J];小型微型計算機系統(tǒng);2012年06期

7 蔡賀;張睿;;k最近鄰域分類算法分析與研究[J];甘肅科技;2012年18期

8 管瑩瑩;肖迎元;李玉坤;;基于路網(wǎng)的連續(xù)K最近鄰查詢[J];天津理工大學(xué)學(xué)報;2012年06期

9 周屹;;不確定對象的反向最近鄰查詢研究[J];黑龍江工程學(xué)院學(xué)報(自然科學(xué)版);2012年04期

10 劉彬;王建國;;范圍最近鄰查詢方法研究[J];泰山學(xué)院學(xué)報;2011年03期

相關(guān)會議論文 前10條

1 盛梅紅;沙朝鋒;宮學(xué)慶;嵇曉;周傲英;;道路網(wǎng)絡(luò)環(huán)境中的多對象最近鄰查詢[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2006年

2 張曉峰;王麗珍;肖清;趙麗紅;;基于概念劃分的連續(xù)最近鄰查詢研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年

3 劉月清;章勇;;一種改進的動態(tài)最近鄰聚類算法[A];全國自動化新技術(shù)學(xué)術(shù)交流會會議論文集(一)[C];2005年

4 鄭健;皮德常;;基于共享最近鄰的聚類和孤立點檢測算法[A];第一屆中國高校通信類院系學(xué)術(shù)研討會論文集[C];2007年

5 劉先康;梁菁;任杰;蔣光慶;;修正最近鄰模糊分類算法在艦船目標識別中的應(yīng)用[A];全國第4屆信號和智能信息處理與應(yīng)用學(xué)術(shù)會議論文集[C];2010年

6 鐘秉翔;;一種基于虛假最近鄰點法的話務(wù)量預(yù)測模型[A];中國自動化學(xué)會控制理論專業(yè)委員會B卷[C];2011年

7 馮yN;李霞;;一種K最近鄰分類的改進算法及應(yīng)用[A];2011年全國通信安全學(xué)術(shù)會議論文集[C];2011年

8 李蘭芳;劉開培;羅歡;;最近鄰模式識別法在車載FSK信號檢測中的應(yīng)用[A];首屆信息獲取與處理學(xué)術(shù)會議論文集[C];2003年

9 周波;石愛國;;混沌序列最近鄰多步預(yù)報算法[A];全國第五屆信號和智能信息處理與應(yīng)用學(xué)術(shù)會議?(第一冊)[C];2011年

10 林麗;馮少榮;薛永生;周曉丹;黃海;;數(shù)量關(guān)聯(lián)規(guī)則發(fā)現(xiàn)中的最近鄰聚類方法研究[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2006年

相關(guān)博士學(xué)位論文 前10條

1 王敏;基于二值哈希和量化的近似最近鄰搜索研究[D];中國科學(xué)技術(shù)大學(xué);2019年

2 許潔;基于大間隔最近鄰的度量學(xué)習算法研究[D];西安電子科技大學(xué);2018年

3 張軍旗;支持最近鄰查找的高維空間索引[D];復(fù)旦大學(xué);2007年

4 楊澤雪;空間連接及最近鄰變體查詢研究[D];哈爾濱理工大學(xué);2014年

5 張婷;基于量化的近似最近鄰搜索技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2017年

6 孫冬璞;時空數(shù)據(jù)庫多類型最近鄰查詢的研究[D];哈爾濱理工大學(xué);2010年

7 王建峰;基于哈希的最近鄰查找[D];中國科學(xué)技術(shù)大學(xué);2015年

8 張得天;時間依賴路網(wǎng)高效k最近鄰查詢混搭機制的研究[D];中國科學(xué)技術(shù)大學(xué);2014年

9 杜欽生;高維空間的K最近鄰查詢及連接問題研究[D];吉林大學(xué);2015年

10 李鑫;基于度量學(xué)習的最近鄰信用評分模型研究[D];上海大學(xué);2017年

相關(guān)碩士學(xué)位論文 前10條

1 郭瑩瑩;空間數(shù)據(jù)庫中線段組最近鄰查詢方法研究[D];哈爾濱理工大學(xué);2018年

2 劉娜;基于路網(wǎng)數(shù)據(jù)的云端安全最近鄰查詢方法研究[D];安徽工業(yè)大學(xué);2018年

3 陳瑞;路網(wǎng)下地理社交文本最近鄰查詢研究[D];浙江大學(xué);2018年

4 趙亮;面向流式數(shù)據(jù)近似最近鄰查詢的降維與量化方法研究[D];南京理工大學(xué);2018年

5 李傳青;基于殘差量化優(yōu)化的最近鄰圖像檢索研究[D];合肥工業(yè)大學(xué);2018年

6 夏超;短信聯(lián)系人關(guān)系判斷系統(tǒng)設(shè)計與實現(xiàn)[D];華中科技大學(xué);2017年

7 潘天雄;基于Wi-Fi的室內(nèi)三維定位算法研究[D];山西大學(xué);2018年

8 程珂;云環(huán)境下的多密鑰安全最近鄰查詢技術(shù)研究[D];安徽大學(xué);2018年

9 單廷佳;基于圖像特征的最近鄰搜算法研究[D];中國科學(xué)技術(shù)大學(xué);2017年

10 盧紅麗;基于Goldberg IT-PIR的最近鄰LBS隱私查詢協(xié)議研究及并行實現(xiàn)[D];西北農(nóng)林科技大學(xué);2017年



本文編號:2794826

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2794826.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3bb2d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com