基于二值哈希和量化的近似最近鄰搜索研究
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2019
【分類號】:TP391.41
【圖文】:
1.2.2基于二值哈希的方法逡逑基于哈希的方法中最為流行的是二值哈希方法。二值哈希方法的通用流程逡逑如圖1.2所示。二值哈希方法需要通過哈希函數(shù)將原始高維特征映射為低維漢明逡逑空間中的二值碼,原始高維特征之間的歐氏距離被二值碼之間的漢明距離近似逡逑代替。由于二值哈希方法在數(shù)據(jù)庫中僅僅需要存儲二進制碼,因此存儲空間占用逡逑比較低;另一方面,二值碼之間的漢明距離可以被現(xiàn)有CPU架構(gòu)中的指令高效逡逑地計算,因此漢明距離計算比較快。由于這兩方面的優(yōu)勢,二值哈希方法受到越逡逑來越多的關(guān)注和研宄。逡逑\逡逑W\逡逑t邐100邐10?逡逑O邐oootf^l邋00,11^逡逑?邋—邐逡逑oio邋on逡逑空間存儲:高維浮點型向量邐空間栜:低維二值碼逡逑si離計算:歐氏距離邐距離計算:漢明距離逡逑圖像s間逡逑圖1.2二值哈希方法流程。逡逑一般來說,二值哈希方法通常需要學(xué)習一系列的哈希函數(shù)來產(chǎn)生規(guī)定比特數(shù)逡逑目的二值碼。圖1.3展示了基于二值
一旦獲得了查詢樣本的量化結(jié)果(即碼本單詞索引),查詢樣本與數(shù)據(jù)逡逑庫中每個樣本之間的距離計算可以通過查表完成。綜上所述,量化方法作為一種逡逑特殊的哈希方法,同樣具有距離計算快、存儲空間占用低的優(yōu)勢。圖1.4介紹基逡逑于量化的近似最近鄰檢索的基本流程。逡逑數(shù)據(jù)'"庫邐/邐數(shù)ig庫逡逑線下邐——逡逑w±邐碼本—}邐逡逑°邋^邋so13逡逑B3逡逑查詢樣本邋^^邋p邐l*J ̄囡逐]■—逡逑'邋V邋’邐[疆]邐_逡逑圖1.4基于量化的近似最近鄰檢索方法。逡逑由于碼本單詞通常是與原始高維特征處于同一空間,均為高維浮點型向量,逡逑因此不同的碼本單詞對之間距離相等的概率非常低,可以克服二值哈希方法中逡逑不同二值碼對具有相同漢明距離的問題。另一方面,量化方法的優(yōu)化目標沒有類逡逑9逡逑
邋j)邋=邋L邋—邋bTbj邋—邋(l^xi邋-邋bi)r(l2,xl邋—邋bj).邐(2.4)逡逑對于該線性保距目標,本文給出一個可視化的解釋,見圖2.1。從逡逑ANN_SIFT1M數(shù)據(jù)集[66]中隨機選。保埃埃埃皩(shù)據(jù)點,并計算它們之間的歐氏逡逑距離。然后使用ITQ方法[9]生成每個數(shù)據(jù)點的二進制碼,碼長32比特,再計算逡逑I邐每對數(shù)據(jù)點之間的漢明距離。每對數(shù)據(jù)點用一個藍色的圓表示,紅色的實線通過逡逑;邐對這些距離對進行最小二乘擬合生成,即本文提出的線性保距目標采用的方法。逡逑所有的數(shù)據(jù)對分布在紅色的實線兩邊的一個長條形區(qū)域中?梢灾庇^地發(fā)現(xiàn):如逡逑果這個長條形區(qū)域向中間紅色實線收縮,也就是越窄,哈希函數(shù)的保距性能越逡逑好。這個收縮操作使得具有相同歐氏距離的數(shù)據(jù)對有更相似的漢明距離,間接地逡逑實現(xiàn)了保距目標。逡逑與本文的方法相似,BRE方法[1Q]也應(yīng)用了保距約束,但是BRE通過最小逡逑化歸一化的漢明距離和歸一化的歐氏距離之間的偏差實現(xiàn)保距。它可以被看成逡逑本文的線性保距目標在a邋=邐=邋0時的一個特例
【相似文獻】
相關(guān)期刊論文 前10條
1 姜大光;孫賀娟;易軍凱;;基于距離的相似最近鄰搜索算法研究[J];北京化工大學(xué)學(xué)報(自然科學(xué)版);2017年05期
2 程碧達;;靜音鉆[J];科學(xué)啟蒙;2017年Z1期
3 周屹;楊澤雪;邢傳軍;曲天偉;;一種連續(xù)最近鄰查詢的優(yōu)化方法[J];黑龍江工程學(xué)院學(xué)報(自然科學(xué)版);2013年04期
4 鄧瑾;周梅;;基于R樹及其變種的最近鄰查詢研究[J];現(xiàn)代計算機;2013年09期
5 王丹丹;郝忠孝;;道路網(wǎng)絡(luò)中的多類型K最近鄰查詢[J];計算機工程與應(yīng)用;2012年03期
6 劉文遠;杜穎;陳子軍;;不確定數(shù)據(jù)上范圍受限的最近鄰查詢算法[J];小型微型計算機系統(tǒng);2012年06期
7 蔡賀;張睿;;k最近鄰域分類算法分析與研究[J];甘肅科技;2012年18期
8 管瑩瑩;肖迎元;李玉坤;;基于路網(wǎng)的連續(xù)K最近鄰查詢[J];天津理工大學(xué)學(xué)報;2012年06期
9 周屹;;不確定對象的反向最近鄰查詢研究[J];黑龍江工程學(xué)院學(xué)報(自然科學(xué)版);2012年04期
10 劉彬;王建國;;范圍最近鄰查詢方法研究[J];泰山學(xué)院學(xué)報;2011年03期
相關(guān)會議論文 前10條
1 盛梅紅;沙朝鋒;宮學(xué)慶;嵇曉;周傲英;;道路網(wǎng)絡(luò)環(huán)境中的多對象最近鄰查詢[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2006年
2 張曉峰;王麗珍;肖清;趙麗紅;;基于概念劃分的連續(xù)最近鄰查詢研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
3 劉月清;章勇;;一種改進的動態(tài)最近鄰聚類算法[A];全國自動化新技術(shù)學(xué)術(shù)交流會會議論文集(一)[C];2005年
4 鄭健;皮德常;;基于共享最近鄰的聚類和孤立點檢測算法[A];第一屆中國高校通信類院系學(xué)術(shù)研討會論文集[C];2007年
5 劉先康;梁菁;任杰;蔣光慶;;修正最近鄰模糊分類算法在艦船目標識別中的應(yīng)用[A];全國第4屆信號和智能信息處理與應(yīng)用學(xué)術(shù)會議論文集[C];2010年
6 鐘秉翔;;一種基于虛假最近鄰點法的話務(wù)量預(yù)測模型[A];中國自動化學(xué)會控制理論專業(yè)委員會B卷[C];2011年
7 馮yN;李霞;;一種K最近鄰分類的改進算法及應(yīng)用[A];2011年全國通信安全學(xué)術(shù)會議論文集[C];2011年
8 李蘭芳;劉開培;羅歡;;最近鄰模式識別法在車載FSK信號檢測中的應(yīng)用[A];首屆信息獲取與處理學(xué)術(shù)會議論文集[C];2003年
9 周波;石愛國;;混沌序列最近鄰多步預(yù)報算法[A];全國第五屆信號和智能信息處理與應(yīng)用學(xué)術(shù)會議?(第一冊)[C];2011年
10 林麗;馮少榮;薛永生;周曉丹;黃海;;數(shù)量關(guān)聯(lián)規(guī)則發(fā)現(xiàn)中的最近鄰聚類方法研究[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2006年
相關(guān)博士學(xué)位論文 前10條
1 王敏;基于二值哈希和量化的近似最近鄰搜索研究[D];中國科學(xué)技術(shù)大學(xué);2019年
2 許潔;基于大間隔最近鄰的度量學(xué)習算法研究[D];西安電子科技大學(xué);2018年
3 張軍旗;支持最近鄰查找的高維空間索引[D];復(fù)旦大學(xué);2007年
4 楊澤雪;空間連接及最近鄰變體查詢研究[D];哈爾濱理工大學(xué);2014年
5 張婷;基于量化的近似最近鄰搜索技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2017年
6 孫冬璞;時空數(shù)據(jù)庫多類型最近鄰查詢的研究[D];哈爾濱理工大學(xué);2010年
7 王建峰;基于哈希的最近鄰查找[D];中國科學(xué)技術(shù)大學(xué);2015年
8 張得天;時間依賴路網(wǎng)高效k最近鄰查詢混搭機制的研究[D];中國科學(xué)技術(shù)大學(xué);2014年
9 杜欽生;高維空間的K最近鄰查詢及連接問題研究[D];吉林大學(xué);2015年
10 李鑫;基于度量學(xué)習的最近鄰信用評分模型研究[D];上海大學(xué);2017年
相關(guān)碩士學(xué)位論文 前10條
1 郭瑩瑩;空間數(shù)據(jù)庫中線段組最近鄰查詢方法研究[D];哈爾濱理工大學(xué);2018年
2 劉娜;基于路網(wǎng)數(shù)據(jù)的云端安全最近鄰查詢方法研究[D];安徽工業(yè)大學(xué);2018年
3 陳瑞;路網(wǎng)下地理社交文本最近鄰查詢研究[D];浙江大學(xué);2018年
4 趙亮;面向流式數(shù)據(jù)近似最近鄰查詢的降維與量化方法研究[D];南京理工大學(xué);2018年
5 李傳青;基于殘差量化優(yōu)化的最近鄰圖像檢索研究[D];合肥工業(yè)大學(xué);2018年
6 夏超;短信聯(lián)系人關(guān)系判斷系統(tǒng)設(shè)計與實現(xiàn)[D];華中科技大學(xué);2017年
7 潘天雄;基于Wi-Fi的室內(nèi)三維定位算法研究[D];山西大學(xué);2018年
8 程珂;云環(huán)境下的多密鑰安全最近鄰查詢技術(shù)研究[D];安徽大學(xué);2018年
9 單廷佳;基于圖像特征的最近鄰搜算法研究[D];中國科學(xué)技術(shù)大學(xué);2017年
10 盧紅麗;基于Goldberg IT-PIR的最近鄰LBS隱私查詢協(xié)議研究及并行實現(xiàn)[D];西北農(nóng)林科技大學(xué);2017年
本文編號:2794826
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2794826.html