大規(guī)模圖像檢索中哈希排序方法研究
本文選題:自適應(yīng)權(quán)重 + 哈希位加權(quán); 參考:《吉林大學(xué)》2017年碩士論文
【摘要】:21世紀(jì)以來(lái),隨著各種數(shù)碼拍照設(shè)備以及圖像處理工具的不斷普及,海量圖像數(shù)據(jù)涌入人們的生活之中,現(xiàn)實(shí)中對(duì)圖片檢索、圖像識(shí)別的需求使得在大型圖像庫(kù)中基于圖像內(nèi)容的檢索變得非常重要。為了提高圖像檢索的效率,研究人員通過(guò)哈希方法將圖像映射為二值哈希碼,根據(jù)圖像對(duì)應(yīng)哈希碼間的漢明距離來(lái)度量圖像的相似程度。該方法具有壓縮存儲(chǔ)和快速查詢的優(yōu)勢(shì),不過(guò)仍有不足之處。當(dāng)使用漢明距離排序時(shí),哈希過(guò)程中的量化通常會(huì)使其辨別能力退化,與查詢圖像具有相同漢明距離的圖像數(shù)量很多,這將導(dǎo)致不能有效地對(duì)這些圖像進(jìn)行排序,檢索性能有限。因此,有必要對(duì)圖像進(jìn)行更細(xì)粒度的排序,哈希位加權(quán)已被證明是有效的解決方案。本文在前人對(duì)錨點(diǎn)圖的研究基礎(chǔ)上,利用數(shù)據(jù)點(diǎn)與錨點(diǎn)間的局部鄰近關(guān)系矩陣來(lái)近似計(jì)算數(shù)據(jù)點(diǎn)間的原始相似性,克服了標(biāo)準(zhǔn)歐氏度量不能嚴(yán)格捕獲數(shù)據(jù)點(diǎn)間全局相似性的缺點(diǎn)。該方法能夠獲得任何數(shù)據(jù)集中樣本間相似性。本文基于查詢點(diǎn)和數(shù)據(jù)庫(kù)樣本之間的相似性利用各哈希函數(shù)的辨別能力及它們對(duì)最近鄰搜索能力的補(bǔ)充來(lái)學(xué)習(xí)一組查詢自適應(yīng)位權(quán)重,據(jù)此提出一種新的基于帶權(quán)漢明距離的哈希排序方法。該方法將不同的權(quán)重分配給各個(gè)哈希位用以區(qū)分具有相同漢明距離的返回結(jié)果,從而獲得更精細(xì)和準(zhǔn)確的排序,這是一種能夠用于所有種類哈希算法的通用加權(quán)方法,對(duì)數(shù)據(jù)分布沒(méi)有嚴(yán)格的要求。最后根據(jù)本文提出的哈希排序方法在兩個(gè)圖像檢索領(lǐng)域公認(rèn)的數(shù)據(jù)集MNIST和NUS-WIDE上進(jìn)行實(shí)驗(yàn),表明本文所提出的方法比現(xiàn)有技術(shù)方法更具通用性和有效性。
[Abstract]:Since the 21st century, with the continuous popularity of various digital photography equipment and image processing tools, mass image data has poured into people's lives, and in reality, image retrieval. The requirement of image recognition makes the retrieval based on image content very important in large image database. In order to improve the efficiency of image retrieval, the researchers map the image to binary hash code by hash method, and measure the similarity of the image according to the hamming distance between the corresponding hash codes. This method has the advantages of compressed storage and fast query, but it still has some disadvantages. When the hamming distance is used in sorting, the quantization in the hash process usually degrades its discriminative ability. There are a lot of images with the same hamming distance as the query image, which will lead to the inability to sort these images effectively. Search performance is limited. Therefore, it is necessary to sort images more fine-grained. Hash weighting has proved to be an effective solution. In this paper, based on previous studies of anchor graph, the local proximity matrix between data points and anchors is used to approximate the original similarity between data points. It overcomes the shortcoming that standard Euclidean metric can not capture the global similarity between data points strictly. This method can obtain similarity between samples in any dataset. Based on the similarity between query points and database samples, this paper uses the discriminative ability of each hash function and their complement to the nearest neighbor search ability to learn a set of query adaptive bit weights. A new hash sorting method based on weighted hamming distance is proposed. In this method, different weights are assigned to each hash bit to distinguish the return results with the same hamming distance, so that more precise and accurate sorting can be obtained, which is a general weighting method that can be used in all kinds of hash algorithms. There is no strict requirement for data distribution. Finally, experiments are carried out on two recognized data sets, MNIST and NUS-WIDE, according to the hash sorting method proposed in this paper. The results show that the proposed method is more general and effective than the existing methods.
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 葉軍偉;;哈希表沖突處理方法淺析[J];科技視界;2014年06期
2 張勇,雷振明;基于流應(yīng)用中的哈希查表性能研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年25期
3 馬如林;蔣華;張慶霞;;一種哈希表快速查找的改進(jìn)方法[J];計(jì)算機(jī)工程與科學(xué);2008年09期
4 蔣大宏;動(dòng)態(tài)哈希方法[J];計(jì)算機(jī)工程;1993年01期
5 蔣大宏;實(shí)現(xiàn)檢索代價(jià)最優(yōu)的動(dòng)態(tài)哈希法[J];計(jì)算機(jī)工程與應(yīng)用;1994年Z2期
6 劉冠福;;動(dòng)態(tài)哈希表的設(shè)計(jì)及應(yīng)用[J];計(jì)算機(jī)時(shí)代;1996年02期
7 朱芳芳;李訓(xùn)根;;改進(jìn)的哈希表查找算法[J];杭州電子科技大學(xué)學(xué)報(bào);2013年05期
8 趙宇;;基于哈希表查找方法的優(yōu)勢(shì)及其算法的改進(jìn)[J];中小企業(yè)管理與科技(下旬刊);2012年03期
9 高文利;朱麗;;哈希表在計(jì)算語(yǔ)言學(xué)中的運(yùn)用[J];現(xiàn)代語(yǔ)文(語(yǔ)言研究版);2009年06期
10 賀元香;史寶明;;除留余數(shù)法建立哈希表的方法改進(jìn)[J];甘肅科技;2008年07期
相關(guān)會(huì)議論文 前2條
1 朱芳芳;李訓(xùn)根;;改進(jìn)的哈希表查找算法[A];浙江省電子學(xué)會(huì)2013學(xué)術(shù)年會(huì)論文集[C];2013年
2 趙競(jìng);余宏亮;張X;鄭緯民;;廣域網(wǎng)分布式哈希表存儲(chǔ)副本可靠性的維護(hù)[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊(cè))[C];2007年
相關(guān)博士學(xué)位論文 前4條
1 黃慧群;內(nèi)容中心網(wǎng)絡(luò)的查表技術(shù)研究[D];解放軍信息工程大學(xué);2014年
2 季劍秋;面向大規(guī)模數(shù)據(jù)相似計(jì)算和搜索的哈希方法研究[D];清華大學(xué);2015年
3 彭建章;非阻塞算法與多進(jìn)程網(wǎng)絡(luò)程序優(yōu)化研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2013年
4 付海燕;基于圖像哈希的大規(guī)模圖像檢索方法研究[D];大連理工大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 郝廣洋;語(yǔ)音感知哈希及其在密文語(yǔ)音檢索中的應(yīng)用研究[D];西南交通大學(xué);2015年
2 黃志騫;基于迭代量化的用于近似最近鄰檢索的哈希方法[D];華南理工大學(xué);2015年
3 王聰;基于局部敏感哈希的聲源定位方法[D];大連理工大學(xué);2015年
4 鄧慧茹;面向大規(guī)模視覺檢索的哈希學(xué)習(xí)[D];西安電子科技大學(xué);2014年
5 張梁;基于局部敏感哈希的近似近鄰查詢算法研究[D];南京郵電大學(xué);2015年
6 任劉姣;感知哈希及其在語(yǔ)音檢索與認(rèn)證中的應(yīng)用[D];西南交通大學(xué);2016年
7 王戊林;面向視頻檢索的高效哈希技術(shù)研究[D];山東大學(xué);2016年
8 黃賽金;基于譜哈希的分布式近鄰存儲(chǔ)方法的設(shè)計(jì)與實(shí)現(xiàn)[D];南京郵電大學(xué);2016年
9 孫永;基于哈希的快速多標(biāo)記學(xué)習(xí)算法研究[D];南京郵電大學(xué);2016年
10 李蕾;基于哈希的圖像檢索研究[D];北京交通大學(xué);2017年
,本文編號(hào):1822934
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1822934.html