面向圖像檢索和分類的監(jiān)督哈希方法研究
本文選題:哈希學習 + 圖像檢索 ; 參考:《山東大學》2017年碩士論文
【摘要】:近年來,隨著社會和經濟的快速發(fā)展,互聯網技術在我們的日常工作和生活中扮演著越來越重要的角色,而且隨著電子設備和社交媒體的普及,多媒體數據(文字、圖像和視頻等)增長迅速。圖像因其豐富的內容和強有力的表達形式更是深受人們的喜愛,并呈現指數型的增長趨勢,這就為圖像的檢索和存儲帶來一定的挑戰(zhàn)。最近鄰算法是信息檢索中的經典方法,但是在大規(guī)模的數據中進行精確的最近鄰查找是非常困難的。為了解決這一問題,近似近鄰查找算法得到廣大研究者的青睞。這種算法因其效率比較高,復雜度相對較低,結果相對準確,在近些年來成為學術研究的熱點。對于相似性檢索,傳統(tǒng)的方法是利用數據的原始特征進行相似性度量。當數據量較小時,這種方法效果比較好。但隨著數據量的增大和特征維數的增高,特征匹配因其極高的計算復雜度變得不再適用,同時對設備的存儲性能帶來了極大的挑戰(zhàn)。于是,哈希方法應運而生;诠5姆椒ㄒ蚱鋬(yōu)越的計算和存儲性能在近些年來發(fā)展迅速,受到越來越多學者和研究人員的關注;诠<夹g的相似性檢索方法將原始空間的數據特征信息映射到二維的海明空間,同時盡可能的保持原始數據的局部特性、語義信息等。通過計算哈希碼兩兩之間的海明距離,近似近鄰檢索能夠很快的返回檢索結果。哈希方法具有線性的檢索復雜度并且通過將數據轉化為緊致的二進制哈希碼,大大的降低了存儲代價,更有效的利用存儲空間,提高了存儲設備的性能。因此,由于哈希方法具有很高的性能,進而能夠更好的應用到大規(guī)模的數據檢索任務中。哈希方法可以根據學習過程中是否利用標簽分為兩類:非監(jiān)督方法和監(jiān)督方法。監(jiān)督哈希方法目的是在哈希碼學習過程中充分利用訓練數據的特征以及標簽,使得學到的哈希碼能夠保持原始數據的語義特性,因而相對于非監(jiān)督哈希方法來說具有更高的準確性,更能運用到一些實際的應用中。如今有很多監(jiān)督哈希方法被研究出來,有一些也有不錯的效果。但是大部分的哈希方法都是用來做檢索任務而不能用來分類。也就是說,我們并不能夠利用哈希碼來預測數據的類別,即使哈希碼本身含有豐富的語義信息。這是一種極大的信息損失。并且如果我們可以直接利用哈希碼進行分類,哈希方法則在實際項目中發(fā)揮更高的價值。針對這一問題,我們提出了一種可以進行標簽預測的監(jiān)督哈希學習方法,稱為類圖保持哈希。這種哈希方法能夠將語義標簽信息與哈希碼融合在一起,學到的哈希碼具有豐富的語義信息,并利用學到的映射矩陣和哈希碼,直接預測檢索數據的標簽。該方法首先通過同時保證標簽的一致性和保持類圖相似性學習到哈希函數,再通過最小化哈希碼跟哈希函數之間的量化誤差學到哈希碼,同時提出了一種迭代的優(yōu)化方法。該方法在三個圖像數據集上進行了實驗,并與當前效果比較好的集中哈希方法進行了對比。實驗結果表明無論在圖像檢索還是分類任務上,類圖保持哈希都有著比較好的效果。但是,現實生活中只有極少的圖片是本身就帶有標簽的,而大部分圖片都沒有標簽信息。如何能利用少量的標簽信息在大規(guī)模圖像中做檢索,是半監(jiān)督哈希方法所關注的問題。如今很多半監(jiān)督的哈希方法為了能更好的對目標函數進行優(yōu)化,往往采用先松弛再對連續(xù)數據閾值化的方法,這樣會有一些信息損失。并且,為了更好地利用圖像本身的特征,很多方法都用了相似性矩陣來保持相似性,而相似性矩陣一般都是n×n的,計算和存儲都相當耗時,甚至在大規(guī)模的數據集上無法運行。為此,我們提出了一種半監(jiān)督圖割哈希算法,能夠利用圖割的優(yōu)化方法直接對哈希碼進行優(yōu)化,減少了因松弛帶來的信息損失。同時,我們將相似性矩陣用稀疏嵌入的方法進行了降維,加快了計算的速度。我們在兩個數據集上進行了實驗,實驗結果說明了我們提出的半監(jiān)督圖割哈希在部分標簽上與其他幾種哈希方法相比,具有比較好的效果。
[Abstract]:In recent years, with the rapid development of society and economy, Internet technology has played an increasingly important role in our daily work and life, and with the popularity of electronic devices and social media, multimedia data (text, images, video and so on) are growing rapidly. The image is more profound because of its rich content and strong expression. It is popular with people and presents an exponential growth trend, which brings some challenges to the retrieval and storage of images. The nearest neighbor algorithm is the classic method of information retrieval, but it is very difficult to carry out accurate nearest neighbor search in large-scale data. In order to solve this problem, the approximate nearest neighbor search algorithm is widely used. Because of its high efficiency, relatively low complexity and relatively accurate results, this algorithm has become a hot topic in academic research in recent years. For similarity retrieval, the traditional method is to use the original characteristics of data to measure the similarity. When the data is small, the method is better. As the increase and the increase of feature dimension, feature matching is no longer applicable because of its high computational complexity. At the same time, it poses a great challenge to the storage performance of the equipment. The similarity retrieval method based on hash technology maps the data feature information of the original space to the two-dimensional Haim space, while maintaining the local characteristics and semantic information of the original data as much as possible. By calculating the Haim distance between the hash code 22, the approximate nearest neighbor retrieval can quickly return the retrieval results. The hash method has a linear retrieval complexity and can greatly reduce the storage cost by converting the data into a compact binary hash code, which makes use of storage space more efficiently and improves the performance of the storage device. Therefore, the hash method has high performance and can be better applied to large-scale data retrieval tasks. In the learning process, the Hashi method can be divided into two categories: unsupervised and supervised methods. The purpose of supervising Hashi method is to make full use of the characteristics and labels of the training data in the Hashi code learning process, so that the Hashi code can keep the semantic characteristics of the original data, thus relative to the unsupervised Hashi. The method is more accurate and can be used in some practical applications. There are many supervised hash methods that have been studied and some have good results. But most hash methods are used to do retrieval tasks and not to be used for classification. In other words, we are not able to use hash code to predict data. Even if Hashima itself contains rich semantic information, it is a great loss of information. And if we can categorize the hash code directly with hash code, the hash method plays a higher value in the actual project. In this case, we propose a supervised hash learning method that can be used for the label prediction. This hash method can combine semantic label information with hash code. The hash code learned has rich semantic information, and uses the learned mapping matrix and hash code to predict the label of the retrieved data directly. This method first guarantees the consistency of the label and keeps the class graph similarity at the same time. The hash function is studied, and a hash code is learned by minimizing the quantization error between hash and hash functions. An iterative optimization method is proposed. The method is tested on three image data sets and compared with the concentrated hash method which has a better effect at present. The experimental results show that no matter in the image retrieval, the hash method is also compared. But, only a few pictures in real life have labels on themselves, but most of them have no label information. How to use a small amount of label information to search in large images is a problem of semi supervised hash method. Now many of them are concerned about the hash method. In order to better optimize the target function, semi supervised hash method often uses a method of threshold relaxation and then continuous data threshold, so there will be some information loss. In order to make better use of the features of the image itself, many methods use the similarity matrix to maintain similarity, and the similarity matrix is generally n x n We propose a semi supervised graph cut hash algorithm, which can optimize the hash code directly by using the optimization method of graph cut to reduce the loss of information caused by relaxation. We have done a dimensionality reduction and speeded up the speed of calculation. We carried out an experiment on two data sets. The experimental results show that the semi supervised graph cut hash is better than the other hash methods on the partial label.
【學位授予單位】:山東大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP391.41
【相似文獻】
相關期刊論文 前10條
1 葉軍偉;;哈希表沖突處理方法淺析[J];科技視界;2014年06期
2 張勇,雷振明;基于流應用中的哈希查表性能研究[J];計算機工程與應用;2003年25期
3 馬如林;蔣華;張慶霞;;一種哈希表快速查找的改進方法[J];計算機工程與科學;2008年09期
4 蔣大宏;動態(tài)哈希方法[J];計算機工程;1993年01期
5 蔣大宏;實現檢索代價最優(yōu)的動態(tài)哈希法[J];計算機工程與應用;1994年Z2期
6 劉冠福;;動態(tài)哈希表的設計及應用[J];計算機時代;1996年02期
7 朱芳芳;李訓根;;改進的哈希表查找算法[J];杭州電子科技大學學報;2013年05期
8 趙宇;;基于哈希表查找方法的優(yōu)勢及其算法的改進[J];中小企業(yè)管理與科技(下旬刊);2012年03期
9 高文利;朱麗;;哈希表在計算語言學中的運用[J];現代語文(語言研究版);2009年06期
10 賀元香;史寶明;;除留余數法建立哈希表的方法改進[J];甘肅科技;2008年07期
相關會議論文 前2條
1 朱芳芳;李訓根;;改進的哈希表查找算法[A];浙江省電子學會2013學術年會論文集[C];2013年
2 趙競;余宏亮;張X;鄭緯民;;廣域網分布式哈希表存儲副本可靠性的維護[A];全國網絡與信息安全技術研討會論文集(下冊)[C];2007年
相關博士學位論文 前4條
1 黃慧群;內容中心網絡的查表技術研究[D];解放軍信息工程大學;2014年
2 季劍秋;面向大規(guī)模數據相似計算和搜索的哈希方法研究[D];清華大學;2015年
3 彭建章;非阻塞算法與多進程網絡程序優(yōu)化研究[D];中國科學技術大學;2013年
4 付海燕;基于圖像哈希的大規(guī)模圖像檢索方法研究[D];大連理工大學;2014年
相關碩士學位論文 前10條
1 郝廣洋;語音感知哈希及其在密文語音檢索中的應用研究[D];西南交通大學;2015年
2 黃志騫;基于迭代量化的用于近似最近鄰檢索的哈希方法[D];華南理工大學;2015年
3 王聰;基于局部敏感哈希的聲源定位方法[D];大連理工大學;2015年
4 鄧慧茹;面向大規(guī)模視覺檢索的哈希學習[D];西安電子科技大學;2014年
5 張梁;基于局部敏感哈希的近似近鄰查詢算法研究[D];南京郵電大學;2015年
6 任劉姣;感知哈希及其在語音檢索與認證中的應用[D];西南交通大學;2016年
7 王戊林;面向視頻檢索的高效哈希技術研究[D];山東大學;2016年
8 黃賽金;基于譜哈希的分布式近鄰存儲方法的設計與實現[D];南京郵電大學;2016年
9 孫永;基于哈希的快速多標記學習算法研究[D];南京郵電大學;2016年
10 李蕾;基于哈希的圖像檢索研究[D];北京交通大學;2017年
,本文編號:1775528
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1775528.html