基于核典型相關(guān)分析與神經(jīng)網(wǎng)絡(luò)的跨模態(tài)哈希算法研究
本文關(guān)鍵詞:基于核典型相關(guān)分析與神經(jīng)網(wǎng)絡(luò)的跨模態(tài)哈希算法研究 出處:《安徽大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 跨模態(tài)哈希算法 跨模態(tài)數(shù)據(jù)檢索 錨點(diǎn)核典型相關(guān)分析算法 神經(jīng)網(wǎng)絡(luò)
【摘要】:近年來,隨著各種模態(tài)數(shù)據(jù)的快速增長,如何實(shí)現(xiàn)跨模態(tài)數(shù)據(jù)之間的相互檢索已經(jīng)成為信息檢索領(lǐng)域中的一個(gè)研究熱點(diǎn)。哈希算法是一種非常有效的信息檢索方法,具有占用儲(chǔ)存空間小和檢索速度快的優(yōu)點(diǎn)。哈希算法可以分成單模態(tài)哈希算法與跨模態(tài)哈希算法,單模態(tài)哈希算法用于單一模態(tài)數(shù)據(jù)之間的信息檢索,跨模態(tài)哈希算法用于不同模態(tài)數(shù)據(jù)之間的信息檢索。哈希算法的核心思想是先通過哈希函數(shù)將數(shù)據(jù)轉(zhuǎn)換成對(duì)應(yīng)的哈希編碼串,其中哈希編碼串之間的漢明距離與原始數(shù)據(jù)之間的語義相似度相對(duì)應(yīng),然后通過計(jì)算哈希編碼串之間的漢明距離返回檢索結(jié)果。本文提出了兩種不同的跨模態(tài)哈希算法:基于核典型相關(guān)分析的跨模態(tài)哈希算法(KCMH)和基于神經(jīng)網(wǎng)絡(luò)的跨模態(tài)哈希算法(NNCH)。1.提出了基于核典型相關(guān)分析的跨模態(tài)哈希算法(KCMH)。首先,通過錨點(diǎn)核典型相關(guān)分析算法(AKCCA)進(jìn)行公共核空間的學(xué)習(xí),將不同模態(tài)的數(shù)據(jù)映射到公共核空間中,該部分對(duì)同一模態(tài)內(nèi)數(shù)據(jù)之間的相關(guān)性和不同模態(tài)間數(shù)據(jù)之間的相關(guān)性進(jìn)行考慮。不同于現(xiàn)有的公共空間的學(xué)習(xí)算法,AKCCA算法結(jié)合了典型相關(guān)分析算法、K-means算法以及核技巧,可以非常有效地學(xué)習(xí)到數(shù)據(jù)之間的非線性關(guān)系。在學(xué)習(xí)到公共核空間之后,利用內(nèi)積與漢明距離的對(duì)應(yīng)關(guān)系提出相應(yīng)的目標(biāo)函數(shù)。最后,使用迭代優(yōu)化算法進(jìn)行最優(yōu)化求解。2.提出了基于神經(jīng)網(wǎng)絡(luò)的跨模態(tài)哈希算法(NNCH),該算法成功地將神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用到跨模態(tài)哈希算法領(lǐng)域中。神經(jīng)網(wǎng)絡(luò)是一種模仿生物大腦活動(dòng)的簡化生物模型,它在人工智能、計(jì)算機(jī)視覺以及語音識(shí)別等領(lǐng)域有著廣泛應(yīng)用。在NNCH算法中,提出了獨(dú)特且非常有效的網(wǎng)絡(luò)結(jié)構(gòu)、損失函數(shù)以及神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法。NNCH算法的神經(jīng)網(wǎng)絡(luò)是由圖片神經(jīng)網(wǎng)絡(luò)和文字神經(jīng)網(wǎng)絡(luò)組成,其中圖片神經(jīng)網(wǎng)絡(luò)主要是對(duì)圖片進(jìn)行二進(jìn)制編碼,文字神經(jīng)網(wǎng)絡(luò)主要是對(duì)文字進(jìn)行二進(jìn)制編碼,圖片神經(jīng)網(wǎng)絡(luò)和文字神經(jīng)網(wǎng)絡(luò)通過共享分類器權(quán)重的方式連接起來。NNCH算法提出了將Softmax分類損失與哈希特性損失相結(jié)合的損失函數(shù),并且利用該損失函數(shù)和caffe深度學(xué)習(xí)框架完成神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。
[Abstract]:In recent years, with the rapid growth of various modal data. How to achieve cross-modal data retrieval has become a research hotspot in the field of information retrieval. Hash algorithm is a very effective information retrieval method. The hashing algorithm can be divided into single mode hash algorithm and cross mode hash algorithm, and single mode hash algorithm is used for information retrieval between single mode data. Cross-modal hash algorithm is used to retrieve information between different modes of data. The key idea of the hashing algorithm is to convert the data into the corresponding hash encoding string through the hash function. The hamming distance between the hash coding string and the semantic similarity between the original data corresponds to each other. Then the hamming distance between the hash coding strings is calculated to return the retrieval results. In this paper, two different cross-modal hash algorithms are proposed: the cross-modal hash algorithm based on kernel canonical correlation analysis (KCMH). And neural network-based cross-modal hashing algorithm / NNCH.1.A cross-modal hash algorithm based on kernel canonical correlation analysis is proposed. First of all. The common kernel space is studied by the anchor kernel canonical correlation analysis algorithm (AKCCA), and the data of different modes are mapped to the common kernel space. This part considers the correlation between the data in the same mode and the data between different modes. It is different from the existing learning algorithm in common space. The AKCCA algorithm combines the typical correlation analysis algorithm with K-means algorithm and kernel techniques, which can effectively learn the nonlinear relationship between the data, after learning the common kernel space. Using the corresponding relation between inner product and hamming distance, the corresponding objective function is proposed. Finally, the iterative optimization algorithm is used to solve the optimization problem. 2. A cross-modal hash algorithm based on neural network is proposed. The algorithm successfully applies neural network technology to the field of cross-modal hashing algorithm. Neural network is a simplified biological model that mimics biological brain activity and is applied in artificial intelligence. Computer vision and speech recognition are widely used. In the NNCH algorithm, a unique and very effective network structure is proposed. Loss function and neural network training method. The neural network of NNCH algorithm is composed of picture neural network and text neural network, in which picture neural network is mainly binary coding of pictures. Text neural network is mainly used for binary coding of text. Image neural network and text neural network are connected by sharing classifier weights. NNCH algorithm proposes a loss function which combines Softmax classification loss with hash characteristic loss. The loss function and the caffe depth learning framework are used to complete the training of neural network.
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP183;TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳一驕;盧錫城;孫志剛;;面向流管理的哈希算法研究[J];計(jì)算機(jī)工程與科學(xué);2008年04期
2 鄒保平;;基于一致哈希算法的用電信息采集系統(tǒng)研究[J];電力信息化;2011年06期
3 劉華珠;賀前華;;基于哈希算法的網(wǎng)絡(luò)橋接器地址維護(hù)方法(英文)[J];科學(xué)技術(shù)與工程;2008年17期
4 王遠(yuǎn);;可重構(gòu)哈希算法芯片的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2012年04期
5 張江,傅鶴崗;基于關(guān)聯(lián)規(guī)則的二維哈希算法的改進(jìn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2005年08期
6 唐銘;史長瓊;周愷卿;張大方;;倒插入分段哈希算法[J];計(jì)算機(jī)應(yīng)用;2011年02期
7 孫陽;朱宏峰;劉天華;;一種新型抗旋轉(zhuǎn)攻擊的魯棒哈希算法[J];小型微型計(jì)算機(jī)系統(tǒng);2011年04期
8 賀賢明,邵雷兵;一種基于學(xué)習(xí)的自適應(yīng)哈希算法研究[J];計(jì)算機(jī)應(yīng)用與軟件;2004年11期
9 邵雷兵,莊毅;一種基于學(xué)習(xí)的自適應(yīng)哈希算法研究[J];微電子學(xué)與計(jì)算機(jī);2004年08期
10 陳青華;;一種新型的圖像哈希算法[J];兵工自動(dòng)化;2011年05期
相關(guān)會(huì)議論文 前3條
1 劉宗斌;馬原;荊繼武;夏魯寧;;SM3哈希算法的硬件實(shí)現(xiàn)與研究[A];第26次全國計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2011年
2 文振q;朱為總;歐陽杰;高金花;;一種魯棒可區(qū)分的視頻感知哈希算法[A];第18屆全國多媒體學(xué)術(shù)會(huì)議(NCMT2009)、第5屆全國人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2009)、第5屆全國普適計(jì)算學(xué)術(shù)會(huì)議(PCC2009)論文集[C];2009年
3 文振q;高金花;劉朋飛;杜以華;張萌;;基于分塊DCT和PCA的圖像感知哈希算法研究[A];第十五屆全國圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年
相關(guān)博士學(xué)位論文 前6條
1 金仲明;基于哈希算法的海量多媒體數(shù)據(jù)檢索研究[D];浙江大學(xué);2015年
2 焦玉華;音頻感知哈希算法研究[D];哈爾濱工業(yè)大學(xué);2010年
3 趙玉鑫;多媒體感知哈希算法及應(yīng)用研究[D];南京理工大學(xué);2009年
4 趙杠;對(duì)偶連接問題的哈希算法研究[D];復(fù)旦大學(xué);2010年
5 胡媛媛;基于視覺模型的圖像感知哈希算法研究[D];哈爾濱工業(yè)大學(xué);2011年
6 袁鑫攀;基于minwise哈希的文檔復(fù)制檢測(cè)的研究及應(yīng)用[D];中南大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 劉弘;基于Markov圖模型的特征哈希算法[D];江西師范大學(xué);2015年
2 杜丹丹;基于稀疏哈希算法的目標(biāo)跟蹤方法研究[D];大連理工大學(xué);2015年
3 倪康康;基于哈希算法的圖像檢索系統(tǒng)[D];西安電子科技大學(xué);2015年
4 高憲軍;半監(jiān)督哈希算法研究[D];西安電子科技大學(xué);2014年
5 余俊偉;基于局部不變矩和DWT特征矩陣的圖像哈希算法[D];廣西師范大學(xué);2015年
6 阮林林;基于局部線性嵌入和局部保持投影的圖像哈希算法[D];廣西師范大學(xué);2015年
7 凌聰;基于改進(jìn)的多索引哈希的相似圖片搜索系統(tǒng)的研究與實(shí)現(xiàn)[D];中山大學(xué);2015年
8 劉恒;面向多重需求的靈活可配的哈希算法硬件加速器研究[D];浙江大學(xué);2016年
9 董獻(xiàn)倫;基于關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)切分問題研究[D];山東大學(xué);2016年
10 王建;快速近似近鄰檢索的哈希方法研究[D];山東大學(xué);2016年
,本文編號(hào):1403432
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1403432.html