天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

面向大規(guī)模跨模態(tài)檢索的哈希方法研究

發(fā)布時間:2020-04-14 16:05
【摘要】:近來,隨著信息技術(shù)的高速發(fā)展,各行各業(yè)的數(shù)據(jù)積累都呈爆炸式增長,這意味著我們已經(jīng)進(jìn)入了大數(shù)據(jù)時代。大數(shù)據(jù)主要體現(xiàn)在兩方面:數(shù)據(jù)量和數(shù)據(jù)維度的不斷增長以及數(shù)據(jù)類型的日益增多。大數(shù)據(jù)在各行各業(yè)都有著廣泛的應(yīng)用,已經(jīng)成為國家重點(diǎn)戰(zhàn)略資源。存儲,管理,分析大數(shù)據(jù)已經(jīng)成為了學(xué)術(shù)界和工業(yè)界的熱點(diǎn)話題,大數(shù)據(jù)檢索也成為一個主要問題。為了有效利用大數(shù)據(jù),機(jī)器學(xué)習(xí)技術(shù)至關(guān)重要。由于數(shù)據(jù)量和數(shù)據(jù)維度的不斷增長,例如,微信和QQ光是活躍用戶就有8億多,2017年淘寶雙十一成交額達(dá)到1682億元,在大數(shù)據(jù)檢索中進(jìn)行精確最近鄰搜索已經(jīng)難以實(shí)現(xiàn),于是近似最近鄰搜索在大數(shù)據(jù)檢索中扮演起重要的角色。近似最近鄰搜索通過比較數(shù)據(jù)間的相似度返回與輸入數(shù)據(jù)最相似的結(jié)果集。這一方法在時間復(fù)雜度低的同時能保持相對準(zhǔn)確的檢索精度。近似最近鄰搜索在很多應(yīng)用中起到關(guān)鍵作用,例如跨模態(tài)檢索。隨著數(shù)據(jù)類型的日益增多,在很多場景中,一個對象存在著多種模態(tài),如圖片,文本等。例如,新浪微博上僅僅帶有文字描述的圖片就有36億之多?缒B(tài)檢索是為了找出不同模態(tài)間的相關(guān)性,從而實(shí)現(xiàn)用一種模態(tài)檢索出與其相似的另一模態(tài)?缒B(tài)檢索不但需要注意模態(tài)間的相關(guān)性,同時也需要保證模態(tài)內(nèi)的相關(guān)性。隨著對跨模態(tài)檢索的研究與日俱增,跨模態(tài)檢索也成為一個新興的問題。在大數(shù)據(jù)檢索中,由于哈希方法存儲容量低,檢索速度快,基于哈希的近似最近鄰搜索方法得到廣泛關(guān)注。哈希方法把數(shù)據(jù)的原始特征映射到低維的二進(jìn)制空間,即海明空間,并盡可能多地保留數(shù)據(jù)信息,例如局部結(jié)構(gòu),語義信息等。數(shù)據(jù)間的相似度可以通過計(jì)算其哈希碼的海明距離快速獲得。哈希方法不但能夠降低數(shù)據(jù)存儲和通訊開銷,還能降低數(shù)據(jù)維度,顯著提升檢索效率。此外,基于哈希的跨模態(tài)檢索方法也被提出來執(zhí)行不同模態(tài)間的高效搜索。有些方法通過對目標(biāo)函數(shù)進(jìn)行松弛,如近似替代;有些方法分為兩步分別獲得哈希函數(shù)跟哈希碼;有些方法使用特別復(fù)雜的目標(biāo)函數(shù)。這些方法有的會造成大量的信息損失,有的訓(xùn)練速度會非常慢。此外,跨模態(tài)檢索還需要考慮一些其他問題。例如,有些方法不能充分地利用標(biāo)簽信息,而標(biāo)簽信息是數(shù)據(jù)信息中最為有用的一部分;有的方法在優(yōu)化過程中松弛二進(jìn)制限制,然后將輸出的連續(xù)值簡單地二值化,從而產(chǎn)生大量量化誤差?紤]到上述問題,本文提出了一個新的跨模態(tài)哈希方法——監(jiān)督的跨模態(tài)無松弛哈希,它不但能充分利用標(biāo)簽信息,還能無松弛地產(chǎn)生最終的哈希碼。該方法通過將不同模態(tài)特征映射到一個低維同構(gòu)空間以保持其模態(tài)間的相似性,并加入標(biāo)簽信息保持其模態(tài)內(nèi)的相似性,同時學(xué)習(xí)出一個正交旋轉(zhuǎn)矩陣以最小化量化誤差并在線性時間內(nèi)學(xué)習(xí)出最終的哈希碼。本文同時提出了一個迭代算法來解決目標(biāo)函數(shù)的優(yōu)化問題。上文提到的方法將在三個數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),包括自我驗(yàn)證實(shí)驗(yàn)和與其它跨模態(tài)哈希方法進(jìn)行對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明本文提出的監(jiān)督跨模態(tài)無松弛哈希方法在跨模態(tài)搜索任務(wù)中與其它方法相比,具有明顯的效果提升。
【圖文】:

降維,閾值,哈希,閾值函數(shù)


目前大多數(shù)哈希方法都是通過某個閾值函數(shù)對每一維進(jìn)行簡單的二值化處逡逑理,這產(chǎn)生了一個問題:原始數(shù)據(jù)經(jīng)降維后,如果某一維的值集中在閾值附近,逡逑此時相似的數(shù)據(jù)在該位上的哈希碼卻不一樣。如圖1-3所示。量化方法就是在這逡逑樣的背景下提出來的。常見的量化方法有雙位量化法(Double-Bit邋Quantization,逡逑DBQ)[33]、曼哈頓哈希(Manhattan邋Hashing,MH)[34^。逡逑101,邋.——.邋.——I邐,——,邋,——,——逡逑8邋■邐-逡逑6邋■邐|邋-逡逑4邋-邐-逡逑2.邋?...邋'、逡逑?邐*邋*邋t*逡逑0—邐逡逑-2.邋?邋?邋?邋,?邋?邋_逡逑-4邋?逡逑-8邋■邐-逡逑■8邋■邐-逡逑-10邋I邐1邐1邐1邐1邐邐1邐1邐1邐1邐逡逑-10邐-8邐-6邐-4邐-2邐0邐2邐4邐6邐8邐10逡逑圖1-3降維后的值集中在閾值附近逡逑DBQ在每一維上使用兩個閾值函數(shù)將該維分成三個部分,并且每一維用兩逡逑位哈希碼表示。它提出了一種自適應(yīng)的閾值學(xué)習(xí)算法,可以學(xué)習(xí)出最優(yōu)的閾值函逡逑數(shù),,而不需要人工定義。逡逑MH認(rèn)為

檢索效果


圖3-2邋SCMH-WR在MIRFLICKR中各參數(shù)對檢索效果的影響逡逑
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 蔣大宏;動態(tài)哈希方法[J];計(jì)算機(jī)工程;1993年01期

2 魯明;宋馥莉;;基于誤差加權(quán)哈希的圖像檢索方法[J];河南科技;2016年17期

3 宋欣;;哈希:品質(zhì)承諾鑄就品牌基石[J];現(xiàn)代企業(yè)文化;2012年Z1期

4 蔣大宏;實(shí)現(xiàn)檢索代價最優(yōu)的動態(tài)哈希法[J];計(jì)算機(jī)工程與應(yīng)用;1994年Z2期

5 孫瑤;;深度學(xué)習(xí)哈希研究與發(fā)展[J];數(shù)據(jù)通信;2018年02期

6 潘輝;鄭剛;胡曉惠;馬恒太;;基于感知哈希的圖像內(nèi)容鑒別性能分析[J];計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報;2012年07期

7 牛夏牧;焦玉華;;感知哈希綜述[J];電子學(xué)報;2008年07期

8 徐澤明;侯紫峰;;串的快速連續(xù)弱哈希及其應(yīng)用[J];軟件學(xué)報;2011年03期

9 郭呈呈;于鳳芹;陳瑩;;改進(jìn)哈希編碼加權(quán)排序的圖像檢索算法[J];傳感器與微系統(tǒng);2018年09期

10 劉超;王衛(wèi)東;;基于雙哈希詞典機(jī)制中文分詞的研究[J];信息技術(shù);2016年11期

相關(guān)會議論文 前10條

1 張維克;孔祥維;尤新剛;;安全魯棒的圖像感知哈希技術(shù)[A];第七屆全國信息隱藏暨多媒體信息安全學(xué)術(shù)大會論文集[C];2007年

2 劉玉瑩;劉宏哲;袁家政;何喬鵬;;深度哈希在大規(guī)模圖像處理中的應(yīng)用[A];中國計(jì)算機(jī)用戶協(xié)會網(wǎng)絡(luò)應(yīng)用分會2017年第二十一屆網(wǎng)絡(luò)新技術(shù)與應(yīng)用年會論文集[C];2017年

3 夏斌;王斌;關(guān)志峰;;一種基于多維哈希鏈的M-Commerce微支付方案[A];第一屆中國高校通信類院系學(xué)術(shù)研討會論文集[C];2007年

4 吳萬烽;王汝傳;黃海平;孫力娟;;Sead協(xié)議哈希鏈機(jī)制的分析與改進(jìn)[A];第十一屆保密通信與信息安全現(xiàn)狀研討會論文集[C];2009年

5 張嘯;邵健;吳飛;莊越挺;;SSH:基于稀疏譜哈希的圖像索引[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2010)、第19屆全國多媒體學(xué)術(shù)會議(NCMT2010)、第6屆全國人機(jī)交互學(xué)術(shù)會議(CHCI2010)、第5屆全國普適計(jì)算學(xué)術(shù)會議(PCC2010)論文集[C];2010年

6 尚鳳軍;潘英俊;;一種雙哈希IP數(shù)據(jù)包分類算法研究[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年

7 王國仁;葉峰;王欣暉;于戈;鄭懷遠(yuǎn);;NOW環(huán)境下并行哈希連接算法的設(shè)計(jì)與實(shí)現(xiàn)[A];第十五屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1998年

8 吳萬烽;王汝傳;黃海平;李玲娟;;基于可再生哈希鏈及二次示證方案的安全高效距離向量協(xié)議[A];江蘇省電子學(xué)會2010年學(xué)術(shù)年會論文集[C];2010年

9 何云峰;林朝輝;于俊清;管濤;;基于位置敏感哈希的分布式高維索引方法研究[A];第八屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2012)論文集NCMT[C];2012年

10 魏波;;哈希DR1010COD測定儀在COD分析中的應(yīng)用[A];四川省環(huán)境科學(xué)學(xué)會二0一一年學(xué)術(shù)年會論文集[C];2011年

相關(guān)重要報紙文章 前2條

1 ;中華人民共和國和約旦哈希姆王國關(guān)于建立戰(zhàn)略伙伴關(guān)系的聯(lián)合聲明[N];人民日報;2015年

2 韓大慶 李躍坤 顧晨曦;哈希姆:進(jìn)入南亞市場成本低[N];中國貿(mào)易報;2006年

相關(guān)博士學(xué)位論文 前10條

1 馬超;語義鑒別和相似性保持的哈希方法研究與應(yīng)用[D];南京理工大學(xué);2017年

2 季劍秋;面向大規(guī)模數(shù)據(jù)相似計(jì)算和搜索的哈希方法研究[D];清華大學(xué);2015年

3 付海燕;基于圖像哈希的大規(guī)模圖像檢索方法研究[D];大連理工大學(xué);2014年

4 劉兆慶;圖像感知哈希若干關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年

5 姚濤;基于哈希方法的跨媒體檢索研究[D];大連理工大學(xué);2017年

6 陳勇昌;基于不變特征的數(shù)字水印與感知哈希圖像認(rèn)證技術(shù)研究[D];華南理工大學(xué);2014年

7 趙玉鑫;多媒體感知哈希算法及應(yīng)用研究[D];南京理工大學(xué);2009年

8 張慧;圖像感知哈希測評基準(zhǔn)及算法研究[D];哈爾濱工業(yè)大學(xué);2009年

9 高毫林;基于哈希技術(shù)的圖像檢索研究[D];解放軍信息工程大學(xué);2014年

10 李金鳳;基于感知哈希及數(shù)字水印的音頻認(rèn)證技術(shù)研究[D];西南交通大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 趙毅;基于深度哈希的大規(guī)模幼兒圖書頁面檢索方法研究[D];華中師范大學(xué);2018年

2 周Oz;基于深度哈希學(xué)習(xí)的大規(guī)模圖像檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2018年

3 井維臻;近似視頻的哈希檢索方法研究[D];山東大學(xué);2018年

4 黃華俊杰;面向大規(guī)?缒B(tài)檢索的哈希方法研究[D];山東大學(xué);2018年

5 張鵬飛;大規(guī)模圖像內(nèi)容分析與檢索方法研究[D];山東大學(xué);2018年

6 喬思斌;多格式音頻感知哈希認(rèn)證方法研究[D];蘭州理工大學(xué);2018年

7 張濤;移動終端語音感知哈希認(rèn)證方法及應(yīng)用研究[D];蘭州理工大學(xué);2018年

8 楊廣飛;基于核方法的跨模哈希檢索研究[D];安徽大學(xué);2018年

9 繆黃輝;基于多核學(xué)習(xí)和圖正則化的跨模態(tài)哈希檢索研究[D];安徽大學(xué);2018年

10 何濤;基于深度學(xué)習(xí)和哈希的圖像檢索的方法研究[D];電子科技大學(xué);2018年



本文編號:2627468

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2627468.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶67007***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com