面向多示例數(shù)據(jù)檢索的哈希方法研究
本文關(guān)鍵詞:面向多示例數(shù)據(jù)檢索的哈希方法研究 出處:《山東大學(xué)》2016年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 多示例學(xué)習(xí) 哈希學(xué)習(xí) 圖像檢索
【摘要】:近年來,隨著互聯(lián)網(wǎng)的普及和移動互聯(lián)網(wǎng)的快速發(fā)展,互聯(lián)網(wǎng)上的數(shù)據(jù)量呈指數(shù)式增長而且數(shù)據(jù)的類型日益增多。面對海量的數(shù)據(jù),如何進(jìn)行快速的相似性檢索,吸引了眾多學(xué)者的廣泛研究。隨著機(jī)器學(xué)習(xí)技術(shù)的空前發(fā)展,越來越多的人開始使用其解決現(xiàn)實(shí)中的復(fù)雜問題,因此,我們也利用機(jī)器學(xué)習(xí)方法來解決海量數(shù)據(jù)的快速檢索問題。多示例學(xué)習(xí)被廣泛應(yīng)用于場景分類等多媒體網(wǎng)絡(luò)問題。相比于單示例,多示例數(shù)據(jù)能更自然、更好地描述樣本,但同時(shí)也使得多示例數(shù)據(jù)集的變得非常龐大。在許多場景下,用戶需要對多示例數(shù)據(jù)集進(jìn)行檢索,然而,傳統(tǒng)的核函數(shù)方法在原始空間上計(jì)算包之間的相似性,由于計(jì)算時(shí)間長,需要的存儲空間大,很難將其應(yīng)用到大規(guī)模多示例數(shù)據(jù)集上。最近,哈希學(xué)習(xí)算法由于其優(yōu)越的計(jì)算和存儲性能,受到了學(xué)者們的廣泛關(guān)注。哈希學(xué)習(xí)主要通過保持?jǐn)?shù)據(jù)的相似性信息,將原始空間的數(shù)據(jù)映射到低維的海明空間,得到緊致的二進(jìn)制哈希碼。通過計(jì)算海明距離,能夠快速地返回相似性結(jié)果;同時(shí),對于大規(guī)模數(shù)據(jù),只需要存儲最終緊致的哈希碼,使得所需存儲空間也大大降低。因此,哈希學(xué)習(xí)方法由于其很好的時(shí)空特性,可以完美地解決以上難題。本文研究的主要問題是如何將哈希學(xué)習(xí)應(yīng)用到多示例數(shù)據(jù)檢索上。從包和示例兩個(gè)層面考慮,我們提出了兩種多示例數(shù)據(jù)集上的哈希方法:1)包層面的多示例哈希方法。首先,對示例空間的所有示例進(jìn)行聚類操作,生成一系列的聚簇中心:然后,利用本文提出的特征融合方式,將所有包轉(zhuǎn)化成一個(gè)新的特征表示;最后,采用監(jiān)督哈希方法將得到的特征轉(zhuǎn)向量化為二進(jìn)制哈希碼。2)示例層面的多示例哈希方法。為了使用更多的示例信息,我們考慮可以直接應(yīng)用無監(jiān)督或有監(jiān)督哈希算法將每個(gè)包中的所有示例轉(zhuǎn)化成哈希碼,對于一個(gè)查詢包,提出了種根據(jù)示例哈希碼計(jì)算包之間的相似性的度量。很多研究表明,在哈希學(xué)習(xí)中加入監(jiān)督標(biāo)記,會增強(qiáng)哈希函數(shù)的表現(xiàn)能力。在多示例數(shù)據(jù)中,由于負(fù)包中不含有任何正示例,將負(fù)包中的所有示例標(biāo)記為負(fù);另一方面,由于正包中正示例標(biāo)記未知,將其中的所有示例視為無標(biāo)記。根據(jù)以上描述,可以將多示例哈希學(xué)習(xí)看作一種半監(jiān)督學(xué)習(xí)方式。在上述方法中,只應(yīng)用到了負(fù)包的標(biāo)記,而沒有使用正包的標(biāo)記信息。因此,本文進(jìn)一步采用示例選擇的方式,開發(fā)正包中的正示例標(biāo)記,并將其應(yīng)用到哈希函數(shù)的學(xué)習(xí)當(dāng)中。我們將上面提到的兩種方法在公開的數(shù)據(jù)集進(jìn)行對比,實(shí)驗(yàn)表明嵌入監(jiān)督信息的示例層面的多示例哈希方法能取得更好地效果。同時(shí),我們也于傳統(tǒng)的核函數(shù)方法進(jìn)行了比較,結(jié)果表明,多示例哈希在準(zhǔn)確率相差不大的情況下,大大提高了檢索的速度。
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP181
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 鄒建成;周紅麗;鄧歡軍;;一種安全魯棒的圖像哈希方法[J];計(jì)算機(jī)應(yīng)用研究;2009年06期
2 張維克;孔祥維;尤新剛;;安全魯棒的圖像感知哈希技術(shù)[J];東南大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年S1期
3 牛夏牧;焦玉華;;感知哈希綜述[J];電子學(xué)報(bào);2008年07期
4 徐澤明;侯紫峰;;串的快速連續(xù)弱哈希及其應(yīng)用[J];軟件學(xué)報(bào);2011年03期
5 劉麗;李曉舉;李玲玲;;視頻哈希的性能分析與測試[J];計(jì)算機(jī)工程;2012年06期
6 鮑愛華;袁曉萍;陳鋒;劉鵬;;基于哈希樹的分布式目錄同步方法[J];解放軍理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年06期
7 徐劍;陳旭;李福祥;周福才;;基于有向哈希樹的認(rèn)證跳表算法[J];計(jì)算機(jī)科學(xué);2011年09期
8 周國強(qiáng);田先桃;張衛(wèi)豐;張迎周;;基于圖像感知哈希技術(shù)的釣魚網(wǎng)頁檢測[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年04期
9 吳鶴齡;;動態(tài)哈希文件的實(shí)現(xiàn)技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;1990年03期
10 大衛(wèi)·塔爾波特;;哈希緩存[J];科技創(chuàng)業(yè);2009年07期
相關(guān)會議論文 前5條
1 張維克;孔祥維;尤新剛;;安全魯棒的圖像感知哈希技術(shù)[A];第七屆全國信息隱藏暨多媒體信息安全學(xué)術(shù)大會論文集[C];2007年
2 夏斌;王斌;關(guān)志峰;;一種基于多維哈希鏈的M-Commerce微支付方案[A];第一屆中國高校通信類院系學(xué)術(shù)研討會論文集[C];2007年
3 尚鳳軍;潘英俊;;一種雙哈希IP數(shù)據(jù)包分類算法研究[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2004年
4 吳萬烽;王汝傳;黃海平;孫力娟;;Sead協(xié)議哈希鏈機(jī)制的分析與改進(jìn)[A];第十一屆保密通信與信息安全現(xiàn)狀研討會論文集[C];2009年
5 蔣惠萍;楊晨雨;袁杰;;基于深空網(wǎng)絡(luò)化感知系統(tǒng)抗功耗快速哈希驗(yàn)證方法研究[A];中國宇航學(xué)會深空探測技術(shù)專業(yè)委員會第五屆學(xué)術(shù)年會論文集[C];2008年
相關(guān)博士學(xué)位論文 前3條
1 李金鳳;基于感知哈希及數(shù)字水印的音頻認(rèn)證技術(shù)研究[D];西南交通大學(xué);2015年
2 張慧;圖像感知哈希測評基準(zhǔn)及算法研究[D];哈爾濱工業(yè)大學(xué);2009年
3 劉兆慶;圖像感知哈希若干關(guān)鍵技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 周新生;一種面向用戶的無線局域網(wǎng)冗余消除機(jī)制[D];上海交通大學(xué);2015年
2 汪勝圣;基于哈希的大規(guī)模多標(biāo)簽圖像搜索方法研究[D];山東大學(xué);2016年
3 梁小龍;關(guān)于拓?fù)浔3值墓7椒ㄑ芯縖D];山東大學(xué);2016年
4 楊W,
本文編號:1324670
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1324670.html