天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

大批量訓(xùn)練的圖文跨模態(tài)哈希檢索方法研究

發(fā)布時間:2021-01-15 22:11
  互聯(lián)網(wǎng)和多媒體技術(shù)的快速發(fā)展,產(chǎn)生了大量不同模態(tài)的多媒體數(shù)據(jù),跨模態(tài)檢索成為信息檢索領(lǐng)域的研究熱點(diǎn)?缒B(tài)哈希方法可以有效地為不同模態(tài)的數(shù)據(jù)建立比較關(guān)系,通過將數(shù)據(jù)轉(zhuǎn)換成固定長度的哈希碼,按位異或運(yùn)算快速得到數(shù)據(jù)間的相似性。隨著深度學(xué)習(xí)的發(fā)展,越來越多的基于深度學(xué)習(xí)的跨模態(tài)哈希方法被提出。然而這些方法都采用小批量訓(xùn)練方式訓(xùn)練模型,使得模型在訓(xùn)練過程中每次更新參數(shù)時獲取樣本數(shù)量有限,其目標(biāo)函數(shù)不能得到好的梯度,影響最終訓(xùn)練模型的檢索性能。針對此問題,本文提出了一種大批量訓(xùn)練的跨模態(tài)哈希方法,該方法采用大批量訓(xùn)練方式訓(xùn)練模型,以獲得更好的梯度。但是,僅僅增加批量大小會導(dǎo)致訓(xùn)練不穩(wěn)定,使得模型的泛化性能下降。為了解決此問題,本文引入正交正則化來增加大批量訓(xùn)練的穩(wěn)定性,提高模型的泛化能力。此外還考慮了哈希碼的離散性,將哈希碼與特征之間的距離加入到目標(biāo)函數(shù)中,使得哈希碼能夠更加真實(shí)地表示數(shù)據(jù)。在兩個廣泛使用的跨模態(tài)檢索數(shù)據(jù)集上,本文方法與幾種現(xiàn)有的跨模態(tài)哈希方法進(jìn)行了檢索對比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明本文方法具有更好的性能。另一方面,現(xiàn)有很多跨模態(tài)哈希方法只考慮了模態(tài)間各個數(shù)據(jù)的關(guān)系,而忽視了模態(tài)內(nèi)各個... 

【文章來源】:重慶郵電大學(xué)重慶市

【文章頁數(shù)】:81 頁

【學(xué)位級別】:碩士

【部分圖文】:

大批量訓(xùn)練的圖文跨模態(tài)哈希檢索方法研究


波斯貓分別用圖像和文本兩種模態(tài)數(shù)據(jù)進(jìn)行描述隨著不同模態(tài)的多媒體數(shù)據(jù)的快速增長,跨模態(tài)檢索成為了研究熱點(diǎn)

大批量訓(xùn)練的圖文跨模態(tài)哈希檢索方法研究


跨模近年來,由于深度學(xué)習(xí)的快速發(fā)展

架構(gòu)圖,模型,卷積,神經(jīng)網(wǎng)絡(luò)


重慶郵電大學(xué)碩士學(xué)位論文第2章相關(guān)技術(shù)綜述7第2章相關(guān)技術(shù)綜述2.1深度學(xué)習(xí)提到深度學(xué)習(xí),不得不提卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetworks,CNN),卷積神經(jīng)網(wǎng)絡(luò)由LeCun在1998年提出,其提出了LeNet-5模型[38],由卷積層(ConvolutionalLayer),降采樣層(SubsampleLayer),全連接層(Full-connectedLayer)和激活函數(shù)層等構(gòu)成,如圖2.1所示。卷積層主要用于提取圖像的各種特征;降采樣層,也被稱為池化層(PoolingLayer),主要用于防止過擬合;全連接層主要用于將卷積層提取的各種特征整合在一起,映射為一個可供計算機(jī)判斷的值或者向量;而激活函數(shù)層主要用于增加神經(jīng)網(wǎng)絡(luò)的非線性變化的能力。LeNet-5模型對設(shè)備性能要求較高,因此在計算機(jī)性能不足的當(dāng)時并不怎么受歡迎。圖2.1LeNet-5模型架構(gòu)圖隨著計算機(jī)硬件的提升,計算能力顯著上升,催生了深度學(xué)習(xí)[39]。深度學(xué)習(xí)在ImageNet大賽上的成功應(yīng)用而被學(xué)術(shù)界和工業(yè)界廣泛關(guān)注[40]。深度學(xué)習(xí)對數(shù)據(jù)的特征進(jìn)行學(xué)習(xí),通過多層網(wǎng)絡(luò)和激活函數(shù)將原來的數(shù)據(jù)抽象為更高層次的非線性的表達(dá),通過多層網(wǎng)絡(luò)的各種轉(zhuǎn)換組合,數(shù)據(jù)的特征得以被計算機(jī)學(xué)習(xí),使得計算機(jī)更加容易的理解數(shù)據(jù)[41]。由此,各個研究人員開始研究深度學(xué)習(xí)技術(shù),推動了卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,各種卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相繼被提出,比如AlexNet[40],VGG-Nets[42,43]等。牛津大學(xué)VisualGeometryGroup團(tuán)隊在2014年提出了VGG-Nets,并在當(dāng)年的ILSVRC定位任務(wù)獲得了第一名,在圖像的特征提取方面效果顯著,在多個遷移學(xué)習(xí)任務(wù)中表現(xiàn)很好。因此,很多研究人員使用VGG-Nets在ImageNet圖像數(shù)據(jù)集上預(yù)先訓(xùn)練的模型用于初始化自己的網(wǎng)絡(luò)或者直接提取圖像特征,這


本文編號:2979601

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/2979601.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶731d9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com