天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于卷積神經(jīng)網(wǎng)絡(luò)的快速圖片檢索算法研究

發(fā)布時間:2021-11-02 00:42
  近年來,智能照相設(shè)備的普及帶來圖像數(shù)量的激增,如何從海量圖像中快速準確地查詢到用戶感興趣的內(nèi)容,已成為多媒體信息檢索領(lǐng)域的一大研究熱點;趦(nèi)容的圖片檢索,允許用戶通過輸入樣本圖片檢索出語義上相似的圖片,已在電子商務(wù)、媒體設(shè)計、公共安全等領(lǐng)域獲得廣泛應(yīng)用。對于大規(guī)模圖片檢索,檢索準確率、資源消耗、檢索效率是需要考慮的主要因素。卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)圖片的深層語義信息,基于卷積神經(jīng)網(wǎng)絡(luò)的圖片檢索能大幅度提升檢索準確率。哈希算法將任意長度的向量映射為較短長度的二進制碼,可解決資源消耗和檢索效率兩大問題;诰矸e神經(jīng)網(wǎng)絡(luò)的哈希算法是當(dāng)前圖片檢索的一大重要研究方向。由于現(xiàn)有的有標簽圖片的缺少以及人工標注的高成本,本文首先從無監(jiān)督深度哈希方面展開研究。接著,由于現(xiàn)有的有標簽圖片通常擁有多個標簽信息,如何充分利用圖片的多標簽信息來提升檢索準確率也是本文研究的一大重點。本文針對無標簽圖片提出了基于數(shù)據(jù)增強的無監(jiān)督深度哈希算法(UTH)。我們首先介紹兩大常用的度量學(xué)習(xí)模型:Siamese和Triplet,并設(shè)計實驗證實Triplet在檢索準確率方面優(yōu)于Siamese。為了讓模型學(xué)習(xí)到無標簽圖片的辨識信息... 

【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:97 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于卷積神經(jīng)網(wǎng)絡(luò)的快速圖片檢索算法研究


–1感知機模型

前饋神經(jīng)網(wǎng)絡(luò)


Fig 2–2 The structure of a feed-forward Neural Network[9]圖2–2中的 w1,j,m+1和w2,i,k+1即為連接矩陣。在前饋神經(jīng)網(wǎng)絡(luò)中,輸入層中神經(jīng)元的個數(shù)等于輸入數(shù)據(jù)的維度。在訓(xùn)練中將輸入向量賦給輸入層。在圖2–2中,可以接受一個 m 維的輸入向量。輸入向量的每個維度值都被逐層傳播到隱含層,通過每一層的非線性加權(quán)求和函數(shù)進行前饋計算。前饋神經(jīng)網(wǎng)絡(luò)中最后輸出層的計算結(jié)果就是整個模型的輸出。2.1.3 深度卷積神經(jīng)網(wǎng)絡(luò)在本節(jié)中,我們先通過介紹最經(jīng)典的 LeNet-5 深度卷積神經(jīng)網(wǎng)絡(luò)來詳細介紹神經(jīng)網(wǎng)絡(luò)中每一層的作用。接下來分別介紹由 LeNet-5 衍生出當(dāng)下流行的幾個神經(jīng)網(wǎng)絡(luò)模型的特點和優(yōu)點。最后,說明本文中使用的卷積神經(jīng)網(wǎng)絡(luò)模型。首先,我們介紹一種經(jīng)典的用來進行手寫數(shù)字識別的卷積神經(jīng)網(wǎng)絡(luò),LeNet-5[10]。LeNet-5 由 Yann LeCun 在 1998 年提出,在手寫數(shù)字和機器印刷數(shù)字識別任務(wù)上取得了突破性的成果。其模型結(jié)構(gòu)圖如圖2–3所示。LeNet-5 模型中除去輸入層共有 7 層神經(jīng)元層。其中每一層都包含大量的可訓(xùn)練參數(shù)

圖片,模塊結(jié)構(gòu)圖,特征向量


卷積神經(jīng)網(wǎng)絡(luò),作為特征學(xué)習(xí)網(wǎng)絡(luò)模型,由于其端對端的學(xué)習(xí)特性在計算機視覺領(lǐng)域有了快速的發(fā)展;诰矸e神經(jīng)網(wǎng)絡(luò)的圖片檢索技術(shù)也有了巨大的進展;诰矸e神經(jīng)網(wǎng)絡(luò)的圖片檢索系統(tǒng)如圖2–6所示。首先將數(shù)據(jù)庫的所有圖片作為訓(xùn)練圖片經(jīng)過預(yù)處理后輸入到 CNN 內(nèi)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型 f 中。在檢索過程中,將本地數(shù)據(jù)庫的所有圖片都輸入至訓(xùn)練好的 CNN 模型 f 得到每張圖片對應(yīng)的特征向量集D。對于一張檢索圖片q,經(jīng)過 CNN 模型 f 提取到的特征向量為f(q),將f(q)和D中的所有特征向量進行相似度計算并排序,最后返回前k個和檢索圖片q最相近的樣本,F(xiàn)有的基于卷積神經(jīng)網(wǎng)絡(luò)的圖片檢索是度量學(xué)習(xí)模型,學(xué)習(xí)目標是使得— 13 —


本文編號:3471003

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3471003.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶455e5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com