基于矩陣分解的在線哈希最近鄰搜索方法研究
發(fā)布時間:2021-04-02 01:55
互聯(lián)網(wǎng)、多媒體技術(shù)的快速發(fā)展,使得數(shù)據(jù)呈現(xiàn)出爆炸式的增長,數(shù)據(jù)的模態(tài)也更加多樣化,文本、圖像、音頻、視頻等多種形式的數(shù)據(jù)都包含著豐富的信息。如何高效的管理和運(yùn)用信息資源,挖掘出有價值的信息內(nèi)容,推動社會進(jìn)一步發(fā)展,成為了廣泛關(guān)注的問題;诠5淖罱徦阉骷夹g(shù),由于其計(jì)算速度快,占用存儲空間小等優(yōu)點(diǎn),為高效管理和運(yùn)用大規(guī)模信息資源提供了有效方法,受到了國內(nèi)外研究學(xué)者的關(guān)注。目前,基于哈希的最近鄰搜索技術(shù)大多采用批處理模式進(jìn)行哈希學(xué)習(xí)。批處理模式的哈希學(xué)習(xí)方法存在的問題是,當(dāng)系統(tǒng)獲得與歷史數(shù)據(jù)特征不一致,或者分布不一致的新數(shù)據(jù)時,如果不進(jìn)行哈希函數(shù)的更新,則哈希函數(shù)無法學(xué)習(xí)到新數(shù)據(jù)的特征,導(dǎo)致搜索精度下降;如果進(jìn)行哈希函數(shù)的更新,則需要將新數(shù)據(jù)和歷史數(shù)據(jù)全部重新訓(xùn)練,造成較大的計(jì)算和存儲開銷。針對上述問題,本文提出了基于矩陣分解的在線哈希最近鄰搜索方法,使得哈希函數(shù)根據(jù)新數(shù)據(jù)進(jìn)行模型增量更新,無需存儲大量歷史數(shù)據(jù),有效降低了最近鄰搜索任務(wù)的計(jì)算和存儲開銷,提高了搜索精度。主要研究內(nèi)容概括如下:(1)針對采用批處理模式學(xué)習(xí)的哈希方法存在的問題,本文提出一種基于矩陣分解的單模態(tài)在線哈希方法。...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【部分圖文】:
單模態(tài)哈希方法流程示意圖
00010010/00010010返回檢索結(jié)果圖1.2 多模態(tài)哈希方法流程示意圖跨視圖哈希(Cross-View Hashing,CVH)[40]是一種無監(jiān)督的多模態(tài)哈希方法。該方法是譜哈希在多模態(tài)數(shù)據(jù)下的推廣,通過最小化具有相似性的樣本間哈希編碼的距離進(jìn)行哈希學(xué)習(xí)。然而,CVH 并沒有很好的考慮到不同模態(tài)數(shù)據(jù)分布的差異,使得算法性能難以令人滿意。多媒體哈希(Inter-Media Hashing,IMH)[41]方法的提出更好的考慮了不同模態(tài)數(shù)據(jù)分布的差異。但是 IMH 需要對同一模態(tài)的數(shù)據(jù)構(gòu)建相似圖,因此對大數(shù)據(jù)集進(jìn)行訓(xùn)練時,會產(chǎn)生計(jì)算復(fù)雜度過高的問題。為了解決該問題,學(xué)者們提出了線性跨模態(tài)哈希(Linear Cross-Model Hashing,LCMH)[42]方法
因此有效降低了系統(tǒng)的存儲壓力,并且該方法采用過去時刻的矩陣計(jì)算結(jié)果和新數(shù)據(jù)共同進(jìn)行哈希模型更新,提高了哈希模型的更新效率和搜索精度。圖3.1 基于矩陣分解的單模態(tài)在線哈希方法框圖3.2.2基于矩陣分解的單模態(tài)在線哈?蚣芫仃嚪纸鈁57]的含義是將一個矩陣拆分為兩個或者多個矩陣相乘的形式,本章中采用矩陣分解方法如式(3-1)所示:X UV, (3-1)式(3-1)中,將原始數(shù)據(jù)矩陣 X 近似為矩陣U 和矩陣V 相乘。通過矩陣分解,原始數(shù)據(jù)矩陣 X 中的每一個向量可以看做是基矩陣U 中向量加權(quán)得到的,系數(shù)表示矩陣V 中的每一個向量則可以看做基矩陣U 中每一個向量對應(yīng)的權(quán)重。為了衡量矩陣分解的近似誤差,選擇 Frobenius 范數(shù)如式(3-2)所示:
本文編號:3114367
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:84 頁
【學(xué)位級別】:碩士
【部分圖文】:
單模態(tài)哈希方法流程示意圖
00010010/00010010返回檢索結(jié)果圖1.2 多模態(tài)哈希方法流程示意圖跨視圖哈希(Cross-View Hashing,CVH)[40]是一種無監(jiān)督的多模態(tài)哈希方法。該方法是譜哈希在多模態(tài)數(shù)據(jù)下的推廣,通過最小化具有相似性的樣本間哈希編碼的距離進(jìn)行哈希學(xué)習(xí)。然而,CVH 并沒有很好的考慮到不同模態(tài)數(shù)據(jù)分布的差異,使得算法性能難以令人滿意。多媒體哈希(Inter-Media Hashing,IMH)[41]方法的提出更好的考慮了不同模態(tài)數(shù)據(jù)分布的差異。但是 IMH 需要對同一模態(tài)的數(shù)據(jù)構(gòu)建相似圖,因此對大數(shù)據(jù)集進(jìn)行訓(xùn)練時,會產(chǎn)生計(jì)算復(fù)雜度過高的問題。為了解決該問題,學(xué)者們提出了線性跨模態(tài)哈希(Linear Cross-Model Hashing,LCMH)[42]方法
因此有效降低了系統(tǒng)的存儲壓力,并且該方法采用過去時刻的矩陣計(jì)算結(jié)果和新數(shù)據(jù)共同進(jìn)行哈希模型更新,提高了哈希模型的更新效率和搜索精度。圖3.1 基于矩陣分解的單模態(tài)在線哈希方法框圖3.2.2基于矩陣分解的單模態(tài)在線哈?蚣芫仃嚪纸鈁57]的含義是將一個矩陣拆分為兩個或者多個矩陣相乘的形式,本章中采用矩陣分解方法如式(3-1)所示:X UV, (3-1)式(3-1)中,將原始數(shù)據(jù)矩陣 X 近似為矩陣U 和矩陣V 相乘。通過矩陣分解,原始數(shù)據(jù)矩陣 X 中的每一個向量可以看做是基矩陣U 中向量加權(quán)得到的,系數(shù)表示矩陣V 中的每一個向量則可以看做基矩陣U 中每一個向量對應(yīng)的權(quán)重。為了衡量矩陣分解的近似誤差,選擇 Frobenius 范數(shù)如式(3-2)所示:
本文編號:3114367
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3114367.html
最近更新
教材專著