天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

量化編碼的分層可通航小世界圖算法

發(fā)布時間:2021-01-29 19:19
  隨著大數(shù)據(jù)和人工智能的高速發(fā)展,針對多媒體數(shù)據(jù)的結(jié)構(gòu)化處理與基于內(nèi)容的檢索受到極大的關(guān)注,面對多媒體數(shù)據(jù)結(jié)構(gòu)化后的海量高維特征向量,如何快速、準(zhǔn)確地檢索是人工智能處理大規(guī)模數(shù)據(jù)所必須解決的問題。最近提出的分層可通航小世界圖HNSW檢索算法在多個公開數(shù)據(jù)集取得了最佳的性能表現(xiàn),但該算法存在內(nèi)存開銷大的問題。而基于量化編碼的檢索算法能夠壓縮數(shù)據(jù)集向量,大幅度降低內(nèi)存占用。將量化編碼和分層可通航小世界圖算法結(jié)合,提出了2種基于量化編碼改進的HNSW算法,分別是使用標(biāo)量量化編碼向量的HNSWSQ算法和使用乘積量化編碼向量的HNSWPQ算法,2種算法使用不同的量化策略存儲原始向量編碼,以降低內(nèi)存開銷,再通過HNSW算法建立索引達到縮短檢索耗時的目的。其中HNSWSQ算法在多個數(shù)據(jù)集上獲得了與HNSW算法相近的查全率和平均檢索耗時,而內(nèi)存開銷大幅降低。實驗結(jié)果表明,HNSWSQ算法在SIFT-1M和GIST-1M數(shù)據(jù)集上的內(nèi)存開銷比HNSW算法分別降低了45.1%和70.4%。 

【文章來源】:計算機工程與科學(xué). 2019,41(04)北大核心

【文章頁數(shù)】:8 頁

【部分圖文】:

量化編碼的分層可通航小世界圖算法


圖1HNSW算法查找過程Figure1SearchprocessoftheHNSWalgorithm

向量編碼,算法,索引算法,向量


128維,設(shè)置乘積量化的參數(shù)為m=16,k*=256,則每個向量被量化為16個字節(jié),相比于原始的128*4=512字節(jié),理論上內(nèi)存消耗最多降低為原來的1/32,如圖2所示。HNSWPQ算法將HNSW算法作為索引算法,采用PQ算法進行向量編碼,由于使用PQ算法對原始向量編碼,需要將HNSW算法插入過程中與近鄰點距離的計算相應(yīng)地修改為PQ的距離計算。Figure2APQquantizationexample圖2PQ量化示例圖數(shù)據(jù)集中的向量被編碼后存儲在內(nèi)存中,每個向量根據(jù)子向量最近鄰中心點的編號編碼。李秋珍等:量化編碼的分層可通航小世界圖算法126

距離計算,向量,標(biāo)量量化


HNSW算法構(gòu)建索引計算查詢向量與圖中點y的距離時,首先計算查詢向量每個子向量與對應(yīng)分段中心點的距離表,然后根據(jù)y的編碼查表獲得d(x,y)的近似值。圖3是向量維數(shù)d=16,乘積量化參數(shù)m=4,k*=8時計算查詢向量x與數(shù)據(jù)集中向量y的距離的例子。Figure3APQdistancecomputingexample圖3PQ距離計算示例圖Figure4Ascalarquantizationcomputingexample圖4標(biāo)量量化計算示例圖4.2HNSWSQ算法標(biāo)量量化(SQ)對向量的每一維量化,分層可通航小世界標(biāo)量量化HNSWSQ(HierarchicalNaviga-bleSmallWorldScalarQuantization)算法采用最大最小量化。對于向量的第i維,通過樣本集訓(xùn)練獲取該維出現(xiàn)的最大值vmax[i]和最小值vmin[i],然后將向量x第i維的值量化為(xi-vmin[i])/(vmax[i]),i=1,…,n,量化后的值編碼存儲,假設(shè)每一維編碼為1個字節(jié),則進一步處理為:f(xi)=φxi-vmin[i]vmax[i()]*255(3)其中,φ(x)=1,x≥1x,0<x<10,x≤烅烄烆0,·表示向下取整。標(biāo)量量化計算示例如圖4所示。從圖4可以看到,對于4維的原始向量,每一維編碼為1個字節(jié),則編碼后向量長度為4字節(jié),相比于編碼前的16


本文編號:3007455

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3007455.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1f413***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com