基于局部敏感布隆過濾器的集合相似檢測(cè)技術(shù)
發(fā)布時(shí)間:2017-07-19 10:06
本文關(guān)鍵詞:基于局部敏感布隆過濾器的集合相似檢測(cè)技術(shù)
更多相關(guān)文章: 局部敏感哈希 布隆過濾器 集合相似度 空間分布
【摘要】:集合的相似度查詢(Set Similarity Queries)是當(dāng)前研究的熱點(diǎn)。而這些熱點(diǎn)研究主要基于集合元素的性質(zhì),所以這類查詢技術(shù)并不能體現(xiàn)集合自身其具有的整體屬性,元素的空間分布,即一個(gè)集合的所有元素在特定的度量空間下的分布情況。為了解決元素的空間分布屬性的集合相似度檢測(cè),我們?cè)O(shè)計(jì)了利用局部敏感哈希函數(shù)構(gòu)建的布隆過濾器SDLBF來表示空間分布集合相似度。兩個(gè)集合之間的空間分布相似度由布隆過濾器之間的海明距離來度量。并且從理論分析上其假陽性錯(cuò)誤率和假陰性錯(cuò)誤率。最后通過實(shí)驗(yàn)證明了SDLBF的可行性和可靠性。
【作者單位】: 寧波大學(xué);
【關(guān)鍵詞】: 局部敏感哈希 布隆過濾器 集合相似度 空間分布
【分類號(hào)】:TP274
【正文快照】: 1 引言 集合的相似度查詢(Set Similarity Queries)是當(dāng)前研究的熱點(diǎn),可分為相似度查找(Similarity Search)和相似度連接(Similarity Join)兩個(gè)部分,在數(shù)據(jù)庫、數(shù)據(jù)挖掘、信息檢索、生物信息系統(tǒng)等很多相關(guān)領(lǐng)域有重要的研究?jī)r(jià)值和應(yīng)用前景。而這些熱點(diǎn)研究主要基于集合元素的,
本文編號(hào):562298
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/562298.html
最近更新
教材專著