基于多目標框架的敏感項集隱藏算法研究
發(fā)布時間:2021-12-22 21:27
數(shù)據(jù)挖掘技術(shù)旨在從海量數(shù)據(jù)庫中發(fā)掘出潛在的重要知識。數(shù)據(jù)挖掘技術(shù)與日俱興的同時,在挖掘過程中,私人或敏感知識被泄露出來的風險也越來越高。然而商業(yè)合作中數(shù)據(jù)共享是必不可少的一個環(huán)節(jié),共享數(shù)據(jù)很可能泄露相關(guān)的敏感知識,最終造成數(shù)據(jù)所有者的重大的經(jīng)濟損失。因而,我們需要對共享數(shù)據(jù)進行恰當?shù)奶幚?使得其能在盡量不影響正常數(shù)據(jù)挖掘的前提下,避免其中的敏感知識被泄露。本文主要解決頻繁模式挖掘中的隱私保護問題,致力于保護數(shù)據(jù)中敏感的頻繁項集,刪除原始數(shù)據(jù)庫中部分事務(wù)來降低敏感項集的頻繁度,從而在數(shù)據(jù)挖掘的角度下達到隱藏它們的目的。遺憾的是隱藏敏感項集技術(shù)伴隨著副作用的產(chǎn)生,已證為NP-hard問題,過去的一些方法主要的缺點在于僅僅考慮單一目標,只能求得局部最優(yōu)解。此外,已有的基于演化計算算法的敏感項集隱藏方法嚴重依賴適應(yīng)性函數(shù)中各個副作用的預(yù)設(shè)權(quán)重,預(yù)設(shè)權(quán)重的大小將嚴重影響實驗結(jié)果。針對以上問題,本文主要采用基于多目標優(yōu)化算法框架來解決問題。本文的主要研究內(nèi)容和貢獻如下:從全局優(yōu)化角度出發(fā),為了減少敏感項集隱藏算法清洗數(shù)據(jù)庫所帶來的副作用,本文提出pNSGA2DT算法來將敏感項集隱藏問題轉(zhuǎn)化為多目標...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
頻繁項集隱藏算法簡易流程
本論文的組織架
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文符合該情況的項集的頻繁度即可。而最為特殊的情況 9,只要刪除事滿足 2-1 公式所示的安全界限,情況 9 中的項集就一定不會是更新數(shù)頻繁項集。f≤ Su-Sl ×|D|Su 其中 Su是上界閾值與頻繁項集挖掘的最小支持度相符,而 Sl是主要是作為 Pre-large 項集的最小支持度。|D|是原始數(shù)據(jù)庫事務(wù)的數(shù)量果刪除事務(wù)的數(shù)量滿足公式 2-1 的情況,即數(shù)量低于安全界限(f)那中的項集就不可能成為頻繁項集。由此算法計算復(fù)雜度將因不需要重挖掘原始數(shù)據(jù)庫而降低。
本文編號:3547122
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
頻繁項集隱藏算法簡易流程
本論文的組織架
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文符合該情況的項集的頻繁度即可。而最為特殊的情況 9,只要刪除事滿足 2-1 公式所示的安全界限,情況 9 中的項集就一定不會是更新數(shù)頻繁項集。f≤ Su-Sl ×|D|Su 其中 Su是上界閾值與頻繁項集挖掘的最小支持度相符,而 Sl是主要是作為 Pre-large 項集的最小支持度。|D|是原始數(shù)據(jù)庫事務(wù)的數(shù)量果刪除事務(wù)的數(shù)量滿足公式 2-1 的情況,即數(shù)量低于安全界限(f)那中的項集就不可能成為頻繁項集。由此算法計算復(fù)雜度將因不需要重挖掘原始數(shù)據(jù)庫而降低。
本文編號:3547122
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3547122.html
最近更新
教材專著