基于局部差分隱私的關(guān)聯(lián)數(shù)據(jù)發(fā)布保護
發(fā)布時間:2021-01-09 00:08
局部差分隱私是隱私保護數(shù)據(jù)發(fā)布領(lǐng)域中最強大的隱私保證模型之一。然而,該模型目前主要用于單屬性數(shù)據(jù)采集,關(guān)于多屬性關(guān)聯(lián)的數(shù)據(jù)發(fā)布研究很少。此外,當(dāng)數(shù)據(jù)屬性值在數(shù)據(jù)發(fā)布中獨立擾動時,可能會導(dǎo)致過多的信息損失。因此,基于局部差分隱私的關(guān)聯(lián)數(shù)據(jù)發(fā)布保護研究已成為一個需要解決的迫切問題。首先,針對隱私保護數(shù)據(jù)發(fā)布中屬性間關(guān)聯(lián)性被忽略的問題,本文提出構(gòu)造κ-度私有貝葉斯網(wǎng)絡(luò)的算法。該算法將互信息與貪婪算法相結(jié)合以構(gòu)造具有最大互信息屬性對的κ-度私有貝葉斯網(wǎng)絡(luò),并利用貝葉斯網(wǎng)絡(luò)來提供屬性間關(guān)聯(lián)性的直觀模型。具體地,通過互信息來量化屬性間的關(guān)聯(lián)強弱,并在尼值的限制下貪婪的選擇最大的互信息屬性對以構(gòu)造低度貝葉斯網(wǎng)絡(luò)模型。其次,針對數(shù)據(jù)發(fā)布中屬性獨立擾動時信息損失過多的問題,本文提出一種用于關(guān)聯(lián)數(shù)據(jù)擾動的局部差分私有方法。該方法結(jié)合屬性分組思想和隨機響應(yīng)技術(shù),以實現(xiàn)對原始數(shù)據(jù)集的擾動。具體地,本文采取基于屬性對最大平均互信息值的分組思想,該思想通過計算κ-度私有貝葉斯網(wǎng)絡(luò)父子節(jié)點間的平均互信息作為當(dāng)前屬性組的互信息值。接著,設(shè)定閾值,將整個貝葉斯網(wǎng)絡(luò)的屬性分為兩個類別,即,弱關(guān)聯(lián)屬性集和健壯的關(guān)聯(lián)屬性集。...
【文章來源】:安徽理工大學(xué)安徽省
【文章頁數(shù)】:54 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1通用的差分隱私保護模型??
。,通常會產(chǎn)生更多噪音。??斯網(wǎng)絡(luò)??網(wǎng)絡(luò)是有向無環(huán)圖,其具有每個節(jié)點的概率分布。每個點之間的弧表示概率依懶性。通常在給定分配給其它節(jié)可用于計算下一個節(jié)點的條件概率,因此,貝葉斯網(wǎng)絡(luò)以用于衡量屬性之間的相關(guān)性。當(dāng)從數(shù)據(jù)集學(xué)習(xí)貝葉斯表示數(shù)據(jù)集的數(shù)據(jù)屬性。??包含d個屬性的數(shù)據(jù)集,分別為4,土...4心因此,定一組d個父子屬性(AP)對,即,〇4丨,戶1),(^2,戶2),...,(4個石是乂中的唯一屬性;??個乃是羔的父集合,包括X中的一些屬性;??于任何貝葉斯網(wǎng)絡(luò)中沒有從為到4的邊緣,斯網(wǎng)絡(luò)是非循環(huán)的。??
SS?(Race,?Country,?Education,?Workclass,Occupation)和弱集合?WS?(Race)。本文為??魯棒關(guān)聯(lián)屬性集ss執(zhí)行局部差分隱私預(yù)算為的隱私保護,為弱關(guān)聯(lián)屬性集ws??執(zhí)行預(yù)算為ft的隱私保護,因此構(gòu)建的h度私有貝葉斯網(wǎng)絡(luò)BN如圖下圖5.1所??不。??^^.ace^ ̄ ̄0.014856->^^ucation)--0.336405+<OccupatiOT|??0.139517?^?£:?、#?2??(Country)—0.012541->nVorkclass)--0.017104-^f?Income?)??圖5.1基于成人數(shù)據(jù)集六個屬性的h度私有貝葉斯網(wǎng)絡(luò)BN??Fig.5.1?A?A:-degree?private?Bayesian?network?BN?over?six?attributes?of?the?Adult?data?set?DS??為了分析h度私有貝葉斯網(wǎng)絡(luò)BN的分類效果,從兩個類別上進行評估,分??別是預(yù)測個體是否是白人,以及年收入是否超過50K。另一個方面,將數(shù)據(jù)集分??為六個等級,即Z=(1K,2K,?4K,8K,16K,32K),其中1K=1000。數(shù)據(jù)集以??等比數(shù)列的形式設(shè)置可以充分的利用成人數(shù)據(jù)集
本文編號:2965578
【文章來源】:安徽理工大學(xué)安徽省
【文章頁數(shù)】:54 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1通用的差分隱私保護模型??
。,通常會產(chǎn)生更多噪音。??斯網(wǎng)絡(luò)??網(wǎng)絡(luò)是有向無環(huán)圖,其具有每個節(jié)點的概率分布。每個點之間的弧表示概率依懶性。通常在給定分配給其它節(jié)可用于計算下一個節(jié)點的條件概率,因此,貝葉斯網(wǎng)絡(luò)以用于衡量屬性之間的相關(guān)性。當(dāng)從數(shù)據(jù)集學(xué)習(xí)貝葉斯表示數(shù)據(jù)集的數(shù)據(jù)屬性。??包含d個屬性的數(shù)據(jù)集,分別為4,土...4心因此,定一組d個父子屬性(AP)對,即,〇4丨,戶1),(^2,戶2),...,(4個石是乂中的唯一屬性;??個乃是羔的父集合,包括X中的一些屬性;??于任何貝葉斯網(wǎng)絡(luò)中沒有從為到4的邊緣,斯網(wǎng)絡(luò)是非循環(huán)的。??
SS?(Race,?Country,?Education,?Workclass,Occupation)和弱集合?WS?(Race)。本文為??魯棒關(guān)聯(lián)屬性集ss執(zhí)行局部差分隱私預(yù)算為的隱私保護,為弱關(guān)聯(lián)屬性集ws??執(zhí)行預(yù)算為ft的隱私保護,因此構(gòu)建的h度私有貝葉斯網(wǎng)絡(luò)BN如圖下圖5.1所??不。??^^.ace^ ̄ ̄0.014856->^^ucation)--0.336405+<OccupatiOT|??0.139517?^?£:?、#?2??(Country)—0.012541->nVorkclass)--0.017104-^f?Income?)??圖5.1基于成人數(shù)據(jù)集六個屬性的h度私有貝葉斯網(wǎng)絡(luò)BN??Fig.5.1?A?A:-degree?private?Bayesian?network?BN?over?six?attributes?of?the?Adult?data?set?DS??為了分析h度私有貝葉斯網(wǎng)絡(luò)BN的分類效果,從兩個類別上進行評估,分??別是預(yù)測個體是否是白人,以及年收入是否超過50K。另一個方面,將數(shù)據(jù)集分??為六個等級,即Z=(1K,2K,?4K,8K,16K,32K),其中1K=1000。數(shù)據(jù)集以??等比數(shù)列的形式設(shè)置可以充分的利用成人數(shù)據(jù)集
本文編號:2965578
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2965578.html
最近更新
教材專著