基于差分隱私的數(shù)據(jù)發(fā)布技術(shù)研究與實現(xiàn)
發(fā)布時間:2021-07-07 21:02
近年來,隨著互聯(lián)網(wǎng)技術(shù)的快速興起和大數(shù)據(jù)應(yīng)用的迅速發(fā)展,數(shù)據(jù)正在逐漸改變?nèi)藗兊纳詈凸ぷ鞣绞?其價值也在各行各業(yè)得到逐步體現(xiàn)。但是,數(shù)據(jù)發(fā)布在創(chuàng)造價值的同時也會讓用戶的隱私受到巨大的威脅。因此,用戶隱私保護成為數(shù)據(jù)發(fā)布中一個至關(guān)重要的安全需求。如果發(fā)布的數(shù)據(jù)得不到合適的處理,那么涉及用戶隱私的敏感信息就可能出現(xiàn)泄漏的情況。例如,不可信的實體可能企圖竊取用戶的身份信息,歷史位置和移動軌跡信息,甚至可以通過背景知識和上下文信息來揭露用戶的行為習(xí)慣等隱私信息,進(jìn)而威脅到用戶的生命與財產(chǎn)安全。因此,為了解決大數(shù)據(jù)背景下的數(shù)據(jù)發(fā)布中存在的隱私問題,本文進(jìn)行了以下針對性的研究:(1)針對數(shù)據(jù)發(fā)布中可能出現(xiàn)的隱私泄漏問題,本文提出了一種基于準(zhǔn)標(biāo)識符分類的混淆差分隱私數(shù)據(jù)發(fā)布方案AQ-DP。該方案提出了一種根據(jù)敏感屬性對準(zhǔn)標(biāo)識符進(jìn)行分類的方法,并分別使用隨機洗牌算法和數(shù)據(jù)泛化算法對分類的準(zhǔn)標(biāo)識符進(jìn)行隱私保護處理。該方法的優(yōu)勢在于在不破壞數(shù)據(jù)的關(guān)聯(lián)性的同時又對用戶數(shù)據(jù)隱私提供保護。AQ-DP引入差分隱私來加強對用戶數(shù)據(jù)的保護,從而數(shù)據(jù)安全性從理論上能夠得到保障。此外,方案引入KL divergence和...
【文章來源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
Laplace機制原理圖
3 基于準(zhǔn)標(biāo)識符分類的混淆差分隱私數(shù)據(jù)發(fā)布方案 碩士學(xué)位論文 符數(shù)量為 /2 ,其中 n 為準(zhǔn)標(biāo)識符的數(shù)量。從實驗結(jié)果可以看出,在準(zhǔn)標(biāo)識符數(shù)量 n從 3 到 9 依次增大的情況下,三種方案的 KL divergence 都隨之增大,這是因為隨著準(zhǔn)標(biāo)識符數(shù)量的增加,數(shù)據(jù)集面臨的隱私風(fēng)險也會增大。而為了滿足隱私性的要求,需要對數(shù)據(jù)集進(jìn)行更大程度的失真處理,這樣也就意味著數(shù)據(jù)可用性也會隨之降低。從三種方案的對比來看,我們的方案比 BLENDER 和 CSPLOG 的 KL divergence 更低,也就是說,在數(shù)據(jù)隱私處理的過程中,我們方案在關(guān)鍵信息的失真程度要比 BLENDER 和CSPLOG 低,從而看出我們的方案具有更高的數(shù)據(jù)可用性。
碩士學(xué)位論文基于差分隱私的數(shù)據(jù)發(fā)布技術(shù)研究與實現(xiàn)27圖3.5互信息對比圖3.4.3運行效率除了數(shù)據(jù)可用性和隱私性,實際應(yīng)用環(huán)境下的可行性也是評價一個方案好壞的重要因素,因此我們通過實驗對三種方案在運行效率上的表現(xiàn)進(jìn)行了分析。首先,就我們的方案本身的運行情況來說,當(dāng)隱私參數(shù)分別取0.1、0.2、0.5和0.8的時候,圖3.6表明方案隱私處理的計算時間依次減少。這是因為當(dāng)增大時,差分隱私模型的數(shù)據(jù)隱私性降低,而需要的隱私計算量也隨之減少,因此運行時間會隨著的減小而減少。而在隱私參數(shù)一定的情況下,隨著數(shù)據(jù)集的增大,方案模型的處理時間也明顯增加,這是由于數(shù)據(jù)集的增大帶來的包括敏感度在內(nèi)的一系列差分隱私計算量的增加所導(dǎo)致的,總體來說,其運行時間在可接受的范圍內(nèi)。圖3.6不同下的AQ-DP性能-數(shù)據(jù)量變化曲線同樣的,在準(zhǔn)標(biāo)識符為9的情況下,將我們的方案與BLENDER和CSPLOG依次進(jìn)行對比。如圖3.7所示,在分別取0.1、0.2、0.5和0.8的情況下,三種方案的整體變化趨勢保持一致,都是隨著數(shù)據(jù)集的增大,其運行時間也變長。但相比于BLENDER
【參考文獻(xiàn)】:
期刊論文
[1]一種基于差分隱私和時序的推薦系統(tǒng)模型研究[J]. 范利云,左萬利,王英,王鑫. 電子學(xué)報. 2017(09)
[2]基于濾波原理的時間序列差分隱私保護強度評估[J]. 熊文君,徐正全,王豪. 通信學(xué)報. 2017(05)
[3]基于時間序列ARIMA與BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型[J]. 翟靜,曹俊. 統(tǒng)計與決策. 2016(04)
[4]基于差分隱私的權(quán)重社會網(wǎng)絡(luò)隱私保護[J]. 蘭麗輝,鞠時光. 通信學(xué)報. 2015(09)
[5]Node.js:一種新的Web應(yīng)用構(gòu)建技術(shù)[J]. 王金龍,宋斌,丁銳. 現(xiàn)代電子技術(shù). 2015(06)
[6]面向頻繁模式挖掘的差分隱私保護研究綜述[J]. 丁麗萍,盧國慶. 通信學(xué)報. 2014(10)
[7]面向數(shù)據(jù)發(fā)布和分析的差分隱私保護[J]. 張嘯劍,孟小峰. 計算機學(xué)報. 2014(04)
[8]差分隱私保護下一種精確挖掘top-k頻繁模式方法[J]. 張嘯劍,王淼,孟小峰. 計算機研究與發(fā)展. 2014(01)
[9]差分隱私保護及其應(yīng)用[J]. 熊平,朱天清,王曉峰. 計算機學(xué)報. 2014(01)
[10]大數(shù)據(jù)安全與隱私保護[J]. 馮登國,張敏,李昊. 計算機學(xué)報. 2014(01)
本文編號:3270365
【文章來源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
Laplace機制原理圖
3 基于準(zhǔn)標(biāo)識符分類的混淆差分隱私數(shù)據(jù)發(fā)布方案 碩士學(xué)位論文 符數(shù)量為 /2 ,其中 n 為準(zhǔn)標(biāo)識符的數(shù)量。從實驗結(jié)果可以看出,在準(zhǔn)標(biāo)識符數(shù)量 n從 3 到 9 依次增大的情況下,三種方案的 KL divergence 都隨之增大,這是因為隨著準(zhǔn)標(biāo)識符數(shù)量的增加,數(shù)據(jù)集面臨的隱私風(fēng)險也會增大。而為了滿足隱私性的要求,需要對數(shù)據(jù)集進(jìn)行更大程度的失真處理,這樣也就意味著數(shù)據(jù)可用性也會隨之降低。從三種方案的對比來看,我們的方案比 BLENDER 和 CSPLOG 的 KL divergence 更低,也就是說,在數(shù)據(jù)隱私處理的過程中,我們方案在關(guān)鍵信息的失真程度要比 BLENDER 和CSPLOG 低,從而看出我們的方案具有更高的數(shù)據(jù)可用性。
碩士學(xué)位論文基于差分隱私的數(shù)據(jù)發(fā)布技術(shù)研究與實現(xiàn)27圖3.5互信息對比圖3.4.3運行效率除了數(shù)據(jù)可用性和隱私性,實際應(yīng)用環(huán)境下的可行性也是評價一個方案好壞的重要因素,因此我們通過實驗對三種方案在運行效率上的表現(xiàn)進(jìn)行了分析。首先,就我們的方案本身的運行情況來說,當(dāng)隱私參數(shù)分別取0.1、0.2、0.5和0.8的時候,圖3.6表明方案隱私處理的計算時間依次減少。這是因為當(dāng)增大時,差分隱私模型的數(shù)據(jù)隱私性降低,而需要的隱私計算量也隨之減少,因此運行時間會隨著的減小而減少。而在隱私參數(shù)一定的情況下,隨著數(shù)據(jù)集的增大,方案模型的處理時間也明顯增加,這是由于數(shù)據(jù)集的增大帶來的包括敏感度在內(nèi)的一系列差分隱私計算量的增加所導(dǎo)致的,總體來說,其運行時間在可接受的范圍內(nèi)。圖3.6不同下的AQ-DP性能-數(shù)據(jù)量變化曲線同樣的,在準(zhǔn)標(biāo)識符為9的情況下,將我們的方案與BLENDER和CSPLOG依次進(jìn)行對比。如圖3.7所示,在分別取0.1、0.2、0.5和0.8的情況下,三種方案的整體變化趨勢保持一致,都是隨著數(shù)據(jù)集的增大,其運行時間也變長。但相比于BLENDER
【參考文獻(xiàn)】:
期刊論文
[1]一種基于差分隱私和時序的推薦系統(tǒng)模型研究[J]. 范利云,左萬利,王英,王鑫. 電子學(xué)報. 2017(09)
[2]基于濾波原理的時間序列差分隱私保護強度評估[J]. 熊文君,徐正全,王豪. 通信學(xué)報. 2017(05)
[3]基于時間序列ARIMA與BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型[J]. 翟靜,曹俊. 統(tǒng)計與決策. 2016(04)
[4]基于差分隱私的權(quán)重社會網(wǎng)絡(luò)隱私保護[J]. 蘭麗輝,鞠時光. 通信學(xué)報. 2015(09)
[5]Node.js:一種新的Web應(yīng)用構(gòu)建技術(shù)[J]. 王金龍,宋斌,丁銳. 現(xiàn)代電子技術(shù). 2015(06)
[6]面向頻繁模式挖掘的差分隱私保護研究綜述[J]. 丁麗萍,盧國慶. 通信學(xué)報. 2014(10)
[7]面向數(shù)據(jù)發(fā)布和分析的差分隱私保護[J]. 張嘯劍,孟小峰. 計算機學(xué)報. 2014(04)
[8]差分隱私保護下一種精確挖掘top-k頻繁模式方法[J]. 張嘯劍,王淼,孟小峰. 計算機研究與發(fā)展. 2014(01)
[9]差分隱私保護及其應(yīng)用[J]. 熊平,朱天清,王曉峰. 計算機學(xué)報. 2014(01)
[10]大數(shù)據(jù)安全與隱私保護[J]. 馮登國,張敏,李昊. 計算機學(xué)報. 2014(01)
本文編號:3270365
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3270365.html
最近更新
教材專著