基于差分隱私的數(shù)據(jù)發(fā)布技術(shù)研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-07-07 21:02
近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的快速興起和大數(shù)據(jù)應(yīng)用的迅速發(fā)展,數(shù)據(jù)正在逐漸改變?nèi)藗兊纳詈凸ぷ鞣绞?其價(jià)值也在各行各業(yè)得到逐步體現(xiàn)。但是,數(shù)據(jù)發(fā)布在創(chuàng)造價(jià)值的同時(shí)也會(huì)讓用戶的隱私受到巨大的威脅。因此,用戶隱私保護(hù)成為數(shù)據(jù)發(fā)布中一個(gè)至關(guān)重要的安全需求。如果發(fā)布的數(shù)據(jù)得不到合適的處理,那么涉及用戶隱私的敏感信息就可能出現(xiàn)泄漏的情況。例如,不可信的實(shí)體可能企圖竊取用戶的身份信息,歷史位置和移動(dòng)軌跡信息,甚至可以通過(guò)背景知識(shí)和上下文信息來(lái)揭露用戶的行為習(xí)慣等隱私信息,進(jìn)而威脅到用戶的生命與財(cái)產(chǎn)安全。因此,為了解決大數(shù)據(jù)背景下的數(shù)據(jù)發(fā)布中存在的隱私問(wèn)題,本文進(jìn)行了以下針對(duì)性的研究:(1)針對(duì)數(shù)據(jù)發(fā)布中可能出現(xiàn)的隱私泄漏問(wèn)題,本文提出了一種基于準(zhǔn)標(biāo)識(shí)符分類的混淆差分隱私數(shù)據(jù)發(fā)布方案AQ-DP。該方案提出了一種根據(jù)敏感屬性對(duì)準(zhǔn)標(biāo)識(shí)符進(jìn)行分類的方法,并分別使用隨機(jī)洗牌算法和數(shù)據(jù)泛化算法對(duì)分類的準(zhǔn)標(biāo)識(shí)符進(jìn)行隱私保護(hù)處理。該方法的優(yōu)勢(shì)在于在不破壞數(shù)據(jù)的關(guān)聯(lián)性的同時(shí)又對(duì)用戶數(shù)據(jù)隱私提供保護(hù)。AQ-DP引入差分隱私來(lái)加強(qiáng)對(duì)用戶數(shù)據(jù)的保護(hù),從而數(shù)據(jù)安全性從理論上能夠得到保障。此外,方案引入KL divergence和...
【文章來(lái)源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Laplace機(jī)制原理圖
3 基于準(zhǔn)標(biāo)識(shí)符分類的混淆差分隱私數(shù)據(jù)發(fā)布方案 碩士學(xué)位論文 符數(shù)量為 /2 ,其中 n 為準(zhǔn)標(biāo)識(shí)符的數(shù)量。從實(shí)驗(yàn)結(jié)果可以看出,在準(zhǔn)標(biāo)識(shí)符數(shù)量 n從 3 到 9 依次增大的情況下,三種方案的 KL divergence 都隨之增大,這是因?yàn)殡S著準(zhǔn)標(biāo)識(shí)符數(shù)量的增加,數(shù)據(jù)集面臨的隱私風(fēng)險(xiǎn)也會(huì)增大。而為了滿足隱私性的要求,需要對(duì)數(shù)據(jù)集進(jìn)行更大程度的失真處理,這樣也就意味著數(shù)據(jù)可用性也會(huì)隨之降低。從三種方案的對(duì)比來(lái)看,我們的方案比 BLENDER 和 CSPLOG 的 KL divergence 更低,也就是說(shuō),在數(shù)據(jù)隱私處理的過(guò)程中,我們方案在關(guān)鍵信息的失真程度要比 BLENDER 和CSPLOG 低,從而看出我們的方案具有更高的數(shù)據(jù)可用性。
碩士學(xué)位論文基于差分隱私的數(shù)據(jù)發(fā)布技術(shù)研究與實(shí)現(xiàn)27圖3.5互信息對(duì)比圖3.4.3運(yùn)行效率除了數(shù)據(jù)可用性和隱私性,實(shí)際應(yīng)用環(huán)境下的可行性也是評(píng)價(jià)一個(gè)方案好壞的重要因素,因此我們通過(guò)實(shí)驗(yàn)對(duì)三種方案在運(yùn)行效率上的表現(xiàn)進(jìn)行了分析。首先,就我們的方案本身的運(yùn)行情況來(lái)說(shuō),當(dāng)隱私參數(shù)分別取0.1、0.2、0.5和0.8的時(shí)候,圖3.6表明方案隱私處理的計(jì)算時(shí)間依次減少。這是因?yàn)楫?dāng)增大時(shí),差分隱私模型的數(shù)據(jù)隱私性降低,而需要的隱私計(jì)算量也隨之減少,因此運(yùn)行時(shí)間會(huì)隨著的減小而減少。而在隱私參數(shù)一定的情況下,隨著數(shù)據(jù)集的增大,方案模型的處理時(shí)間也明顯增加,這是由于數(shù)據(jù)集的增大帶來(lái)的包括敏感度在內(nèi)的一系列差分隱私計(jì)算量的增加所導(dǎo)致的,總體來(lái)說(shuō),其運(yùn)行時(shí)間在可接受的范圍內(nèi)。圖3.6不同下的AQ-DP性能-數(shù)據(jù)量變化曲線同樣的,在準(zhǔn)標(biāo)識(shí)符為9的情況下,將我們的方案與BLENDER和CSPLOG依次進(jìn)行對(duì)比。如圖3.7所示,在分別取0.1、0.2、0.5和0.8的情況下,三種方案的整體變化趨勢(shì)保持一致,都是隨著數(shù)據(jù)集的增大,其運(yùn)行時(shí)間也變長(zhǎng)。但相比于BLENDER
【參考文獻(xiàn)】:
期刊論文
[1]一種基于差分隱私和時(shí)序的推薦系統(tǒng)模型研究[J]. 范利云,左萬(wàn)利,王英,王鑫. 電子學(xué)報(bào). 2017(09)
[2]基于濾波原理的時(shí)間序列差分隱私保護(hù)強(qiáng)度評(píng)估[J]. 熊文君,徐正全,王豪. 通信學(xué)報(bào). 2017(05)
[3]基于時(shí)間序列ARIMA與BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型[J]. 翟靜,曹俊. 統(tǒng)計(jì)與決策. 2016(04)
[4]基于差分隱私的權(quán)重社會(huì)網(wǎng)絡(luò)隱私保護(hù)[J]. 蘭麗輝,鞠時(shí)光. 通信學(xué)報(bào). 2015(09)
[5]Node.js:一種新的Web應(yīng)用構(gòu)建技術(shù)[J]. 王金龍,宋斌,丁銳. 現(xiàn)代電子技術(shù). 2015(06)
[6]面向頻繁模式挖掘的差分隱私保護(hù)研究綜述[J]. 丁麗萍,盧國(guó)慶. 通信學(xué)報(bào). 2014(10)
[7]面向數(shù)據(jù)發(fā)布和分析的差分隱私保護(hù)[J]. 張嘯劍,孟小峰. 計(jì)算機(jī)學(xué)報(bào). 2014(04)
[8]差分隱私保護(hù)下一種精確挖掘top-k頻繁模式方法[J]. 張嘯劍,王淼,孟小峰. 計(jì)算機(jī)研究與發(fā)展. 2014(01)
[9]差分隱私保護(hù)及其應(yīng)用[J]. 熊平,朱天清,王曉峰. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[10]大數(shù)據(jù)安全與隱私保護(hù)[J]. 馮登國(guó),張敏,李昊. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
本文編號(hào):3270365
【文章來(lái)源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:73 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Laplace機(jī)制原理圖
3 基于準(zhǔn)標(biāo)識(shí)符分類的混淆差分隱私數(shù)據(jù)發(fā)布方案 碩士學(xué)位論文 符數(shù)量為 /2 ,其中 n 為準(zhǔn)標(biāo)識(shí)符的數(shù)量。從實(shí)驗(yàn)結(jié)果可以看出,在準(zhǔn)標(biāo)識(shí)符數(shù)量 n從 3 到 9 依次增大的情況下,三種方案的 KL divergence 都隨之增大,這是因?yàn)殡S著準(zhǔn)標(biāo)識(shí)符數(shù)量的增加,數(shù)據(jù)集面臨的隱私風(fēng)險(xiǎn)也會(huì)增大。而為了滿足隱私性的要求,需要對(duì)數(shù)據(jù)集進(jìn)行更大程度的失真處理,這樣也就意味著數(shù)據(jù)可用性也會(huì)隨之降低。從三種方案的對(duì)比來(lái)看,我們的方案比 BLENDER 和 CSPLOG 的 KL divergence 更低,也就是說(shuō),在數(shù)據(jù)隱私處理的過(guò)程中,我們方案在關(guān)鍵信息的失真程度要比 BLENDER 和CSPLOG 低,從而看出我們的方案具有更高的數(shù)據(jù)可用性。
碩士學(xué)位論文基于差分隱私的數(shù)據(jù)發(fā)布技術(shù)研究與實(shí)現(xiàn)27圖3.5互信息對(duì)比圖3.4.3運(yùn)行效率除了數(shù)據(jù)可用性和隱私性,實(shí)際應(yīng)用環(huán)境下的可行性也是評(píng)價(jià)一個(gè)方案好壞的重要因素,因此我們通過(guò)實(shí)驗(yàn)對(duì)三種方案在運(yùn)行效率上的表現(xiàn)進(jìn)行了分析。首先,就我們的方案本身的運(yùn)行情況來(lái)說(shuō),當(dāng)隱私參數(shù)分別取0.1、0.2、0.5和0.8的時(shí)候,圖3.6表明方案隱私處理的計(jì)算時(shí)間依次減少。這是因?yàn)楫?dāng)增大時(shí),差分隱私模型的數(shù)據(jù)隱私性降低,而需要的隱私計(jì)算量也隨之減少,因此運(yùn)行時(shí)間會(huì)隨著的減小而減少。而在隱私參數(shù)一定的情況下,隨著數(shù)據(jù)集的增大,方案模型的處理時(shí)間也明顯增加,這是由于數(shù)據(jù)集的增大帶來(lái)的包括敏感度在內(nèi)的一系列差分隱私計(jì)算量的增加所導(dǎo)致的,總體來(lái)說(shuō),其運(yùn)行時(shí)間在可接受的范圍內(nèi)。圖3.6不同下的AQ-DP性能-數(shù)據(jù)量變化曲線同樣的,在準(zhǔn)標(biāo)識(shí)符為9的情況下,將我們的方案與BLENDER和CSPLOG依次進(jìn)行對(duì)比。如圖3.7所示,在分別取0.1、0.2、0.5和0.8的情況下,三種方案的整體變化趨勢(shì)保持一致,都是隨著數(shù)據(jù)集的增大,其運(yùn)行時(shí)間也變長(zhǎng)。但相比于BLENDER
【參考文獻(xiàn)】:
期刊論文
[1]一種基于差分隱私和時(shí)序的推薦系統(tǒng)模型研究[J]. 范利云,左萬(wàn)利,王英,王鑫. 電子學(xué)報(bào). 2017(09)
[2]基于濾波原理的時(shí)間序列差分隱私保護(hù)強(qiáng)度評(píng)估[J]. 熊文君,徐正全,王豪. 通信學(xué)報(bào). 2017(05)
[3]基于時(shí)間序列ARIMA與BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測(cè)模型[J]. 翟靜,曹俊. 統(tǒng)計(jì)與決策. 2016(04)
[4]基于差分隱私的權(quán)重社會(huì)網(wǎng)絡(luò)隱私保護(hù)[J]. 蘭麗輝,鞠時(shí)光. 通信學(xué)報(bào). 2015(09)
[5]Node.js:一種新的Web應(yīng)用構(gòu)建技術(shù)[J]. 王金龍,宋斌,丁銳. 現(xiàn)代電子技術(shù). 2015(06)
[6]面向頻繁模式挖掘的差分隱私保護(hù)研究綜述[J]. 丁麗萍,盧國(guó)慶. 通信學(xué)報(bào). 2014(10)
[7]面向數(shù)據(jù)發(fā)布和分析的差分隱私保護(hù)[J]. 張嘯劍,孟小峰. 計(jì)算機(jī)學(xué)報(bào). 2014(04)
[8]差分隱私保護(hù)下一種精確挖掘top-k頻繁模式方法[J]. 張嘯劍,王淼,孟小峰. 計(jì)算機(jī)研究與發(fā)展. 2014(01)
[9]差分隱私保護(hù)及其應(yīng)用[J]. 熊平,朱天清,王曉峰. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[10]大數(shù)據(jù)安全與隱私保護(hù)[J]. 馮登國(guó),張敏,李昊. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
本文編號(hào):3270365
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3270365.html
最近更新
教材專著