差分隱私圖聚類與生成技術(shù)研究
發(fā)布時(shí)間:2021-09-07 12:38
隨著信息技術(shù)的飛速發(fā)展和便攜式移動互聯(lián)設(shè)備的廣泛使用,大量的個(gè)人用戶數(shù)據(jù)被互聯(lián)網(wǎng)服務(wù)商所廣泛搜集,例如由各類App所產(chǎn)生的位置數(shù)據(jù)、社交網(wǎng)絡(luò)數(shù)據(jù)、個(gè)人健康狀態(tài)數(shù)據(jù)等等。這些數(shù)據(jù)的搜集一方面能使得服務(wù)提供商能為用戶提供更好的個(gè)性化推薦服務(wù),但另一方面也給用戶隱私帶來了前所未有的挑戰(zhàn),一旦數(shù)據(jù)泄露就可能會威脅到用戶的財(cái)產(chǎn)甚至生命安全。最近幾年頻繁發(fā)生的大規(guī)模數(shù)據(jù)泄漏事件進(jìn)一步加深了人們對用戶隱私數(shù)據(jù)泄露方面的擔(dān)憂。因此,如何在保證隱私數(shù)據(jù)安全的前提下充分挖掘并利用數(shù)據(jù)也已成了網(wǎng)絡(luò)安全領(lǐng)域的一個(gè)研究熱點(diǎn)。差分隱私技術(shù)可以精細(xì)量化隱私保護(hù)水平,又能在一定程度上保留數(shù)據(jù)的可用性,已成為隱私保護(hù)領(lǐng)域事實(shí)上的標(biāo)準(zhǔn),得到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。針對各種網(wǎng)絡(luò)信息系統(tǒng)產(chǎn)生的大量圖數(shù)據(jù)在實(shí)際應(yīng)用中所面臨的隱私泄露問題,本文主要研究了差分隱私下的圖數(shù)據(jù)聚類和合成圖生成技術(shù),并取得以下成果:1.針對圖數(shù)據(jù)聚類分析過程中的隱私泄露問題,以一個(gè)經(jīng)典的圖聚類算法SCAN(Structural Clustering Algorithm for Networks)為基礎(chǔ),通過定義相關(guān)圖的邊差分隱私,并合理測定計(jì)算圖中...
【文章來源】:戰(zhàn)略支援部隊(duì)信息工程大學(xué)河南省
【文章頁數(shù)】:45 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同隱私預(yù)算對NMI值的影響
第三章基于結(jié)構(gòu)相似度的差分隱私圖聚類算法第19頁果顯著增加,ARI值和NMI值都可達(dá)80%左右。再隨著隱私預(yù)算的增大,ARI值和NMI值都緩慢增加,DP-SCAN算法的聚類效果也隨之緩慢增加。圖3.3給出了在隱私預(yù)算=10,閾值μ=5時(shí),不同數(shù)據(jù)集上鄰域β對ARI值的影響。我們可以看出,ARI值隨著鄰域β的增大而先減小后增大。當(dāng)鄰域β=0.6左右時(shí),ARI值達(dá)到最小值,DP-SCAN算法的聚類結(jié)果與SCAN算法的聚類結(jié)果相差較大。因?yàn)镾CAN算法的適當(dāng)鄰域β值為0.7,鄰域β值在0.5到0.8之間通常足以獲得良好的聚類結(jié)果,然后在此時(shí)DP-SCAN算法加入隱私預(yù)算引入噪聲機(jī)制會大大降低聚類效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值圖3.3不同鄰域?qū)RI值的影響圖3.4給出了在隱私預(yù)算=10,閾值μ=5時(shí),不同數(shù)據(jù)集上鄰域β對NMI值的影響。我們可以看出,NMI值同ARI值一樣,都隨著鄰域β的增大而先減小后增大。當(dāng)鄰域β=0.6左右時(shí),NMI值達(dá)到最小值,DP-SCAN算法的聚類結(jié)果與SCAN算法的聚類結(jié)果相差較大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值圖3.4不同鄰域?qū)MI值的影響綜上所述,結(jié)合圖3.3和圖3.4的分析可知,當(dāng)鄰域β逐漸增大時(shí),ARI值和NMI值都先減小后增大。當(dāng)鄰域β在0.5到0.8之間時(shí),SCAN算法有良好的聚類效果,但引入噪聲機(jī)制的DP-SCAN算法的聚類效果較差,評估指標(biāo)ARI值和NMI值都較校3.5本章小結(jié)本章重點(diǎn)研究了基于結(jié)構(gòu)相似度的差分隱私圖聚類算法的設(shè)計(jì)問題。針對經(jīng)典的圖聚
第三章基于結(jié)構(gòu)相似度的差分隱私圖聚類算法第19頁果顯著增加,ARI值和NMI值都可達(dá)80%左右。再隨著隱私預(yù)算的增大,ARI值和NMI值都緩慢增加,DP-SCAN算法的聚類效果也隨之緩慢增加。圖3.3給出了在隱私預(yù)算=10,閾值μ=5時(shí),不同數(shù)據(jù)集上鄰域β對ARI值的影響。我們可以看出,ARI值隨著鄰域β的增大而先減小后增大。當(dāng)鄰域β=0.6左右時(shí),ARI值達(dá)到最小值,DP-SCAN算法的聚類結(jié)果與SCAN算法的聚類結(jié)果相差較大。因?yàn)镾CAN算法的適當(dāng)鄰域β值為0.7,鄰域β值在0.5到0.8之間通常足以獲得良好的聚類結(jié)果,然后在此時(shí)DP-SCAN算法加入隱私預(yù)算引入噪聲機(jī)制會大大降低聚類效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值圖3.3不同鄰域?qū)RI值的影響圖3.4給出了在隱私預(yù)算=10,閾值μ=5時(shí),不同數(shù)據(jù)集上鄰域β對NMI值的影響。我們可以看出,NMI值同ARI值一樣,都隨著鄰域β的增大而先減小后增大。當(dāng)鄰域β=0.6左右時(shí),NMI值達(dá)到最小值,DP-SCAN算法的聚類結(jié)果與SCAN算法的聚類結(jié)果相差較大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值圖3.4不同鄰域?qū)MI值的影響綜上所述,結(jié)合圖3.3和圖3.4的分析可知,當(dāng)鄰域β逐漸增大時(shí),ARI值和NMI值都先減小后增大。當(dāng)鄰域β在0.5到0.8之間時(shí),SCAN算法有良好的聚類效果,但引入噪聲機(jī)制的DP-SCAN算法的聚類效果較差,評估指標(biāo)ARI值和NMI值都較校3.5本章小結(jié)本章重點(diǎn)研究了基于結(jié)構(gòu)相似度的差分隱私圖聚類算法的設(shè)計(jì)問題。針對經(jīng)典的圖聚
【參考文獻(xiàn)】:
期刊論文
[1]基于邊介數(shù)模型的差分隱私保護(hù)方案[J]. 黃海平,王凱,湯雄,張東軍. 通信學(xué)報(bào). 2019(05)
[2]Publishing Social Graphs with Differential Privacy Guarantees Based on wPINQ[J]. LI Xiaoye,YANG Jing,SUN Zhenlong,ZHANG Jianpei. Chinese Journal of Electronics. 2019(02)
[3]點(diǎn)差分隱私下圖數(shù)據(jù)的度直方圖發(fā)布方法[J]. 張宇軒,魏江宏,李霽,劉文芬,胡學(xué)先. 計(jì)算機(jī)研究與發(fā)展. 2019(03)
[4]基于差分隱私保護(hù)的社交網(wǎng)絡(luò)發(fā)布圖生成模型[J]. 王俊麗,柳先輝,管敏. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(08)
[5]基于差分隱私保護(hù)的DP-DBScan聚類算法研究[J]. 吳偉民,黃煥坤. 計(jì)算機(jī)工程與科學(xué). 2015(04)
[6]差分隱私保護(hù)及其應(yīng)用[J]. 熊平,朱天清,王曉峰. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[7]差分隱私保護(hù)k-means聚類方法研究[J]. 李楊,郝志峰,溫雯,謝光強(qiáng). 計(jì)算機(jī)科學(xué). 2013(03)
本文編號:3389562
【文章來源】:戰(zhàn)略支援部隊(duì)信息工程大學(xué)河南省
【文章頁數(shù)】:45 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同隱私預(yù)算對NMI值的影響
第三章基于結(jié)構(gòu)相似度的差分隱私圖聚類算法第19頁果顯著增加,ARI值和NMI值都可達(dá)80%左右。再隨著隱私預(yù)算的增大,ARI值和NMI值都緩慢增加,DP-SCAN算法的聚類效果也隨之緩慢增加。圖3.3給出了在隱私預(yù)算=10,閾值μ=5時(shí),不同數(shù)據(jù)集上鄰域β對ARI值的影響。我們可以看出,ARI值隨著鄰域β的增大而先減小后增大。當(dāng)鄰域β=0.6左右時(shí),ARI值達(dá)到最小值,DP-SCAN算法的聚類結(jié)果與SCAN算法的聚類結(jié)果相差較大。因?yàn)镾CAN算法的適當(dāng)鄰域β值為0.7,鄰域β值在0.5到0.8之間通常足以獲得良好的聚類結(jié)果,然后在此時(shí)DP-SCAN算法加入隱私預(yù)算引入噪聲機(jī)制會大大降低聚類效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值圖3.3不同鄰域?qū)RI值的影響圖3.4給出了在隱私預(yù)算=10,閾值μ=5時(shí),不同數(shù)據(jù)集上鄰域β對NMI值的影響。我們可以看出,NMI值同ARI值一樣,都隨著鄰域β的增大而先減小后增大。當(dāng)鄰域β=0.6左右時(shí),NMI值達(dá)到最小值,DP-SCAN算法的聚類結(jié)果與SCAN算法的聚類結(jié)果相差較大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值圖3.4不同鄰域?qū)MI值的影響綜上所述,結(jié)合圖3.3和圖3.4的分析可知,當(dāng)鄰域β逐漸增大時(shí),ARI值和NMI值都先減小后增大。當(dāng)鄰域β在0.5到0.8之間時(shí),SCAN算法有良好的聚類效果,但引入噪聲機(jī)制的DP-SCAN算法的聚類效果較差,評估指標(biāo)ARI值和NMI值都較校3.5本章小結(jié)本章重點(diǎn)研究了基于結(jié)構(gòu)相似度的差分隱私圖聚類算法的設(shè)計(jì)問題。針對經(jīng)典的圖聚
第三章基于結(jié)構(gòu)相似度的差分隱私圖聚類算法第19頁果顯著增加,ARI值和NMI值都可達(dá)80%左右。再隨著隱私預(yù)算的增大,ARI值和NMI值都緩慢增加,DP-SCAN算法的聚類效果也隨之緩慢增加。圖3.3給出了在隱私預(yù)算=10,閾值μ=5時(shí),不同數(shù)據(jù)集上鄰域β對ARI值的影響。我們可以看出,ARI值隨著鄰域β的增大而先減小后增大。當(dāng)鄰域β=0.6左右時(shí),ARI值達(dá)到最小值,DP-SCAN算法的聚類結(jié)果與SCAN算法的聚類結(jié)果相差較大。因?yàn)镾CAN算法的適當(dāng)鄰域β值為0.7,鄰域β值在0.5到0.8之間通常足以獲得良好的聚類結(jié)果,然后在此時(shí)DP-SCAN算法加入隱私預(yù)算引入噪聲機(jī)制會大大降低聚類效果。(a)CA-AstroPh-ARI值(b)CA-CondMat-ARI值(c)Email-Enron-ARI值圖3.3不同鄰域?qū)RI值的影響圖3.4給出了在隱私預(yù)算=10,閾值μ=5時(shí),不同數(shù)據(jù)集上鄰域β對NMI值的影響。我們可以看出,NMI值同ARI值一樣,都隨著鄰域β的增大而先減小后增大。當(dāng)鄰域β=0.6左右時(shí),NMI值達(dá)到最小值,DP-SCAN算法的聚類結(jié)果與SCAN算法的聚類結(jié)果相差較大。(a)CA-AstroPh-NMI值(b)CA-CondMat-NMI值(c)Email-Enron-NMI值圖3.4不同鄰域?qū)MI值的影響綜上所述,結(jié)合圖3.3和圖3.4的分析可知,當(dāng)鄰域β逐漸增大時(shí),ARI值和NMI值都先減小后增大。當(dāng)鄰域β在0.5到0.8之間時(shí),SCAN算法有良好的聚類效果,但引入噪聲機(jī)制的DP-SCAN算法的聚類效果較差,評估指標(biāo)ARI值和NMI值都較校3.5本章小結(jié)本章重點(diǎn)研究了基于結(jié)構(gòu)相似度的差分隱私圖聚類算法的設(shè)計(jì)問題。針對經(jīng)典的圖聚
【參考文獻(xiàn)】:
期刊論文
[1]基于邊介數(shù)模型的差分隱私保護(hù)方案[J]. 黃海平,王凱,湯雄,張東軍. 通信學(xué)報(bào). 2019(05)
[2]Publishing Social Graphs with Differential Privacy Guarantees Based on wPINQ[J]. LI Xiaoye,YANG Jing,SUN Zhenlong,ZHANG Jianpei. Chinese Journal of Electronics. 2019(02)
[3]點(diǎn)差分隱私下圖數(shù)據(jù)的度直方圖發(fā)布方法[J]. 張宇軒,魏江宏,李霽,劉文芬,胡學(xué)先. 計(jì)算機(jī)研究與發(fā)展. 2019(03)
[4]基于差分隱私保護(hù)的社交網(wǎng)絡(luò)發(fā)布圖生成模型[J]. 王俊麗,柳先輝,管敏. 同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(08)
[5]基于差分隱私保護(hù)的DP-DBScan聚類算法研究[J]. 吳偉民,黃煥坤. 計(jì)算機(jī)工程與科學(xué). 2015(04)
[6]差分隱私保護(hù)及其應(yīng)用[J]. 熊平,朱天清,王曉峰. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[7]差分隱私保護(hù)k-means聚類方法研究[J]. 李楊,郝志峰,溫雯,謝光強(qiáng). 計(jì)算機(jī)科學(xué). 2013(03)
本文編號:3389562
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3389562.html
最近更新
教材專著