基于聚類的差分隱私保護的研究
發(fā)布時間:2023-06-27 23:35
在大數(shù)據(jù)時代,各種類型數(shù)據(jù)的收集、存儲、分析和發(fā)布變得簡單便利,信息的傳播速度也呈現(xiàn)出一種速度快、形態(tài)多、范圍廣的特性,大數(shù)據(jù)動和促進社會進步、經(jīng)濟增長的重要力量。然而,隱私信息一旦落入到非法入侵者手中,就可能會導致企業(yè)、政府和國家不可估量的損失。因此,在對數(shù)據(jù)進行發(fā)布、分析、挖掘的時候,需對數(shù)據(jù)進行隱私處理。差分隱私模型作為一種隱私保護的方法,其定義了一種非常嚴格的以最大背景知識作為它的攻擊模型,在強大的背景知識和數(shù)學理論的支持下,通過向原始數(shù)據(jù)集內(nèi)加入適量噪音參數(shù)ε從而進行數(shù)據(jù)保護。通過分析隱私保護數(shù)據(jù)挖掘技術(PPDM)——差分隱私保護下的傳統(tǒng)K-means聚類算法可知,在聚類過程中隱私泄露的關鍵點在于無法正確的選擇適合的聚類中心點進行隱私保護,由于數(shù)據(jù)集進行聚類劃分時對選擇聚簇點的要求不高,只通過聚類中心點的隨機位置對數(shù)據(jù)進行保護,雖然這種傳統(tǒng)的保護技術對數(shù)據(jù)安全性而言有一定的保護,但是,其聚類過程中初始點和中心點的選擇具有一定的隨意性和局限性,不僅降低了聚類的精確度和可用性,同時也使差分隱私模型的加噪結果失真。本文研究的主要內(nèi)容是基于差分隱私保護下的聚類算法的改進,研究目的是...
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要研究內(nèi)容
1.4 論文章節(jié)安排
2 基于差分隱私保護的數(shù)據(jù)挖掘技術
2.1 隱私保護的概念
2.1.1 隱私的定義
2.1.2 隱私保護技術
2.2 匿名化隱私保護技術
2.2.1. K-anonymity模型
2.2.2. L-diversity模型
2.3 差分隱私基本概念
2.3.1 差分隱私的定義
2.3.2 隱私保護敏感度評測
2.4 差分隱私的兩種實現(xiàn)機制
2.4.1 拉普拉斯機制
2.4.2 指數(shù)機制
2.5 差分隱私的保護框架
2.5.1 交互式框架
2.5.2 非交互式框架
2.6 本章小結
3 一種基于聚類的差分隱私數(shù)據(jù)挖掘方法
3.1 K-means聚類算法的改進
3.1.1 K-means算法主要思想
3.1.2 K-modes算法主要思想
3.1.3 融合算法DPTK-means
3.2 聚類評價指標
3.2.1 F-measure評價指標
3.3 一種基于聚類的差分隱私數(shù)據(jù)挖掘方法
3.3.1 基于K-means的差分隱私算法
3.3.2 基于DPTK-means的差分隱私算法
3.4 本章小結
4 實驗方案
4.1 開發(fā)工具與開發(fā)技術
4.1.1 實驗環(huán)境
4.1.2 實驗數(shù)據(jù)集
4.1.3 對比實驗設計
4.2 實驗結果分析
4.2.1 DPTK-means聚類算法的可行性分析
4.2.2 差分隱私保護下的DPTK-means算法的安全性分析
4.3 本章小結
5 總結與展望
參考文獻
致謝
作者簡介及讀研期間主要科研成果
本文編號:3835552
【文章頁數(shù)】:54 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要研究內(nèi)容
1.4 論文章節(jié)安排
2 基于差分隱私保護的數(shù)據(jù)挖掘技術
2.1 隱私保護的概念
2.1.1 隱私的定義
2.1.2 隱私保護技術
2.2 匿名化隱私保護技術
2.2.1. K-anonymity模型
2.2.2. L-diversity模型
2.3 差分隱私基本概念
2.3.1 差分隱私的定義
2.3.2 隱私保護敏感度評測
2.4 差分隱私的兩種實現(xiàn)機制
2.4.1 拉普拉斯機制
2.4.2 指數(shù)機制
2.5 差分隱私的保護框架
2.5.1 交互式框架
2.5.2 非交互式框架
2.6 本章小結
3 一種基于聚類的差分隱私數(shù)據(jù)挖掘方法
3.1 K-means聚類算法的改進
3.1.1 K-means算法主要思想
3.1.2 K-modes算法主要思想
3.1.3 融合算法DPTK-means
3.2 聚類評價指標
3.2.1 F-measure評價指標
3.3 一種基于聚類的差分隱私數(shù)據(jù)挖掘方法
3.3.1 基于K-means的差分隱私算法
3.3.2 基于DPTK-means的差分隱私算法
3.4 本章小結
4 實驗方案
4.1 開發(fā)工具與開發(fā)技術
4.1.1 實驗環(huán)境
4.1.2 實驗數(shù)據(jù)集
4.1.3 對比實驗設計
4.2 實驗結果分析
4.2.1 DPTK-means聚類算法的可行性分析
4.2.2 差分隱私保護下的DPTK-means算法的安全性分析
4.3 本章小結
5 總結與展望
參考文獻
致謝
作者簡介及讀研期間主要科研成果
本文編號:3835552
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3835552.html
最近更新
教材專著