基于負數(shù)據(jù)庫的隱私保護k-means聚類算法研究
發(fā)布時間:2022-09-30 21:14
在大數(shù)據(jù)時代,用戶的隱私保護是一個關(guān)鍵問題。作為數(shù)據(jù)挖掘的經(jīng)典算法,原始k-means算法常用于對明文數(shù)據(jù)進行聚類分析,沒有考慮到隱私保護的問題。已有工作研究支持隱私保護的k-means算法,但是一般有計算成本高(例如加密算法),精度損失大(例如數(shù)據(jù)擾動方法),通訊成本高(例如安全多方計算)等缺點。負數(shù)據(jù)庫作為一種新型的數(shù)據(jù)表示方法,存儲的是原始數(shù)據(jù)庫補集中的信息,其難以逆轉(zhuǎn)的特性可以用于保護原始數(shù)據(jù)的隱私。負數(shù)據(jù)庫支持距離度量,可以被應用到k-means聚類分析中保護隱私。負數(shù)據(jù)庫上現(xiàn)有的隱私保護k-means算法只能支持基于海明距離的相似度計算,但是現(xiàn)實中很多數(shù)據(jù)的相似度計算都是基于歐式距離的,這大大限制了該方法的適用范圍。并且該方法將實數(shù)轉(zhuǎn)化為二進制編碼,編碼的長度取決于數(shù)據(jù)庫中不同實數(shù)值的數(shù)目,這使得該方法僅適用于結(jié)構(gòu)簡單、屬性值少的數(shù)據(jù),實用性較差。針對上述情況,本文利用歐氏距離二進制數(shù)編碼方式中編碼位數(shù)只與屬性值大小相關(guān)的特點,提出了面向負數(shù)據(jù)庫的歐氏距離計算公式。在此基礎之上,提出了一種新的基于負數(shù)據(jù)庫的隱私保護k-means聚類算法,并改進了負數(shù)據(jù)庫的生成算法以進一步提...
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
符號和名詞解釋
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 支持隱私保護的k-means聚類分析
1.2.2 負數(shù)據(jù)庫概述及應用
1.2.3 負數(shù)據(jù)庫生成算法
1.3 本文主要內(nèi)容和結(jié)構(gòu)
第2章 基于K-NDB的隱私保護k-means算法
2.1 相關(guān)工作
2.1.1 k-means聚類算法
2.1.2 K-hidden負數(shù)據(jù)庫生成算法
2.2 面向負數(shù)據(jù)庫的歐氏距離估算方法
2.2.1 理論推導
2.2.2 實驗驗證
2.3 隱私保護的k-means聚類算法
2.3.1 算法設計
2.3.2 實驗驗證
2.4 本章小結(jié)
第3章 基于QK-NDB的隱私保護k-means算法
3.1 QK-hidden負數(shù)據(jù)庫生成算法
3.2 細粒度的隱私保護k-means算法
3.3 實驗
3.3.1 誤差實驗
3.3.2 對比實驗
3.4 小結(jié)
第4章 總結(jié)和展望
4.1 總結(jié)
4.2 展望
致謝
參考文獻
攻讀碩士學位期間主要的工作
【參考文獻】:
期刊論文
[1]大數(shù)據(jù)時代的個人隱私保護[J]. 劉雅輝,張鐵贏,靳小龍,程學旗. 計算機研究與發(fā)展. 2015(01)
[2]MD5加密算法的研究及應用[J]. 魏曉玲. 信息技術(shù). 2010(07)
博士論文
[1]信息負表示的若干應用方案研究[D]. 趙冬冬.中國科學技術(shù)大學 2016
[2]負數(shù)據(jù)庫生成算法及應用研究[D]. 劉然.中國科學技術(shù)大學 2013
碩士論文
[1]隱私保護聚類挖掘方法的研究[D]. 徐一鳳.哈爾濱工程大學 2010
本文編號:3684285
【文章頁數(shù)】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
符號和名詞解釋
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 支持隱私保護的k-means聚類分析
1.2.2 負數(shù)據(jù)庫概述及應用
1.2.3 負數(shù)據(jù)庫生成算法
1.3 本文主要內(nèi)容和結(jié)構(gòu)
第2章 基于K-NDB的隱私保護k-means算法
2.1 相關(guān)工作
2.1.1 k-means聚類算法
2.1.2 K-hidden負數(shù)據(jù)庫生成算法
2.2 面向負數(shù)據(jù)庫的歐氏距離估算方法
2.2.1 理論推導
2.2.2 實驗驗證
2.3 隱私保護的k-means聚類算法
2.3.1 算法設計
2.3.2 實驗驗證
2.4 本章小結(jié)
第3章 基于QK-NDB的隱私保護k-means算法
3.1 QK-hidden負數(shù)據(jù)庫生成算法
3.2 細粒度的隱私保護k-means算法
3.3 實驗
3.3.1 誤差實驗
3.3.2 對比實驗
3.4 小結(jié)
第4章 總結(jié)和展望
4.1 總結(jié)
4.2 展望
致謝
參考文獻
攻讀碩士學位期間主要的工作
【參考文獻】:
期刊論文
[1]大數(shù)據(jù)時代的個人隱私保護[J]. 劉雅輝,張鐵贏,靳小龍,程學旗. 計算機研究與發(fā)展. 2015(01)
[2]MD5加密算法的研究及應用[J]. 魏曉玲. 信息技術(shù). 2010(07)
博士論文
[1]信息負表示的若干應用方案研究[D]. 趙冬冬.中國科學技術(shù)大學 2016
[2]負數(shù)據(jù)庫生成算法及應用研究[D]. 劉然.中國科學技術(shù)大學 2013
碩士論文
[1]隱私保護聚類挖掘方法的研究[D]. 徐一鳳.哈爾濱工程大學 2010
本文編號:3684285
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3684285.html
最近更新
教材專著