事務數(shù)據(jù)流關鍵模式挖掘的差分隱私保護方法
發(fā)布時間:2023-05-31 22:52
事務數(shù)據(jù)流下頻繁模式挖掘是大多數(shù)在線數(shù)據(jù)挖掘應用中的一個最基礎的工作。然而,在數(shù)據(jù)流上挖掘簡潔的關鍵模式比頻繁模式更有優(yōu)勢,因為關鍵模式既可以避免頻繁模式里包含的冗余信息以減少內(nèi)存存儲空間,又可以高效無損地提取頻繁模式。但是,由于連續(xù)時間戳發(fā)布的統(tǒng)計信息可以作為輔助知識增強攻擊者的推理能力,所以從包含個人信息的事務數(shù)據(jù)流中挖掘關鍵模式比靜態(tài)場景下更容易造成隱私泄露。然而,還沒有工作涉及事務數(shù)據(jù)流連續(xù)發(fā)布挖掘的關鍵模式中的隱私保護問題,因此,本文在每個時間戳提出了一個實時的差分隱私關鍵模式計算算法(Real-time Differentially Private Crucial Pattern Computation,簡稱RDP-CPC),該算法在每個時間戳設計一個三階段機制:預處理階段、深入計算階段和噪音挖掘階段。該算法不僅能在滿足關鍵模式連續(xù)發(fā)布的隱私的前提下,盡可能提高發(fā)布的關鍵模式統(tǒng)計信息的效用性;而且根據(jù)關鍵模式的特點,在不增加維護開銷的情況下減少了平均挖掘時間。為了減少對關鍵模式計算算法(Crucial Pattern Computation,簡稱CPC)的調(diào)用次數(shù),在三階段...
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀及分析
1.3 本文的主要創(chuàng)新與結構安排
第2章 數(shù)據(jù)流模型、關鍵模式挖掘以及靜態(tài)隱私保護方法概述
2.1 數(shù)據(jù)流模型
2.1.1 窗口模型
2.1.2 滑動窗口隱私預算分配方法
2.2 關鍵模式挖掘方法
2.2.1 頻繁模式及關鍵模式的基本概念
2.2.2 事務數(shù)據(jù)流關鍵模式挖掘方法
2.3 靜態(tài)場景下頻繁模式挖掘的隱私保護方法
2.3.1 靜態(tài)場景下頻繁模式挖掘的隱私問題
2.3.2 差分隱私模型
2.4 本章小結
第3章 事務數(shù)據(jù)流關鍵模式挖掘的差分隱私保護方法
3.1 事務數(shù)據(jù)流關鍵模式挖掘的隱私問題描述
3.2 實現(xiàn)事務數(shù)據(jù)流實時的差分隱私關鍵模式計算算法的三個關鍵子算法
3.2.1 構造前綴樹算法
3.2.2 前綴樹調(diào)整算法
3.2.3 篩選關鍵模式候選集算法
3.3 子算法的隱私安全性以及復雜性分析
3.3.1 隱私安全性分析
3.3.2 復雜性分析
3.4 本章小結
第4章 事務數(shù)據(jù)流關鍵模式挖掘的差分隱私方法實現(xiàn)與評估
4.1 事務數(shù)據(jù)流每個時間戳的差分隱私關鍵模式計算算法系統(tǒng)框架
4.1.1 預處理階段
4.1.2 深入計算階段
4.1.3 噪音挖掘階段
4.2 總算法的隱私安全性、效用性以及復雜性分析
4.2.1 隱私安全性分析
4.2.2 效用性分析
4.2.3 復雜性分析
4.3 本章小結
第5章 實驗與分析
5.1 實驗環(huán)境設置與數(shù)據(jù)集簡介
5.1.1 系統(tǒng)環(huán)境設置
5.1.2 實驗數(shù)據(jù)集
5.2 實驗評價指標
5.3 實驗結果與分析
5.3.1 參數(shù)W對效用性及挖掘時間的影響
5.3.2 參數(shù)ε對效用性及挖掘時間的影響
5.3.3 參數(shù)r對效用性及挖掘時間的影響
5.4 本章小結
第6章 總結與展望
6.1 總結
6.2 展望
參考文獻
攻讀碩士期間發(fā)表的與學位論文有關的論文目錄
致謝
本文編號:3826160
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀及分析
1.3 本文的主要創(chuàng)新與結構安排
第2章 數(shù)據(jù)流模型、關鍵模式挖掘以及靜態(tài)隱私保護方法概述
2.1 數(shù)據(jù)流模型
2.1.1 窗口模型
2.1.2 滑動窗口隱私預算分配方法
2.2 關鍵模式挖掘方法
2.2.1 頻繁模式及關鍵模式的基本概念
2.2.2 事務數(shù)據(jù)流關鍵模式挖掘方法
2.3 靜態(tài)場景下頻繁模式挖掘的隱私保護方法
2.3.1 靜態(tài)場景下頻繁模式挖掘的隱私問題
2.3.2 差分隱私模型
2.4 本章小結
第3章 事務數(shù)據(jù)流關鍵模式挖掘的差分隱私保護方法
3.1 事務數(shù)據(jù)流關鍵模式挖掘的隱私問題描述
3.2 實現(xiàn)事務數(shù)據(jù)流實時的差分隱私關鍵模式計算算法的三個關鍵子算法
3.2.1 構造前綴樹算法
3.2.2 前綴樹調(diào)整算法
3.2.3 篩選關鍵模式候選集算法
3.3 子算法的隱私安全性以及復雜性分析
3.3.1 隱私安全性分析
3.3.2 復雜性分析
3.4 本章小結
第4章 事務數(shù)據(jù)流關鍵模式挖掘的差分隱私方法實現(xiàn)與評估
4.1 事務數(shù)據(jù)流每個時間戳的差分隱私關鍵模式計算算法系統(tǒng)框架
4.1.1 預處理階段
4.1.2 深入計算階段
4.1.3 噪音挖掘階段
4.2 總算法的隱私安全性、效用性以及復雜性分析
4.2.1 隱私安全性分析
4.2.2 效用性分析
4.2.3 復雜性分析
4.3 本章小結
第5章 實驗與分析
5.1 實驗環(huán)境設置與數(shù)據(jù)集簡介
5.1.1 系統(tǒng)環(huán)境設置
5.1.2 實驗數(shù)據(jù)集
5.2 實驗評價指標
5.3 實驗結果與分析
5.3.1 參數(shù)W對效用性及挖掘時間的影響
5.3.2 參數(shù)ε對效用性及挖掘時間的影響
5.3.3 參數(shù)r對效用性及挖掘時間的影響
5.4 本章小結
第6章 總結與展望
6.1 總結
6.2 展望
參考文獻
攻讀碩士期間發(fā)表的與學位論文有關的論文目錄
致謝
本文編號:3826160
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3826160.html
最近更新
教材專著