事務(wù)數(shù)據(jù)流關(guān)鍵模式挖掘的差分隱私保護(hù)方法
發(fā)布時(shí)間:2023-05-31 22:52
事務(wù)數(shù)據(jù)流下頻繁模式挖掘是大多數(shù)在線數(shù)據(jù)挖掘應(yīng)用中的一個(gè)最基礎(chǔ)的工作。然而,在數(shù)據(jù)流上挖掘簡潔的關(guān)鍵模式比頻繁模式更有優(yōu)勢,因?yàn)殛P(guān)鍵模式既可以避免頻繁模式里包含的冗余信息以減少內(nèi)存存儲(chǔ)空間,又可以高效無損地提取頻繁模式。但是,由于連續(xù)時(shí)間戳發(fā)布的統(tǒng)計(jì)信息可以作為輔助知識(shí)增強(qiáng)攻擊者的推理能力,所以從包含個(gè)人信息的事務(wù)數(shù)據(jù)流中挖掘關(guān)鍵模式比靜態(tài)場景下更容易造成隱私泄露。然而,還沒有工作涉及事務(wù)數(shù)據(jù)流連續(xù)發(fā)布挖掘的關(guān)鍵模式中的隱私保護(hù)問題,因此,本文在每個(gè)時(shí)間戳提出了一個(gè)實(shí)時(shí)的差分隱私關(guān)鍵模式計(jì)算算法(Real-time Differentially Private Crucial Pattern Computation,簡稱RDP-CPC),該算法在每個(gè)時(shí)間戳設(shè)計(jì)一個(gè)三階段機(jī)制:預(yù)處理階段、深入計(jì)算階段和噪音挖掘階段。該算法不僅能在滿足關(guān)鍵模式連續(xù)發(fā)布的隱私的前提下,盡可能提高發(fā)布的關(guān)鍵模式統(tǒng)計(jì)信息的效用性;而且根據(jù)關(guān)鍵模式的特點(diǎn),在不增加維護(hù)開銷的情況下減少了平均挖掘時(shí)間。為了減少對關(guān)鍵模式計(jì)算算法(Crucial Pattern Computation,簡稱CPC)的調(diào)用次數(shù),在三階段...
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀及分析
1.3 本文的主要?jiǎng)?chuàng)新與結(jié)構(gòu)安排
第2章 數(shù)據(jù)流模型、關(guān)鍵模式挖掘以及靜態(tài)隱私保護(hù)方法概述
2.1 數(shù)據(jù)流模型
2.1.1 窗口模型
2.1.2 滑動(dòng)窗口隱私預(yù)算分配方法
2.2 關(guān)鍵模式挖掘方法
2.2.1 頻繁模式及關(guān)鍵模式的基本概念
2.2.2 事務(wù)數(shù)據(jù)流關(guān)鍵模式挖掘方法
2.3 靜態(tài)場景下頻繁模式挖掘的隱私保護(hù)方法
2.3.1 靜態(tài)場景下頻繁模式挖掘的隱私問題
2.3.2 差分隱私模型
2.4 本章小結(jié)
第3章 事務(wù)數(shù)據(jù)流關(guān)鍵模式挖掘的差分隱私保護(hù)方法
3.1 事務(wù)數(shù)據(jù)流關(guān)鍵模式挖掘的隱私問題描述
3.2 實(shí)現(xiàn)事務(wù)數(shù)據(jù)流實(shí)時(shí)的差分隱私關(guān)鍵模式計(jì)算算法的三個(gè)關(guān)鍵子算法
3.2.1 構(gòu)造前綴樹算法
3.2.2 前綴樹調(diào)整算法
3.2.3 篩選關(guān)鍵模式候選集算法
3.3 子算法的隱私安全性以及復(fù)雜性分析
3.3.1 隱私安全性分析
3.3.2 復(fù)雜性分析
3.4 本章小結(jié)
第4章 事務(wù)數(shù)據(jù)流關(guān)鍵模式挖掘的差分隱私方法實(shí)現(xiàn)與評估
4.1 事務(wù)數(shù)據(jù)流每個(gè)時(shí)間戳的差分隱私關(guān)鍵模式計(jì)算算法系統(tǒng)框架
4.1.1 預(yù)處理階段
4.1.2 深入計(jì)算階段
4.1.3 噪音挖掘階段
4.2 總算法的隱私安全性、效用性以及復(fù)雜性分析
4.2.1 隱私安全性分析
4.2.2 效用性分析
4.2.3 復(fù)雜性分析
4.3 本章小結(jié)
第5章 實(shí)驗(yàn)與分析
5.1 實(shí)驗(yàn)環(huán)境設(shè)置與數(shù)據(jù)集簡介
5.1.1 系統(tǒng)環(huán)境設(shè)置
5.1.2 實(shí)驗(yàn)數(shù)據(jù)集
5.2 實(shí)驗(yàn)評價(jià)指標(biāo)
5.3 實(shí)驗(yàn)結(jié)果與分析
5.3.1 參數(shù)W對效用性及挖掘時(shí)間的影響
5.3.2 參數(shù)ε對效用性及挖掘時(shí)間的影響
5.3.3 參數(shù)r對效用性及挖掘時(shí)間的影響
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀碩士期間發(fā)表的與學(xué)位論文有關(guān)的論文目錄
致謝
本文編號(hào):3826160
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀及分析
1.3 本文的主要?jiǎng)?chuàng)新與結(jié)構(gòu)安排
第2章 數(shù)據(jù)流模型、關(guān)鍵模式挖掘以及靜態(tài)隱私保護(hù)方法概述
2.1 數(shù)據(jù)流模型
2.1.1 窗口模型
2.1.2 滑動(dòng)窗口隱私預(yù)算分配方法
2.2 關(guān)鍵模式挖掘方法
2.2.1 頻繁模式及關(guān)鍵模式的基本概念
2.2.2 事務(wù)數(shù)據(jù)流關(guān)鍵模式挖掘方法
2.3 靜態(tài)場景下頻繁模式挖掘的隱私保護(hù)方法
2.3.1 靜態(tài)場景下頻繁模式挖掘的隱私問題
2.3.2 差分隱私模型
2.4 本章小結(jié)
第3章 事務(wù)數(shù)據(jù)流關(guān)鍵模式挖掘的差分隱私保護(hù)方法
3.1 事務(wù)數(shù)據(jù)流關(guān)鍵模式挖掘的隱私問題描述
3.2 實(shí)現(xiàn)事務(wù)數(shù)據(jù)流實(shí)時(shí)的差分隱私關(guān)鍵模式計(jì)算算法的三個(gè)關(guān)鍵子算法
3.2.1 構(gòu)造前綴樹算法
3.2.2 前綴樹調(diào)整算法
3.2.3 篩選關(guān)鍵模式候選集算法
3.3 子算法的隱私安全性以及復(fù)雜性分析
3.3.1 隱私安全性分析
3.3.2 復(fù)雜性分析
3.4 本章小結(jié)
第4章 事務(wù)數(shù)據(jù)流關(guān)鍵模式挖掘的差分隱私方法實(shí)現(xiàn)與評估
4.1 事務(wù)數(shù)據(jù)流每個(gè)時(shí)間戳的差分隱私關(guān)鍵模式計(jì)算算法系統(tǒng)框架
4.1.1 預(yù)處理階段
4.1.2 深入計(jì)算階段
4.1.3 噪音挖掘階段
4.2 總算法的隱私安全性、效用性以及復(fù)雜性分析
4.2.1 隱私安全性分析
4.2.2 效用性分析
4.2.3 復(fù)雜性分析
4.3 本章小結(jié)
第5章 實(shí)驗(yàn)與分析
5.1 實(shí)驗(yàn)環(huán)境設(shè)置與數(shù)據(jù)集簡介
5.1.1 系統(tǒng)環(huán)境設(shè)置
5.1.2 實(shí)驗(yàn)數(shù)據(jù)集
5.2 實(shí)驗(yàn)評價(jià)指標(biāo)
5.3 實(shí)驗(yàn)結(jié)果與分析
5.3.1 參數(shù)W對效用性及挖掘時(shí)間的影響
5.3.2 參數(shù)ε對效用性及挖掘時(shí)間的影響
5.3.3 參數(shù)r對效用性及挖掘時(shí)間的影響
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀碩士期間發(fā)表的與學(xué)位論文有關(guān)的論文目錄
致謝
本文編號(hào):3826160
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3826160.html
最近更新
教材專著