數(shù)據(jù)發(fā)布中的敏感屬性隱私保護方法研究
發(fā)布時間:2017-12-26 14:19
本文關(guān)鍵詞:數(shù)據(jù)發(fā)布中的敏感屬性隱私保護方法研究 出處:《貴州大學(xué)》2016年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 單敏感屬性 多敏感屬性 隱私保護 語義分析 相關(guān)性
【摘要】:如今大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展對全球經(jīng)濟發(fā)展方式的轉(zhuǎn)變、人類生活水平的提高和國家綜合能力的增強起到顯著推動作用。為促進該產(chǎn)業(yè)又好又快的發(fā)展,首要任務(wù)就是開放共享數(shù)據(jù),但企業(yè)或組織機構(gòu)發(fā)布的數(shù)據(jù)中可能存在工作秘密和個人隱私等敏感信息,故發(fā)布之前要對這些數(shù)據(jù)進行處理,如何保證所發(fā)布的數(shù)據(jù)既有較高的可用性又能保證這些敏感信息不被泄露就變得至關(guān)重要。本文首先闡述了數(shù)據(jù)發(fā)布中隱私保護的研究背景和研究現(xiàn)狀,詳細介紹了攻擊者獲取用戶信息的攻擊形式和匿名模型的實現(xiàn)技術(shù);其次,在單敏感屬性隱私保護方面,深入研究了K-Anonymity和L-Diversity模型,并針對兩種模型均無法抵御背景知識攻擊和相似性攻擊,提出面向分類型敏感屬性difsimt),,(分級匿名算法,該算法對敏感屬性的現(xiàn)實意義進行語義分析,將敏感屬性相互之間的相似程度進行量化,根據(jù)量化值來實現(xiàn)對敏感屬性值的劃分,最終使等價類中屬性值存在語義相似性增大的同時存在語義差異性;再次,在多敏感屬性隱私保護方面,本文對多維桶分組技術(shù)(MSB)及其提出的三種算法進行深入研究,針對MSB技術(shù)在敏感屬性增多時會出現(xiàn)匿名數(shù)據(jù)信息損失率較大、數(shù)據(jù)隱匿率較高等情況,提出了一種改進的MBF高效算法,即最大選擇度桶優(yōu)先算法(Maximum Selectivity Bucket First),該方法將原始數(shù)據(jù)表分為一個準(zhǔn)標(biāo)識符表和若干以敏感屬性相關(guān)性劃分而成的敏感屬性子表,多個子表之間使用組內(nèi)ID進行連接,這樣降低了敏感屬性的維數(shù),該算法可以顯著降低匿名率,能更好保護用戶的敏感信息;最后,通過實驗驗證這兩種算法的有效性,相對于傳統(tǒng)經(jīng)典算法,這兩種算法均以犧牲少量的時間消耗為代價來更高層次地保護用戶的敏感屬性信息。
【學(xué)位授予單位】:貴州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP309
,
本文編號:1337595
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1337595.html
最近更新
教材專著