數(shù)據(jù)交易中的關(guān)系型數(shù)據(jù)隱私保護(hù)研究
發(fā)布時(shí)間:2021-01-14 02:57
數(shù)據(jù)交易是打破信息孤島及行業(yè)信息壁壘,實(shí)現(xiàn)數(shù)據(jù)價(jià)值最大化的新興產(chǎn)業(yè)。在數(shù)據(jù)交易過(guò)程中,數(shù)據(jù)常以免費(fèi)公布或交易給買(mǎi)方的形式被發(fā)布出去,而發(fā)布的數(shù)據(jù)中包含著大量的個(gè)人信息。攻擊者可以根據(jù)這些個(gè)人信息,以數(shù)據(jù)挖掘技術(shù)手段進(jìn)行信息分析,從而使得個(gè)人隱私發(fā)生泄漏進(jìn)而造成經(jīng)濟(jì)損失和人身傷害等問(wèn)題。為此,如何保護(hù)數(shù)據(jù)交易中個(gè)人隱私安全已經(jīng)成為亟待解決的問(wèn)題。為了確保數(shù)據(jù)交易中的隱私安全,人們需要對(duì)數(shù)據(jù)進(jìn)行隱私完全自治處理,這是個(gè)人對(duì)數(shù)據(jù)確權(quán)的一種體現(xiàn),也是個(gè)人實(shí)現(xiàn)對(duì)隱私主動(dòng)保護(hù)的有效手段。同時(shí)在數(shù)據(jù)交易中,實(shí)時(shí)數(shù)據(jù)是一種極有價(jià)值的數(shù)據(jù),如何防止實(shí)時(shí)數(shù)據(jù)發(fā)布的隱私泄露,進(jìn)而確保數(shù)據(jù)交易安全實(shí)施也是一個(gè)重要的問(wèn)題。目前,研究者們已經(jīng)提出了大量的隱私保護(hù)方法,然而這些模型并不能有效地保護(hù)經(jīng)過(guò)完全自治處理過(guò)的數(shù)據(jù)的隱私,且對(duì)于實(shí)時(shí)發(fā)布的隱私保護(hù)亦沒(méi)有提出合理的隱私保護(hù)模型。為了保護(hù)隱私完全自治后的數(shù)據(jù)的發(fā)布安全,本論文提出了(α,ω)-匿名模型,該模型允許用戶(hù)(數(shù)據(jù)擁有者)對(duì)關(guān)系型數(shù)據(jù)的準(zhǔn)標(biāo)識(shí)符(QI)以及敏感屬性值(S)同時(shí)進(jìn)行隱私約束設(shè)置,以體現(xiàn)用戶(hù)對(duì)隱私擁有完全自治權(quán),模型中的w是QI的隱私約束,a是...
【文章來(lái)源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
(a)域概化層次結(jié)構(gòu);(b)屬性值概化層次結(jié)構(gòu)
表示為jiD D。對(duì)于給定的屬性 A,我們也表示概化,也可以表示為:nfAAAnff10101 化函數(shù)序列。根據(jù)屬性 A 的偏序關(guān)系,我們 域概化層次ADGH 和值概化層次AVGH ,如(a) (b)圖 2.1 (a)域概化層次結(jié)構(gòu); (b)屬性值概化層次結(jié)構(gòu)通常決定了屬性泛化的規(guī)則。在概化層次結(jié):數(shù)值屬性和分類(lèi)屬性。圖 2.1 顯示了數(shù)值的為分類(lèi)屬性的概化層次結(jié)構(gòu)。
定義 2.13 (信息損失度量,Information Loss):每一個(gè)匿名算法都需要一個(gè)特定的信息損失度量指標(biāo)來(lái)對(duì)信息損失進(jìn)行衡量。本論文使用的匿名化后信息損失的度量指標(biāo)為 Xu 等人提出的歸一化確定性補(bǔ)償(Normalized Certainty Penalty)。定義 2.14 (歸一化確定性補(bǔ)償,Normalized Certainty Penalty)[26]:對(duì)于某個(gè)屬性 A 上某個(gè)屬性值 x 的信息損失計(jì)算方式為:()()()IntervalAIntervalxNCPxA ,屬性 A 為數(shù)值型屬性,Interval(x)表示 x 的取值區(qū)間大小,Interval(A)表示屬性 A 的取值區(qū)間大小,在如圖 2.3 中 age 概化層次中,若 x=[1, 30]且屬性 A 表示 age,則 Interval(x)=30,Interval(A)=60, NPC(x)A=30/60,也就是說(shuō)[1, 30]在 age 屬 性 上 的 信 息 損 失 為 0.5 。 當(dāng) 屬 性 A 為 分 類(lèi) 型 屬 性 時(shí) , 則NCP( x)Sub(x)/Sub(A)Anodenode , Sub(x)node表示以 x 為根節(jié)點(diǎn)的葉節(jié)點(diǎn)數(shù), Sub(A)node表示該屬性概化層次包含的葉節(jié)點(diǎn)總數(shù),在圖 2.4 中若 x 為 individual enterprise,則 Sub(x)node=2,若屬性 A 表示有工作類(lèi)型,則 Sub(A)node=4,所以 individualenterprise 在工作類(lèi)型屬性上的信息損失為 1/2。
本文編號(hào):2976069
【文章來(lái)源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
(a)域概化層次結(jié)構(gòu);(b)屬性值概化層次結(jié)構(gòu)
表示為jiD D。對(duì)于給定的屬性 A,我們也表示概化,也可以表示為:nfAAAnff10101 化函數(shù)序列。根據(jù)屬性 A 的偏序關(guān)系,我們 域概化層次ADGH 和值概化層次AVGH ,如(a) (b)圖 2.1 (a)域概化層次結(jié)構(gòu); (b)屬性值概化層次結(jié)構(gòu)通常決定了屬性泛化的規(guī)則。在概化層次結(jié):數(shù)值屬性和分類(lèi)屬性。圖 2.1 顯示了數(shù)值的為分類(lèi)屬性的概化層次結(jié)構(gòu)。
定義 2.13 (信息損失度量,Information Loss):每一個(gè)匿名算法都需要一個(gè)特定的信息損失度量指標(biāo)來(lái)對(duì)信息損失進(jìn)行衡量。本論文使用的匿名化后信息損失的度量指標(biāo)為 Xu 等人提出的歸一化確定性補(bǔ)償(Normalized Certainty Penalty)。定義 2.14 (歸一化確定性補(bǔ)償,Normalized Certainty Penalty)[26]:對(duì)于某個(gè)屬性 A 上某個(gè)屬性值 x 的信息損失計(jì)算方式為:()()()IntervalAIntervalxNCPxA ,屬性 A 為數(shù)值型屬性,Interval(x)表示 x 的取值區(qū)間大小,Interval(A)表示屬性 A 的取值區(qū)間大小,在如圖 2.3 中 age 概化層次中,若 x=[1, 30]且屬性 A 表示 age,則 Interval(x)=30,Interval(A)=60, NPC(x)A=30/60,也就是說(shuō)[1, 30]在 age 屬 性 上 的 信 息 損 失 為 0.5 。 當(dāng) 屬 性 A 為 分 類(lèi) 型 屬 性 時(shí) , 則NCP( x)Sub(x)/Sub(A)Anodenode , Sub(x)node表示以 x 為根節(jié)點(diǎn)的葉節(jié)點(diǎn)數(shù), Sub(A)node表示該屬性概化層次包含的葉節(jié)點(diǎn)總數(shù),在圖 2.4 中若 x 為 individual enterprise,則 Sub(x)node=2,若屬性 A 表示有工作類(lèi)型,則 Sub(A)node=4,所以 individualenterprise 在工作類(lèi)型屬性上的信息損失為 1/2。
本文編號(hào):2976069
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2976069.html
最近更新
教材專(zhuān)著