基于熵分類的個(gè)性化隱私匿名方法
發(fā)布時(shí)間:2020-06-23 16:46
【摘要】:針對(duì)傳統(tǒng)(α,k)-匿名模型不能滿足敏感屬性值之間不同隱私保護(hù)程度個(gè)性化需求的問題,引入敏感屬性值個(gè)性隱私敏感因子和個(gè)性隱私保護(hù)需求度的概念,進(jìn)而形式化地定義了個(gè)性化(α,k)-匿名模型;同時(shí),還提出了一種基于熵分類的個(gè)性化隱私匿名方法來實(shí)現(xiàn)個(gè)性化(α,k)-匿名模型。實(shí)驗(yàn)表明:該方法不僅能獲得與現(xiàn)有(α,k)-匿名算法近似的信息損失度和時(shí)間代價(jià),同時(shí)也滿足了個(gè)性化服務(wù)的需求,獲得更合理的隱私保護(hù)。
【圖文】:
度也同樣需要加強(qiáng),從而引起數(shù)據(jù)集的信息損失度增大。圖2是k為6,數(shù)據(jù)集記錄數(shù)|T|=45222時(shí),3種算法隨準(zhǔn)標(biāo)識(shí)符個(gè)數(shù)|QI|變化時(shí)的信息損失度比較,由圖2可知:3種算法的信息損失度都會(huì)隨著準(zhǔn)標(biāo)識(shí)符數(shù)|QI|的增多而增加,因?yàn)楫?dāng)準(zhǔn)標(biāo)識(shí)符數(shù)|QI|增多時(shí),表明每個(gè)元組的需要泛化的屬性個(gè)數(shù)增加了,顯然會(huì)引起信息損失度增大。圖3給出了準(zhǔn)標(biāo)識(shí)符個(gè)數(shù)|QI|=8,k為6時(shí),各算法信息損失度隨數(shù)據(jù)集記錄數(shù)|T|變化的比較,從圖圖1|k|值變化下各算法的信息損失度比較Fig.1Informationlosscomparisonofeachalgorithmwhenkvaries圖2不同|QI|值下各算法的信息損失度比較ig.2Informationlosscomparisonofeachalgorithmwithdifferent|QI|3中可以看出,各算法在準(zhǔn)標(biāo)識(shí)符數(shù)|QI|和k值不變的情況下,信息損失度都會(huì)隨著數(shù)據(jù)集記錄數(shù)|T|的增大而增加,因?yàn)楫?dāng)數(shù)據(jù)集記錄數(shù)|T|增多時(shí),需要泛化的元組數(shù)也要增多,從而引起數(shù)·183·
方法基礎(chǔ)上,用信息損失度RTIL=TIL/|T|×100%來進(jìn)行分析比較。圖1給出了當(dāng)準(zhǔn)標(biāo)識(shí)符個(gè)數(shù)|QI|為8,數(shù)據(jù)集記錄數(shù)|T|=45222時(shí),各算法在k值變化時(shí)信息損失度的比較,其中(α,k)-匿名模型中的α值取0.4,以下的實(shí)驗(yàn)都為該值。由圖1可知:3種算法的信息損失度都會(huì)隨著k值的增加而增加,因?yàn)楫?dāng)k值增大時(shí),表明等價(jià)類中的記錄數(shù)也要求增多,使得對(duì)準(zhǔn)標(biāo)識(shí)符泛化的程度也同樣需要加強(qiáng),從而引起數(shù)據(jù)集的信息損失度增大。圖2是k為6,數(shù)據(jù)集記錄數(shù)|T|=45222時(shí),3種算法隨準(zhǔn)標(biāo)識(shí)符個(gè)數(shù)|QI|變化時(shí)的信息損失度比較,由圖2可知:3種算法的信息損失度都會(huì)隨著準(zhǔn)標(biāo)識(shí)符數(shù)|QI|的增多而增加,因?yàn)楫?dāng)準(zhǔn)標(biāo)識(shí)符數(shù)|QI|增多時(shí),表明每個(gè)元組的需要泛化的屬性個(gè)數(shù)增加了,顯然會(huì)引起信息損失度增大。圖3給出了準(zhǔn)標(biāo)識(shí)符個(gè)數(shù)|QI|=8,k為6時(shí),各算法信息損失度隨數(shù)據(jù)集記錄數(shù)|T|變化的比較,從圖圖1|k|值變化下各算法的信息損失度比較Fig.1Informationlosscomparisonofeachalgorithmwhenkvaries圖2不同|QI|值下各算法的信息損失度比較ig.2Informationlosscomparisonofeachalgorithmwithdifferent|QI|3中可以看出,各算法在準(zhǔn)標(biāo)識(shí)符數(shù)|QI|和k值不變的情況下,信息損失度都會(huì)隨著數(shù)據(jù)集記錄數(shù)|T|的增大而增加,因?yàn)楫?dāng)數(shù)據(jù)集記錄數(shù)|T|增多時(shí),需要泛化的元組數(shù)也要增多,從而
【圖文】:
度也同樣需要加強(qiáng),從而引起數(shù)據(jù)集的信息損失度增大。圖2是k為6,數(shù)據(jù)集記錄數(shù)|T|=45222時(shí),3種算法隨準(zhǔn)標(biāo)識(shí)符個(gè)數(shù)|QI|變化時(shí)的信息損失度比較,由圖2可知:3種算法的信息損失度都會(huì)隨著準(zhǔn)標(biāo)識(shí)符數(shù)|QI|的增多而增加,因?yàn)楫?dāng)準(zhǔn)標(biāo)識(shí)符數(shù)|QI|增多時(shí),表明每個(gè)元組的需要泛化的屬性個(gè)數(shù)增加了,顯然會(huì)引起信息損失度增大。圖3給出了準(zhǔn)標(biāo)識(shí)符個(gè)數(shù)|QI|=8,k為6時(shí),各算法信息損失度隨數(shù)據(jù)集記錄數(shù)|T|變化的比較,從圖圖1|k|值變化下各算法的信息損失度比較Fig.1Informationlosscomparisonofeachalgorithmwhenkvaries圖2不同|QI|值下各算法的信息損失度比較ig.2Informationlosscomparisonofeachalgorithmwithdifferent|QI|3中可以看出,各算法在準(zhǔn)標(biāo)識(shí)符數(shù)|QI|和k值不變的情況下,信息損失度都會(huì)隨著數(shù)據(jù)集記錄數(shù)|T|的增大而增加,因?yàn)楫?dāng)數(shù)據(jù)集記錄數(shù)|T|增多時(shí),需要泛化的元組數(shù)也要增多,從而引起數(shù)·183·
方法基礎(chǔ)上,用信息損失度RTIL=TIL/|T|×100%來進(jìn)行分析比較。圖1給出了當(dāng)準(zhǔn)標(biāo)識(shí)符個(gè)數(shù)|QI|為8,數(shù)據(jù)集記錄數(shù)|T|=45222時(shí),各算法在k值變化時(shí)信息損失度的比較,其中(α,k)-匿名模型中的α值取0.4,以下的實(shí)驗(yàn)都為該值。由圖1可知:3種算法的信息損失度都會(huì)隨著k值的增加而增加,因?yàn)楫?dāng)k值增大時(shí),表明等價(jià)類中的記錄數(shù)也要求增多,使得對(duì)準(zhǔn)標(biāo)識(shí)符泛化的程度也同樣需要加強(qiáng),從而引起數(shù)據(jù)集的信息損失度增大。圖2是k為6,數(shù)據(jù)集記錄數(shù)|T|=45222時(shí),3種算法隨準(zhǔn)標(biāo)識(shí)符個(gè)數(shù)|QI|變化時(shí)的信息損失度比較,由圖2可知:3種算法的信息損失度都會(huì)隨著準(zhǔn)標(biāo)識(shí)符數(shù)|QI|的增多而增加,因?yàn)楫?dāng)準(zhǔn)標(biāo)識(shí)符數(shù)|QI|增多時(shí),表明每個(gè)元組的需要泛化的屬性個(gè)數(shù)增加了,顯然會(huì)引起信息損失度增大。圖3給出了準(zhǔn)標(biāo)識(shí)符個(gè)數(shù)|QI|=8,k為6時(shí),各算法信息損失度隨數(shù)據(jù)集記錄數(shù)|T|變化的比較,從圖圖1|k|值變化下各算法的信息損失度比較Fig.1Informationlosscomparisonofeachalgorithmwhenkvaries圖2不同|QI|值下各算法的信息損失度比較ig.2Informationlosscomparisonofeachalgorithmwithdifferent|QI|3中可以看出,各算法在準(zhǔn)標(biāo)識(shí)符數(shù)|QI|和k值不變的情況下,信息損失度都會(huì)隨著數(shù)據(jù)集記錄數(shù)|T|的增大而增加,因?yàn)楫?dāng)數(shù)據(jù)集記錄數(shù)|T|增多時(shí),需要泛化的元組數(shù)也要增多,從而
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 韓建民;于娟;虞慧群;賈l
本文編號(hào):2727624
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/2727624.html
最近更新
教材專著