天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

基于本地化差分隱私的復(fù)雜數(shù)據(jù)頻繁項集挖掘研究

發(fā)布時間:2021-06-29 08:32
  頻繁項集挖掘是一項基本的數(shù)據(jù)挖掘任務(wù),并且在關(guān)聯(lián)規(guī)則算法中也發(fā)揮著重要的作用。然而在挖掘過程很有可能將用戶的個人信息泄露,從而給用戶造成了一定的損失。近幾年,將差分隱私保護(hù)模型應(yīng)用到頻繁項集挖掘是一種較為常見且可靠的保護(hù)方式,其中大多數(shù)論文是針對中心化差分隱私提出的而較少的論文將本地化差分隱私應(yīng)用到頻繁項集挖掘。本地化差分隱私的優(yōu)勢在于用戶在客戶端先將原始數(shù)據(jù)進(jìn)行擾動,再將擾動后的數(shù)據(jù)發(fā)送給第三方服務(wù)器,這樣就可以防止第三方服務(wù)器將用戶數(shù)據(jù)泄露的問題,進(jìn)而提高用戶數(shù)據(jù)的保護(hù)程度。目前而言,還沒有一個完整的框架能夠?qū)⒈镜鼗罘蛛[私應(yīng)用于頻繁項集挖掘任務(wù)中,并且存在挖掘過程通信代價較高以及挖掘結(jié)果的精確度較低的問題。為了解決以上問題,本文提出了相對應(yīng)的解決方案:(1)提出了一個完整的將本地化差分隱私應(yīng)用于頻繁項集挖掘的方法,并且適用于用戶數(shù)據(jù)類型較為復(fù)雜的情況。該框架用戶首先將原始數(shù)據(jù)利用位圖編碼將其映射為0和1的二進(jìn)制串,針對用戶多屬性的情況提出了閾值隨機擾動(Threshold Random Response,TRR)算法實現(xiàn)了對不同的屬性選擇最佳的擾動方式使得數(shù)據(jù)的可用性最好。用戶首... 

【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁數(shù)】:62 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于本地化差分隱私的復(fù)雜數(shù)據(jù)頻繁項集挖掘研究


正態(tài)分布下隱私預(yù)算對F1-Measure的影響

泊松分布,隱私,指數(shù),算法


基于本地化差分隱私的復(fù)雜數(shù)據(jù)頻繁項集挖掘研究26(a)四種算法在指數(shù)分布下挖掘頻繁2項集(b)四種算法在指數(shù)分布下挖掘頻繁3項集圖3.3指數(shù)分布下隱私預(yù)算對F1-Measure的影響Fig.3.3EffectofprivacybudgetonF1-Measureunderexponentialdistribution圖3.4給出了本文提出的TRR算法與MRR、RR和RAPPOR算法在泊松分布下分別挖掘頻繁2項集和頻繁3項集。圖3.4(a)展示了四種算法在泊松分布下挖掘頻繁2項集以及圖3.4(b)展示了四種算法在泊松分布下挖掘頻繁3項集。從圖3.4中可以看出,TRR算法的F1-Measure值在整體上高于其他三種算法,這表明TRR算法比MRR、RR和RAPPOR算法具有更高的數(shù)據(jù)挖掘精度。但是如果細(xì)心的觀察會發(fā)現(xiàn),圖3.4(a)中隱私預(yù)算為1.5的時候RAPPOR算法稍微高于TRR算法,這種情況主要是由于隨機擾動造成的,盡管能夠保證整體上TRR優(yōu)于RAPPOR算法,但是個別的情況還是會出現(xiàn)。(a)四種算法在泊松分布下挖掘頻繁2項集(b)四種算法在泊松分布下挖掘頻繁3項集圖3.4泊松分布下隱私預(yù)算對F1-Measure的影響Fig.3.4EffectofprivacybudgetonF1-MeasureunderPoissondistribution

泊松分布,隱私,泊松分布,算法


基于本地化差分隱私的復(fù)雜數(shù)據(jù)頻繁項集挖掘研究26(a)四種算法在指數(shù)分布下挖掘頻繁2項集(b)四種算法在指數(shù)分布下挖掘頻繁3項集圖3.3指數(shù)分布下隱私預(yù)算對F1-Measure的影響Fig.3.3EffectofprivacybudgetonF1-Measureunderexponentialdistribution圖3.4給出了本文提出的TRR算法與MRR、RR和RAPPOR算法在泊松分布下分別挖掘頻繁2項集和頻繁3項集。圖3.4(a)展示了四種算法在泊松分布下挖掘頻繁2項集以及圖3.4(b)展示了四種算法在泊松分布下挖掘頻繁3項集。從圖3.4中可以看出,TRR算法的F1-Measure值在整體上高于其他三種算法,這表明TRR算法比MRR、RR和RAPPOR算法具有更高的數(shù)據(jù)挖掘精度。但是如果細(xì)心的觀察會發(fā)現(xiàn),圖3.4(a)中隱私預(yù)算為1.5的時候RAPPOR算法稍微高于TRR算法,這種情況主要是由于隨機擾動造成的,盡管能夠保證整體上TRR優(yōu)于RAPPOR算法,但是個別的情況還是會出現(xiàn)。(a)四種算法在泊松分布下挖掘頻繁2項集(b)四種算法在泊松分布下挖掘頻繁3項集圖3.4泊松分布下隱私預(yù)算對F1-Measure的影響Fig.3.4EffectofprivacybudgetonF1-MeasureunderPoissondistribution

【參考文獻(xiàn)】:
期刊論文
[1]面向隱私保護(hù)的頻繁項集挖掘算法[J]. 蔣辰,楊庚,白云璐,馬君梅.  信息網(wǎng)絡(luò)安全. 2019(04)
[2]本地化差分隱私研究綜述[J]. 葉青青,孟小峰,朱敏杰,霍崢.  軟件學(xué)報. 2018(07)
[3]挖掘關(guān)聯(lián)規(guī)則中Apriori算法的一種改進(jìn)[J]. 劉興濤,石冰,解英文.  山東大學(xué)學(xué)報(理學(xué)版). 2008(11)

碩士論文
[1]基于本地差分隱私下頻繁模式挖掘關(guān)鍵技術(shù)研究[D]. 付楠.河南財經(jīng)政法大學(xué) 2019
[2]基于差分隱私的頻繁項集挖掘算法的研究與實現(xiàn)[D]. 熊馨雨.深圳大學(xué) 2018
[3]基于事務(wù)截斷的差分隱私頻繁項集挖掘方法研究[D]. 黃雨.重慶郵電大學(xué) 2018



本文編號:3256112

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3256112.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2cd46***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com