天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于差分隱私的隨機森林算法研究

發(fā)布時間:2021-04-08 07:56
  近年來互聯(lián)網(wǎng)和通信技術(shù)的發(fā)展極大地促進了大數(shù)據(jù)和數(shù)據(jù)挖掘技術(shù)的成熟。隨機森林作為數(shù)據(jù)挖掘中常用的分類算法,被廣泛應(yīng)用到各個領(lǐng)域,支撐各研究機構(gòu)、商業(yè)組織、醫(yī)療機構(gòu)等進行數(shù)據(jù)的挖掘與分析。然而,在挖掘與分析過程中,不正確使用數(shù)據(jù)經(jīng)常導(dǎo)致隱私泄露問題,為此很多機構(gòu)和個人不愿意提供更多的信息,不僅限制了數(shù)據(jù)共享的進展,還嚴重阻礙了數(shù)據(jù)挖掘技術(shù)的發(fā)展。圍繞分類算法設(shè)計相應(yīng)的隱私保護策略并為待分類數(shù)據(jù)提供隱私保護,已成為當(dāng)前數(shù)據(jù)挖掘技術(shù)迫切需要解決的問題。相較于傳統(tǒng)隱私保護技術(shù),差分隱私技術(shù)對于隱私保護的定義更加嚴格。它給出了一種極其嚴格的攻擊模式,在該模式下攻擊者能掌握最大的背景知識,差分隱私保護機制通過向原始數(shù)據(jù)集或其統(tǒng)計信息中添加噪音來提供隱私保護。本文提出了基于差分隱私的隨機森林算法,用于保護數(shù)據(jù)分類過程中涉及的用戶敏感信息,論文研究工作可歸納為以下幾點:(1)差分隱私通過增加擾動噪聲來提供隱私保護,這將導(dǎo)致隨機森林算法分類準(zhǔn)確率下降。為了減弱差分隱私保護對隨機森林分類精度的影響,提出了一種混合決策樹算法。對于隨機森林中單個決策樹的構(gòu)建,綜合ID3算法中的信息增益與C4.5算法中的信息增... 

【文章來源】:南京理工大學(xué)江蘇省 211工程院校

【文章頁數(shù)】:69 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于差分隱私的隨機森林算法研究


Laplace概率密度函數(shù)在很多的實際應(yīng)用中,數(shù)據(jù)查詢結(jié)果往往是方案或者選擇項,而不是具體的數(shù)值,此時Laplace機制不再適用,因此McSherry等提出了基于隨機響應(yīng)的指數(shù)機制[82]

決策樹,數(shù)據(jù)集,算法,取值


3隨機森林中決策樹算法改進碩士學(xué)位論文32(a)混合決策樹與ID3、C4.5、CART分類結(jié)果對比圖(b)混合決策樹分類準(zhǔn)確率隨1變化示意圖圖3.1Adult數(shù)據(jù)集上1取值對決策樹算法的影響圖3.1(a)中,ID3、C4.5、CART算法的分類準(zhǔn)確率不隨1的變化改變;當(dāng)1=0時,此時混合決策樹就是C4.5算法,所以此時混合決策樹與C4.5分類準(zhǔn)確率相同;當(dāng)1=1時,此時混合決策樹就是ID3,所以此時混合決策樹和ID3具有一樣的分類準(zhǔn)確率;當(dāng)10.10.9N時,混合決策樹分類準(zhǔn)確率高于另外3類算法。從圖3.1(b)能夠看出,在

影響圖,隱私,數(shù)據(jù)集,準(zhǔn)確度


碩士學(xué)位論文基于差分隱私的隨機森林算法研究47量,隱私保護預(yù)算越小,則算法的隱私性越強,但算法的分類準(zhǔn)確率也會相應(yīng)的下降。本實驗主要通過在0-1之間調(diào)整隱私保護預(yù)算的值,來觀察不同程度的隱私保護算法的分類準(zhǔn)確率,在數(shù)據(jù)集Adult和Mushroom上的實驗結(jié)果分別如圖4.3和圖4.4所示。圖4.3Adult數(shù)據(jù)集上隱私保護預(yù)算對分類準(zhǔn)確度的影響圖4.4Mushroom數(shù)據(jù)集上隱私保護預(yù)算對分類準(zhǔn)確度的影響

【參考文獻】:
期刊論文
[1]不完全數(shù)據(jù)集的差分隱私保護決策樹研究[J]. 沈思倩,毛宇光,江冠儒.  計算機科學(xué). 2017(06)
[2]基于線性回歸和屬性集成的分類算法[J]. 強保華,唐波,王玉峰,鄒顯春,柳正利,孫忠旭,謝武.  計算機科學(xué). 2017(06)
[3]DiffPRFs:一種面向隨機森林的差分隱私保護算法[J]. 穆海蓉,丁麗萍,宋宇寧,盧國慶.  通信學(xué)報. 2016(09)
[4]面向大數(shù)據(jù)分析的決策樹算法[J]. 張棪,曹健.  計算機科學(xué). 2016(S1)
[5]主成分分析方法綜述[J]. 趙薔.  軟件工程. 2016(06)
[6]MapReduce框架下支持差分隱私保護的k-means聚類方法[J]. 李洪成,吳曉平,陳燕.  通信學(xué)報. 2016(02)
[7]2015年度國際網(wǎng)絡(luò)安全重大事故 攻擊、漏洞無處不在,數(shù)據(jù)安全 危在旦夕[J]. 柒月.  信息安全與通信保密. 2016(02)
[8]決策樹C4.5算法的優(yōu)化與應(yīng)用[J]. 苗煜飛,張霄宏.  計算機工程與應(yīng)用. 2015(13)
[9]面向頻繁模式挖掘的差分隱私保護研究綜述[J]. 丁麗萍,盧國慶.  通信學(xué)報. 2014(10)
[10]差分隱私保護及其應(yīng)用[J]. 熊平,朱天清,王曉峰.  計算機學(xué)報. 2014(01)

博士論文
[1]面向?qū)傩耘c關(guān)系的隱私保護數(shù)據(jù)挖掘理論研究[D]. 孫崇敬.電子科技大學(xué) 2014
[2]數(shù)據(jù)流集成分類器算法研究[D]. 楊顯飛.哈爾濱工程大學(xué) 2011

碩士論文
[1]樸素貝葉斯分類器的研究與改進[D]. 周艷.廈門大學(xué) 2017
[2]基于層次結(jié)構(gòu)的社會網(wǎng)絡(luò)差分隱私圖發(fā)布研究[D]. 王旭然.南京郵電大學(xué) 2016
[3]醫(yī)療保險欺詐檢測的研究與應(yīng)用[D]. 郭濤.電子科技大學(xué) 2016
[4]基于差分隱私的特征選擇研究[D]. 楊軍.南京郵電大學(xué) 2015
[5]基于GBDT的社區(qū)問題標(biāo)簽推薦技術(shù)研究[D]. 孫萬龍.哈爾濱工業(yè)大學(xué) 2015
[6]基于Hadoop的數(shù)據(jù)挖掘算法并行化研究[D]. 趙偉.西南交通大學(xué) 2015
[7]負調(diào)查的相關(guān)方法及應(yīng)用研究[D]. 魯義輝.中國科學(xué)技術(shù)大學(xué) 2015
[8]網(wǎng)絡(luò)安全態(tài)勢分析與預(yù)測方法研究[D]. 王一村.北京交通大學(xué) 2015
[9]基于聚類的數(shù)據(jù)匿名發(fā)布技術(shù)研究[D]. 劉盼盼.西安電子科技大學(xué) 2013
[10]基于數(shù)據(jù)集動態(tài)更新的隱私保護算法[D]. 李濤.哈爾濱工程大學(xué) 2013



本文編號:3125173

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3125173.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e0d66***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com