基于差分隱私的回歸分析算法研究
本文關(guān)鍵詞:基于差分隱私的回歸分析算法研究
更多相關(guān)文章: 差分隱私 線性回歸模型 邏輯回歸模型 隱私預(yù)算 模型參數(shù)
【摘要】:隨著信息技術(shù)的不斷發(fā)展,海量數(shù)據(jù)的分析和發(fā)布等應(yīng)用引發(fā)了研究熱潮,回歸分析的實際應(yīng)用也越來越廣泛,目前面臨的重要挑戰(zhàn)是如何保護回歸模型參數(shù)的隱私數(shù)據(jù),防止攻擊者根據(jù)模型參數(shù)推斷出敏感信息,造成敏感信息泄露。差分隱私作為一種新出現(xiàn)的隱私模型,不僅可以防止任意背景知識的攻擊,也可以在保護數(shù)據(jù)隱私的同時避免數(shù)據(jù)失真。針對直接發(fā)布回歸模型的模型參數(shù),會導(dǎo)致數(shù)據(jù)集中的數(shù)據(jù)信息泄露問題,本文著重把差分隱私應(yīng)用于線性回歸模型和邏輯回歸模型的分析。研究“基于差分隱私的回歸分析算法”,包括以下三個內(nèi)容:1.闡述了傳統(tǒng)的隱私模型:k-anonymity、l-diversity。通過舉例說明這兩種模型特點及缺陷,引出?-差分隱私保護,并對差分隱私的噪聲機制、組合特性、保護框架和評價指標進行了相關(guān)探討。2.在研究線性回歸模型的差分隱私保護時,通常都存在加噪后的線性回歸模型敏感性偏大和噪聲偏大,造成線性回歸模型預(yù)測精度偏低問題。針對這個問題,本文提出了一種差異化的隱私預(yù)算分配算法Diff_LR,該算法首先把目標函數(shù)分解成兩個子函數(shù),再分別計算兩個子函數(shù)的敏感性、分配合理的隱私預(yù)算,并采用拉普拉斯機制給兩個子函數(shù)系數(shù)添加噪音,然后對子函數(shù)進行組合,得到添加噪聲后的目標函數(shù),再求取最優(yōu)線性回歸模型參數(shù)。理論證明Diff_LR滿足?-差分隱私,通過實驗分析也可得出結(jié)論:相對于其他隱私保護算法,Diff-LR不僅降低了敏感性,減少噪音添加,也使線性回歸模型有更高的預(yù)測精度。3.在研究邏輯回歸模型的差分隱私保護時,針對預(yù)測精度偏低問題,本文提出了一種Diff_Gene算法。該算法結(jié)合遺傳算法原理,首先對若干候選參數(shù)的每一次迭代分配合理的、差異化的隱私預(yù)算,然后利用指數(shù)機制挑選top-k個較優(yōu)參數(shù),比較這k個參數(shù)被輸出的概率,選擇被輸出概率最大的候選參數(shù),通過不斷迭代,求出最優(yōu)邏輯回歸模型參數(shù)。實驗分析結(jié)果證明,Diff_Gene算法在模型預(yù)測精度方面比其他隱私保護算法具有更好的效果。綜上所述,本文的主要貢獻在于對線性回歸模型和邏輯回歸模型的差分隱私保護進行研究,提出新算法。新算法在保護隱私的同時,提高了回歸模型的預(yù)測精度。
【關(guān)鍵詞】:差分隱私 線性回歸模型 邏輯回歸模型 隱私預(yù)算 模型參數(shù)
【學(xué)位授予單位】:江西理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:O212.1
【目錄】:
- 摘要3-4
- Abstract4-8
- 第一章 緒論8-16
- 1.1 選題背景及意義8-10
- 1.2 研究現(xiàn)狀10-13
- 1.2.1 差分隱私發(fā)展和研究現(xiàn)狀10-12
- 1.2.2 回歸分析隱私保護的發(fā)展及研究現(xiàn)狀12-13
- 1.3 論文的主要內(nèi)容13-14
- 1.4 論文結(jié)構(gòu)14-16
- 第二章 相關(guān)技術(shù)介紹16-28
- 2.1 傳統(tǒng)的隱私保護模型16-18
- 2.1.1 k-anonymity隱私保護模型17-18
- 2.1.2 l-diversity18
- 2.2 差分隱私18-23
- 2.2.1 相關(guān)定義18-20
- 2.2.2 噪音機制20-21
- 2.2.3 差分隱私組合特性21-22
- 2.2.4 差分隱私的數(shù)據(jù)保護框架22
- 2.2.5 差分隱私的評價指標22-23
- 2.3 線性回歸分析23-24
- 2.4 邏輯回歸分析24-27
- 2.5 本章小結(jié)27-28
- 第三章 差異化隱私預(yù)算分配的線性回歸分析算法28-38
- 3.1 問題描述28-29
- 3.2 DIff_LR算法的基本思想和算法描述29-31
- 3.2.1 Diff_LR算法的基本思想29-30
- 3.2.2 DIff_LR算法描述30-31
- 3.3 Diff_LR算法的理論證明31-33
- 3.4 Diff_LR基本模塊設(shè)計33-35
- 3.4.1 添加Laplace噪聲的Noised模塊33-34
- 3.4.2 計算誤差率的模塊LinearError模塊34-35
- 3.5 Diff_LR算法的實驗分析35-37
- 3.6 本章小結(jié)37-38
- 第四章 基于差分隱私的邏輯回歸分析38-49
- 4.1 問題描述38-39
- 4.2 Diff_Gene算法思想39-40
- 4.3 算法描述40-42
- 4.4 理論證明42
- 4.5 基本模塊設(shè)計42-46
- 4.5.1 Diff_Gene模塊42-43
- 4.5.2 DPSelect模塊43-44
- 4.5.3 計算誤差率的模塊LogisticError模塊44-46
- 4.6 實驗分析46-48
- 4.7 本章小結(jié)48-49
- 第五章 結(jié)論與展望49-51
- 5.1 工作總結(jié)49
- 5.2 未來展望49-51
- 參考文獻51-55
- 致謝55-56
- 攻讀學(xué)位期間的學(xué)位成果56-57
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 孔為民;;大學(xué)圖書館與隱私保護[J];科技情報開發(fā)與經(jīng)濟;2007年26期
2 丹娜·博伊德;;為什么隱私保護沒有消失[J];科技創(chuàng)業(yè);2010年11期
3 亞倫·巴迪;;無墻之網(wǎng),隱私之危[J];科技創(chuàng)業(yè);2012年03期
4 姜文廣;孫宇清;;面向第三方服務(wù)平臺的隱私保護[J];蘭州大學(xué)學(xué)報(自然科學(xué)版);2012年04期
5 蔡紅云;田俊峰;;云計算中的數(shù)據(jù)隱私保護研究[J];山東大學(xué)學(xué)報(理學(xué)版);2014年09期
6 龍琦;;基于k-匿名的隱私保護[J];科協(xié)論壇(下半月);2010年03期
7 趙澤茂;李林;張帆;張品;周建欽;王家波;;基于分散子匿名區(qū)域的位置隱私保護方法[J];山東大學(xué)學(xué)報(理學(xué)版);2013年07期
8 徐寒冰;韓德志;;一種云計算的隱私類型閾值模型和隱私保護方法[J];數(shù)學(xué)的實踐與認識;2014年06期
9 申艷光;劉永紅;;個性;痥-匿名隱私保護方法研究[J];數(shù)學(xué)的實踐與認識;2010年11期
10 孫嵐;周浩;吳英杰;王一蕾;;基于個性化隱私需求的查詢隱私保護算法研究[J];福州大學(xué)學(xué)報(自然科學(xué)版);2013年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 鄭思琳;陳紅;葉運莉;;實習(xí)護士病人隱私保護意識和行為調(diào)查分析[A];中華護理學(xué)會第8屆全國造口、傷口、失禁護理學(xué)術(shù)交流會議、全國外科護理學(xué)術(shù)交流會議、全國神經(jīng)內(nèi)、外科護理學(xué)術(shù)交流會議論文匯編[C];2011年
2 孫通源;;基于局部聚類和雜度增益的數(shù)據(jù)信息隱私保護方法探討[A];中國水利學(xué)會2013學(xué)術(shù)年會論文集——S4水利信息化建設(shè)與管理[C];2013年
3 張亞維;朱智武;葉曉俊;;數(shù)據(jù)空間隱私保護平臺的設(shè)計[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(一)[C];2008年
4 公偉;隗玉凱;王慶升;胡鑫磊;李換雙;;美國隱私保護標準及隱私保護控制思路研究[A];2013年度標準化學(xué)術(shù)研究論文集[C];2013年
5 張鵬;于波;童云海;唐世渭;;基于隨機響應(yīng)的隱私保護關(guān)聯(lián)規(guī)則挖掘[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
6 桂瓊;程小輝;;一種隱私保護的分布式關(guān)聯(lián)規(guī)則挖掘方法[A];2009年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(下冊)[C];2009年
7 俞笛;徐向陽;解慶春;劉寅;;基于保序加密的隱私保護挖掘算法[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會湖南省計算機學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年
8 李貝貝;樂嘉錦;;分布式環(huán)境下的隱私保護關(guān)聯(lián)規(guī)則挖掘[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2005年
9 徐振龍;郭崇慧;;隱私保護數(shù)據(jù)挖掘研究的簡要綜述[A];第七屆(2012)中國管理學(xué)年會商務(wù)智能分會場論文集(選編)[C];2012年
10 潘曉;郝興;孟小峰;;基于位置服務(wù)中的連續(xù)查詢隱私保護研究[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 記者 李舒瑜;更關(guān)注隱私保護和人格尊重[N];深圳特區(qū)報;2011年
2 荷蘭鹿特丹醫(yī)學(xué)中心博士 吳舟橋;荷蘭人的隱私[N];東方早報;2012年
3 本報記者 周靜;私密社交應(yīng)用風(fēng)潮來襲 聚焦小眾隱私保護是關(guān)鍵[N];通信信息報;2013年
4 獨立分析師 陳志剛;隱私管理應(yīng)歸個人[N];通信產(chǎn)業(yè)報;2013年
5 本報記者 朱寧寧;商業(yè)利益與隱私保護需立法平衡[N];法制日報;2014年
6 袁元;手機隱私保護萌發(fā)商機[N];證券日報;2014年
7 王爾山;跟隱私說再見[N];21世紀經(jīng)濟報道;2008年
8 記者 武曉黎;360安全瀏覽器推“隱私瀏覽”模式[N];中國消費者報;2008年
9 早報記者 是冬冬;“美國隱私保護法律已過時”[N];東方早報;2012年
10 張曉明;隱私的兩難[N];電腦報;2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 孟祥旭;基于位置的移動信息服務(wù)技術(shù)與應(yīng)用研究[D];國防科學(xué)技術(shù)大學(xué);2013年
2 蘭麗輝;基于向量模型的加權(quán)社會網(wǎng)絡(luò)發(fā)布隱私保護方法研究[D];江蘇大學(xué);2015年
3 柯昌博;云服務(wù)組合隱私分析與保護方法研究[D];南京航空航天大學(xué);2014年
4 李敏;基于位置服務(wù)的隱私保護研究[D];電子科技大學(xué);2014年
5 陳東;信息物理融合系統(tǒng)安全與隱私保護關(guān)鍵技術(shù)研究[D];東北大學(xué);2014年
6 張柯麗;信譽系統(tǒng)安全和隱私保護機制的研究[D];北京郵電大學(xué);2015年
7 Kamenyi Domenic Mutiria;[D];電子科技大學(xué);2014年
8 孫崇敬;面向?qū)傩耘c關(guān)系的隱私保護數(shù)據(jù)挖掘理論研究[D];電子科技大學(xué);2014年
9 劉向宇;面向社會網(wǎng)絡(luò)的隱私保護關(guān)鍵技術(shù)研究[D];東北大學(xué);2014年
10 高勝;移動感知計算中位置和軌跡隱私保護研究[D];西安電子科技大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 鄒朝斌;SNS用戶隱私感知與自我表露行為的關(guān)系研究[D];西南大學(xué);2015年
2 李汶龍;大數(shù)據(jù)時代的隱私保護與被遺忘權(quán)[D];中國政法大學(xué);2015年
3 孫琪;基于位置服務(wù)的連續(xù)查詢隱私保護研究[D];湖南工業(yè)大學(xué);2015年
4 尹惠;無線傳感器網(wǎng)絡(luò)數(shù)據(jù)融合隱私保護技術(shù)研究[D];西南交通大學(xué);2015年
5 王鵬飛;位置服務(wù)中的隱私保護技術(shù)研究[D];南京理工大學(xué);2015年
6 顧鋮;基于關(guān)聯(lián)規(guī)則的隱私保護算法研究[D];南京理工大學(xué);2015年
7 崔堯;基于匿名方案的位置隱私保護技術(shù)研究[D];西安工業(yè)大學(xué);2015年
8 畢開圓;社會網(wǎng)絡(luò)中用戶身份隱私保護模型的研究[D];大連海事大學(xué);2015年
9 黃奚芳;基于差分隱私保護的集值型數(shù)據(jù)發(fā)布技術(shù)研究[D];江西理工大學(xué);2015年
10 高超;具有隱私保護意識的大樣本雙盲隨機對照試驗數(shù)據(jù)管理系統(tǒng)的設(shè)計與實現(xiàn)[D];山東大學(xué);2015年
,本文編號:957570
本文鏈接:http://sikaile.net/kejilunwen/yysx/957570.html