差分隱私保護(hù)分類及推薦算法研究
發(fā)布時(shí)間:2022-01-11 02:38
當(dāng)今是數(shù)據(jù)爆炸的時(shí)代,網(wǎng)絡(luò)技術(shù)、傳感技術(shù)、存儲(chǔ)技術(shù)等方面的迅猛發(fā)展使得海量數(shù)據(jù)的采集與獲取前所未有的容易,極大地促進(jìn)了數(shù)據(jù)挖掘技術(shù)的發(fā)展。研究機(jī)構(gòu)、商業(yè)組織,甚至個(gè)人都可以輕易地利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)數(shù)據(jù)中的知識(shí)。然而,數(shù)據(jù)的不當(dāng)使用往往會(huì)帶來(lái)嚴(yán)重的隱私泄露問(wèn)題,引起法律爭(zhēng)端與道德?tīng)?zhēng)議,同時(shí)也使數(shù)據(jù)的共享受到了限制,阻礙了數(shù)據(jù)挖掘技術(shù)的發(fā)展。近年來(lái),數(shù)據(jù)挖掘中的隱私保護(hù)問(wèn)題成為一個(gè)研究熱點(diǎn)。隱私保護(hù)數(shù)據(jù)挖掘的核心任務(wù)在于設(shè)計(jì)數(shù)據(jù)挖掘模型,使其能夠在保證數(shù)據(jù)隱私的前提下,不至于過(guò)多地犧牲模型的準(zhǔn)確率,即尋求算法隱私性與準(zhǔn)確性的平衡。本文對(duì)現(xiàn)有隱私保護(hù)技術(shù)進(jìn)行了綜述及歸納分析。介紹了主流的隱私保護(hù)技術(shù),包括基于數(shù)據(jù)加密的技術(shù)、基于匿名化的技術(shù),和基于數(shù)據(jù)擾動(dòng)的技術(shù),并針對(duì)其實(shí)現(xiàn)手段和主要特點(diǎn)對(duì)這幾種技術(shù)做了對(duì)比分析。特別地,針對(duì)傳統(tǒng)數(shù)據(jù)挖掘應(yīng)用中的隱私泄露問(wèn)題,本文引入了先進(jìn)的差分隱私保護(hù)模型。差分隱私提供了不依賴于攻擊者背景知識(shí)的魯棒設(shè)計(jì),并且提供了嚴(yán)格的數(shù)學(xué)證明,能夠有效保證數(shù)據(jù)挖掘過(guò)程中的數(shù)據(jù)隱私。在本文涉及的分類及推薦算法中,研究了差分隱私應(yīng)用于相應(yīng)數(shù)據(jù)挖掘應(yīng)用的實(shí)現(xiàn)機(jī)制和設(shè)計(jì)重點(diǎn),...
【文章來(lái)源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:118 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.2差分隱私保護(hù)原理示意圖??差分隱私提供了魯棒且可證明的隱私保護(hù)模型
足?丨??I?'?隱私預(yù)算劃分?非^^權(quán)威標(biāo)記與標(biāo)記候?樣ft?拓與找勁掘1丨??丨丨?策略冊(cè)?鮮習(xí)?選與廳評(píng)價(jià)?隨機(jī)謎麵與擾動(dòng)丨丨??II?|1??I?i構(gòu)建隱私保護(hù)單樹(shù)集?指數(shù)機(jī)制擾動(dòng)候選?輸出擾動(dòng)以實(shí)現(xiàn)??,成,提升模型性能?輸出概率?高斯機(jī)制?…??II?II??1?I????'???????.?j?I??I?分類?分類?推薦?I??I?y?+?+|??|?|?差分隱私隱私分類及推薦算法研宄?|?1??I?j??圖1.3本文研究?jī)?nèi)容邏輯結(jié)構(gòu)圖??1.4.2論文組織結(jié)構(gòu)??本論文采用理論研究與實(shí)驗(yàn)驗(yàn)證相結(jié)合的方法,對(duì)隱私保護(hù)技術(shù)手段進(jìn)行總結(jié)與分??析,闡明了在數(shù)據(jù)挖掘領(lǐng)域,各種隱私保護(hù)技術(shù)的優(yōu)缺點(diǎn)。并在此基礎(chǔ)上,將差分隱私??保護(hù)理論應(yīng)用于傳統(tǒng)數(shù)據(jù)挖掘應(yīng)用中。對(duì)于提出的算法,設(shè)計(jì)大量實(shí)驗(yàn),驗(yàn)證了算法在??平衡隱私性與準(zhǔn)確性上的有效性。本文實(shí)驗(yàn)所釆用的數(shù)據(jù)集大部分為公開(kāi)數(shù)據(jù)集。此外,??在基于直推支持向量機(jī)的分類算法中,在隨機(jī)生成的人工數(shù)據(jù)集上觀察數(shù)據(jù)維度和參數(shù)??設(shè)置的對(duì)模型準(zhǔn)確率的影響。本文一共包括六個(gè)章節(jié),每章的具體研究?jī)?nèi)容如下:??第一章為引言,首先闡述了本文的選題背景,介紹了隱私的定義,以及一些常見(jiàn)的??攻擊方法。列舉了幾項(xiàng)比較著名的隱私泄露事件,闡述了在數(shù)據(jù)應(yīng)用中保護(hù)隱私的重要??性。此外,本章探討了隱私保護(hù)數(shù)據(jù)挖掘的研究背景以及國(guó)內(nèi)外現(xiàn)狀,提出了本文的研??究范圍以及擬解決的問(wèn)題。??第二章綜述了主流的隱私保護(hù)技術(shù),包括基于數(shù)據(jù)加密的技術(shù)、基于匿名化的技術(shù)??和基于數(shù)據(jù)擾動(dòng)的技術(shù),并針對(duì)其實(shí)現(xiàn)手段和主要優(yōu)缺點(diǎn)對(duì)這幾種技術(shù)做了對(duì)比分析,??
境中,如同態(tài)加密(Homomorphic?encryption?)和安全多方計(jì)算??(Secure?Multiparty?Computation?)〇在基于數(shù)據(jù)加密的隱私保護(hù)方法中,通過(guò)加密機(jī)制??實(shí)現(xiàn)了他方對(duì)原始數(shù)據(jù)的不可見(jiàn)性以及數(shù)據(jù)的無(wú)損失性,從而既保證了數(shù)據(jù)的機(jī)密性,??又保證了數(shù)據(jù)的可用性。??同態(tài)加密是基于計(jì)算復(fù)雜性理論的密碼學(xué)技術(shù)1461。冋態(tài)性保證對(duì)經(jīng)過(guò)同態(tài)加密的??密文進(jìn)行運(yùn)算,與直接對(duì)未加密原始數(shù)據(jù)進(jìn)行運(yùn)算的結(jié)果是一致的?伤阉骷用苁菑V義??數(shù)據(jù)挖掘應(yīng)用的一個(gè)子集。圖2.1給出了一個(gè)云環(huán)境下可搜索加密框架,數(shù)據(jù)經(jīng)過(guò)加密??上傳至云服務(wù)器,數(shù)據(jù)使用者通過(guò)一些同態(tài)加密運(yùn)算對(duì)數(shù)據(jù)記錄進(jìn)行查詢并接收查詢結(jié)??果147]。由于同態(tài)加密技術(shù)的使用,保證了密文運(yùn)算結(jié)果的可用性。Khedr等實(shí)現(xiàn)了??基于可搜索加密的決策樹(shù)分類算法算法,但效率不高。??a?a?aV"?^??撕有者?用;^?‘?數(shù)據(jù)查詢者??0??圖2.1利用加密技術(shù)保護(hù)數(shù)據(jù)隱私??安全多方計(jì)算是指利用加密機(jī)制形成交互計(jì)算的協(xié)議,可以實(shí)現(xiàn)無(wú)信息泄露的分布??式安全計(jì)算。一組參與者希望共同計(jì)算某個(gè)約定的函數(shù),每個(gè)參與者提供函數(shù)的一個(gè)輸??13??
【參考文獻(xiàn)】:
期刊論文
[1]基于聚類匿名化的差分隱私保護(hù)數(shù)據(jù)發(fā)布方法[J]. 劉曉遷,李千目. 通信學(xué)報(bào). 2016(05)
[2]面向數(shù)據(jù)發(fā)布和分析的差分隱私保護(hù)[J]. 張嘯劍,孟小峰. 計(jì)算機(jī)學(xué)報(bào). 2014(04)
[3]差分隱私保護(hù)及其應(yīng)用[J]. 熊平,朱天清,王曉峰. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[4]大數(shù)據(jù)安全與隱私保護(hù)[J]. 馮登國(guó),張敏,李昊. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[5]面向數(shù)據(jù)庫(kù)應(yīng)用的隱私保護(hù)研究綜述[J]. 周水庚,李豐,陶宇飛,肖小奎. 計(jì)算機(jī)學(xué)報(bào). 2009(05)
本文編號(hào):3581917
【文章來(lái)源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:118 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.2差分隱私保護(hù)原理示意圖??差分隱私提供了魯棒且可證明的隱私保護(hù)模型
足?丨??I?'?隱私預(yù)算劃分?非^^權(quán)威標(biāo)記與標(biāo)記候?樣ft?拓與找勁掘1丨??丨丨?策略冊(cè)?鮮習(xí)?選與廳評(píng)價(jià)?隨機(jī)謎麵與擾動(dòng)丨丨??II?|1??I?i構(gòu)建隱私保護(hù)單樹(shù)集?指數(shù)機(jī)制擾動(dòng)候選?輸出擾動(dòng)以實(shí)現(xiàn)??,成,提升模型性能?輸出概率?高斯機(jī)制?…??II?II??1?I????'???????.?j?I??I?分類?分類?推薦?I??I?y?+?+|??|?|?差分隱私隱私分類及推薦算法研宄?|?1??I?j??圖1.3本文研究?jī)?nèi)容邏輯結(jié)構(gòu)圖??1.4.2論文組織結(jié)構(gòu)??本論文采用理論研究與實(shí)驗(yàn)驗(yàn)證相結(jié)合的方法,對(duì)隱私保護(hù)技術(shù)手段進(jìn)行總結(jié)與分??析,闡明了在數(shù)據(jù)挖掘領(lǐng)域,各種隱私保護(hù)技術(shù)的優(yōu)缺點(diǎn)。并在此基礎(chǔ)上,將差分隱私??保護(hù)理論應(yīng)用于傳統(tǒng)數(shù)據(jù)挖掘應(yīng)用中。對(duì)于提出的算法,設(shè)計(jì)大量實(shí)驗(yàn),驗(yàn)證了算法在??平衡隱私性與準(zhǔn)確性上的有效性。本文實(shí)驗(yàn)所釆用的數(shù)據(jù)集大部分為公開(kāi)數(shù)據(jù)集。此外,??在基于直推支持向量機(jī)的分類算法中,在隨機(jī)生成的人工數(shù)據(jù)集上觀察數(shù)據(jù)維度和參數(shù)??設(shè)置的對(duì)模型準(zhǔn)確率的影響。本文一共包括六個(gè)章節(jié),每章的具體研究?jī)?nèi)容如下:??第一章為引言,首先闡述了本文的選題背景,介紹了隱私的定義,以及一些常見(jiàn)的??攻擊方法。列舉了幾項(xiàng)比較著名的隱私泄露事件,闡述了在數(shù)據(jù)應(yīng)用中保護(hù)隱私的重要??性。此外,本章探討了隱私保護(hù)數(shù)據(jù)挖掘的研究背景以及國(guó)內(nèi)外現(xiàn)狀,提出了本文的研??究范圍以及擬解決的問(wèn)題。??第二章綜述了主流的隱私保護(hù)技術(shù),包括基于數(shù)據(jù)加密的技術(shù)、基于匿名化的技術(shù)??和基于數(shù)據(jù)擾動(dòng)的技術(shù),并針對(duì)其實(shí)現(xiàn)手段和主要優(yōu)缺點(diǎn)對(duì)這幾種技術(shù)做了對(duì)比分析,??
境中,如同態(tài)加密(Homomorphic?encryption?)和安全多方計(jì)算??(Secure?Multiparty?Computation?)〇在基于數(shù)據(jù)加密的隱私保護(hù)方法中,通過(guò)加密機(jī)制??實(shí)現(xiàn)了他方對(duì)原始數(shù)據(jù)的不可見(jiàn)性以及數(shù)據(jù)的無(wú)損失性,從而既保證了數(shù)據(jù)的機(jī)密性,??又保證了數(shù)據(jù)的可用性。??同態(tài)加密是基于計(jì)算復(fù)雜性理論的密碼學(xué)技術(shù)1461。冋態(tài)性保證對(duì)經(jīng)過(guò)同態(tài)加密的??密文進(jìn)行運(yùn)算,與直接對(duì)未加密原始數(shù)據(jù)進(jìn)行運(yùn)算的結(jié)果是一致的?伤阉骷用苁菑V義??數(shù)據(jù)挖掘應(yīng)用的一個(gè)子集。圖2.1給出了一個(gè)云環(huán)境下可搜索加密框架,數(shù)據(jù)經(jīng)過(guò)加密??上傳至云服務(wù)器,數(shù)據(jù)使用者通過(guò)一些同態(tài)加密運(yùn)算對(duì)數(shù)據(jù)記錄進(jìn)行查詢并接收查詢結(jié)??果147]。由于同態(tài)加密技術(shù)的使用,保證了密文運(yùn)算結(jié)果的可用性。Khedr等實(shí)現(xiàn)了??基于可搜索加密的決策樹(shù)分類算法算法,但效率不高。??a?a?aV"?^??撕有者?用;^?‘?數(shù)據(jù)查詢者??0??圖2.1利用加密技術(shù)保護(hù)數(shù)據(jù)隱私??安全多方計(jì)算是指利用加密機(jī)制形成交互計(jì)算的協(xié)議,可以實(shí)現(xiàn)無(wú)信息泄露的分布??式安全計(jì)算。一組參與者希望共同計(jì)算某個(gè)約定的函數(shù),每個(gè)參與者提供函數(shù)的一個(gè)輸??13??
【參考文獻(xiàn)】:
期刊論文
[1]基于聚類匿名化的差分隱私保護(hù)數(shù)據(jù)發(fā)布方法[J]. 劉曉遷,李千目. 通信學(xué)報(bào). 2016(05)
[2]面向數(shù)據(jù)發(fā)布和分析的差分隱私保護(hù)[J]. 張嘯劍,孟小峰. 計(jì)算機(jī)學(xué)報(bào). 2014(04)
[3]差分隱私保護(hù)及其應(yīng)用[J]. 熊平,朱天清,王曉峰. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[4]大數(shù)據(jù)安全與隱私保護(hù)[J]. 馮登國(guó),張敏,李昊. 計(jì)算機(jī)學(xué)報(bào). 2014(01)
[5]面向數(shù)據(jù)庫(kù)應(yīng)用的隱私保護(hù)研究綜述[J]. 周水庚,李豐,陶宇飛,肖小奎. 計(jì)算機(jī)學(xué)報(bào). 2009(05)
本文編號(hào):3581917
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3581917.html
最近更新
教材專著