基于差分隱私的加權(quán)p 0 模型的漸近理論
發(fā)布時(shí)間:2021-11-17 11:29
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,邊加權(quán)的有向網(wǎng)絡(luò)在日常生活和工作中普遍存在,許多學(xué)者也對(duì)其統(tǒng)計(jì)性質(zhì)做了進(jìn)一步研究。但是網(wǎng)絡(luò)圖的度序列往往會(huì)攜帶許多敏感信息,因此保護(hù)隱私數(shù)據(jù)也成為統(tǒng)計(jì)分析的一個(gè)重要問題。本文在差分隱私機(jī)制保護(hù)數(shù)據(jù)的前提下,對(duì)加權(quán)有向隨機(jī)圖建立p0模型,進(jìn)一步研究其參數(shù)性質(zhì)。本文主要研究的是差分隱私準(zhǔn)則下加權(quán)p0網(wǎng)絡(luò)模型中的統(tǒng)計(jì)推斷問題,研究結(jié)果包括:第一、由于隱私保護(hù)的對(duì)象是雙度序列,雙度序列也是加權(quán)p0模型的完全充分統(tǒng)計(jì)量,因此首先用滿足差分隱私的拉普拉斯機(jī)制釋放加噪聲的加權(quán)有向雙度序列。第二、基于差分隱私雙度序列建立矩估計(jì)方程得到加權(quán)p0模型中參數(shù)的差分隱私估計(jì)量。第三、證明差分隱私估計(jì)量的相合性,具體表述為:設(shè)q-1是網(wǎng)絡(luò)圖中邊的最大權(quán)重,θ是P0模型中的參數(shù),θ和κ是分別是隱私參數(shù)和次指數(shù)分布的參數(shù)。如果(1+4(q-1)2/θ)e12||θ*||∞=Op(n1/2/(log n)1/2),其中θ是隱私參數(shù),則當(dāng)n趨于無窮大時(shí),依概率約為1,θ的估計(jì)θ存在且滿足||θ-θ*||∞=Op(((log n)1/2/n1/2-(1+k)e6||θ*||∞)=op(1).進(jìn)一步地...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1:法國(guó)政治性博客引用關(guān)系網(wǎng)絡(luò)圖??
丨碩士學(xué)位論文??MASTER'S?THESIS??〇S??Z爹\??V\?V?/??'令??圖2:獼猴攻擊行為關(guān)系網(wǎng)絡(luò)圖??1.2網(wǎng)絡(luò)數(shù)據(jù)中的隱私保護(hù)問題??隨著大數(shù)據(jù)時(shí)代的到來,網(wǎng)絡(luò)數(shù)據(jù)在科學(xué)研究中的地位越來越高,在用算??法收集、使用用戶數(shù)據(jù)信息的過程中,難免會(huì)公布一些數(shù)據(jù)。雖然互聯(lián)網(wǎng)為我??們的生產(chǎn)生活和工作都帶來極大便利,但這些數(shù)據(jù)中可能包含一些機(jī)密或個(gè)人??之間的隱私信息,如在研宄性疾病傳播的流行病學(xué)中,就涉及了個(gè)人性伴侶數(shù)??的問題[Helleringer?and?Kohler?(2〇07)],如果這些敏感數(shù)據(jù)使用不當(dāng),就會(huì)泄露??用戶隱私,甚至威脅人們的人身財(cái)產(chǎn)安全。美國(guó)在線(AOL)為了學(xué)術(shù)研究曾??在2006年8月將65萬個(gè)用戶的匿名搜索記錄公布于眾,但是紐約時(shí)報(bào)根據(jù)匿名ID??直接找到了其中一名用戶,因此AOL遭到起訴,并受到巨額賠償。所以在我們的??日常生活和工作與計(jì)算機(jī)網(wǎng)絡(luò)的聯(lián)系更加緊密的時(shí)候,網(wǎng)絡(luò)數(shù)據(jù)分析也越來越重??視對(duì)個(gè)人隱私數(shù)據(jù)的保護(hù)。??近年來對(duì)用戶自身數(shù)據(jù)隱私的有效保護(hù)也成了各大企業(yè)越來越高度關(guān)注的??問題。如果網(wǎng)絡(luò)統(tǒng)計(jì)量(如,度)很敏感,為了確保這些信息不被泄露,數(shù)據(jù)公??開前必須對(duì)其進(jìn)行處理。解決隱私問題的一種簡(jiǎn)單方法是匿名技術(shù),也就是從??網(wǎng)絡(luò)中刪除身份標(biāo)識(shí)并釋放一個(gè)匿名同構(gòu)網(wǎng)絡(luò),但是己經(jīng)證明這種方法也會(huì)被??攻擊[例如,Backst.rom?ctal.?(2〇〇7);?Narayanan?and?Shmatikov?(2〇09)]。蘋果公司??3??
項(xiàng)士學(xué)位論文??MASTER'S?THESIS??%??圖3:獼猴競(jìng)爭(zhēng)關(guān)系網(wǎng)絡(luò)圖??在2016年將可以通過數(shù)據(jù)分析出用戶群體行為,但不能從數(shù)據(jù)中準(zhǔn)確推測(cè)單個(gè)用??戶信息的差分隱私(DP)技術(shù)應(yīng)用到IOS10中保護(hù)用戶隱私。??差分隱私能夠有效防止攻擊者利用公開數(shù)據(jù)和己有信息準(zhǔn)確推斷用戶隱私。??假如對(duì)兩個(gè)只有一條數(shù)據(jù)不同的數(shù)據(jù)集進(jìn)行查詢,得到一樣的結(jié)果的可能性非常??大,就可以有效避免差分攻擊。這是一種加入隨機(jī)性的方法,提供隱私保護(hù)最常??用的方法就是使用拉普拉斯機(jī)制丨例如,Hayetal.?(2009)],也就是將獨(dú)立同分布的??拉普拉斯變量加入到輸入數(shù)據(jù)中。拉普拉斯機(jī)制有一個(gè)很好的特性就是滿足“差??分隱私”。Dworketal.?(2006)提出了滿足差分隱私(DP)的拉普拉斯機(jī)制,也為??統(tǒng)計(jì)數(shù)據(jù)分析提供了嚴(yán)格的差分隱私定義,保證一條數(shù)據(jù)的變化不會(huì)對(duì)隨機(jī)數(shù)據(jù)??釋放機(jī)制中的輸出分布產(chǎn)生顯著影響。??這里把拉普拉斯分布作為特例,考慮噪聲變量的一般分布。我們稱變量X是??參數(shù)為k?>?OfVershynin?(2012)]的次指數(shù),如果??[E|X|p]1/p</cp,Vp>l.?(1.1)??這里假設(shè)隨機(jī)變量丨6,+丨『=1,?是相互獨(dú)立、參數(shù)均為K的次指數(shù)分布。然后??4??
本文編號(hào):3500821
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1:法國(guó)政治性博客引用關(guān)系網(wǎng)絡(luò)圖??
丨碩士學(xué)位論文??MASTER'S?THESIS??〇S??Z爹\??V\?V?/??'令??圖2:獼猴攻擊行為關(guān)系網(wǎng)絡(luò)圖??1.2網(wǎng)絡(luò)數(shù)據(jù)中的隱私保護(hù)問題??隨著大數(shù)據(jù)時(shí)代的到來,網(wǎng)絡(luò)數(shù)據(jù)在科學(xué)研究中的地位越來越高,在用算??法收集、使用用戶數(shù)據(jù)信息的過程中,難免會(huì)公布一些數(shù)據(jù)。雖然互聯(lián)網(wǎng)為我??們的生產(chǎn)生活和工作都帶來極大便利,但這些數(shù)據(jù)中可能包含一些機(jī)密或個(gè)人??之間的隱私信息,如在研宄性疾病傳播的流行病學(xué)中,就涉及了個(gè)人性伴侶數(shù)??的問題[Helleringer?and?Kohler?(2〇07)],如果這些敏感數(shù)據(jù)使用不當(dāng),就會(huì)泄露??用戶隱私,甚至威脅人們的人身財(cái)產(chǎn)安全。美國(guó)在線(AOL)為了學(xué)術(shù)研究曾??在2006年8月將65萬個(gè)用戶的匿名搜索記錄公布于眾,但是紐約時(shí)報(bào)根據(jù)匿名ID??直接找到了其中一名用戶,因此AOL遭到起訴,并受到巨額賠償。所以在我們的??日常生活和工作與計(jì)算機(jī)網(wǎng)絡(luò)的聯(lián)系更加緊密的時(shí)候,網(wǎng)絡(luò)數(shù)據(jù)分析也越來越重??視對(duì)個(gè)人隱私數(shù)據(jù)的保護(hù)。??近年來對(duì)用戶自身數(shù)據(jù)隱私的有效保護(hù)也成了各大企業(yè)越來越高度關(guān)注的??問題。如果網(wǎng)絡(luò)統(tǒng)計(jì)量(如,度)很敏感,為了確保這些信息不被泄露,數(shù)據(jù)公??開前必須對(duì)其進(jìn)行處理。解決隱私問題的一種簡(jiǎn)單方法是匿名技術(shù),也就是從??網(wǎng)絡(luò)中刪除身份標(biāo)識(shí)并釋放一個(gè)匿名同構(gòu)網(wǎng)絡(luò),但是己經(jīng)證明這種方法也會(huì)被??攻擊[例如,Backst.rom?ctal.?(2〇〇7);?Narayanan?and?Shmatikov?(2〇09)]。蘋果公司??3??
項(xiàng)士學(xué)位論文??MASTER'S?THESIS??%??圖3:獼猴競(jìng)爭(zhēng)關(guān)系網(wǎng)絡(luò)圖??在2016年將可以通過數(shù)據(jù)分析出用戶群體行為,但不能從數(shù)據(jù)中準(zhǔn)確推測(cè)單個(gè)用??戶信息的差分隱私(DP)技術(shù)應(yīng)用到IOS10中保護(hù)用戶隱私。??差分隱私能夠有效防止攻擊者利用公開數(shù)據(jù)和己有信息準(zhǔn)確推斷用戶隱私。??假如對(duì)兩個(gè)只有一條數(shù)據(jù)不同的數(shù)據(jù)集進(jìn)行查詢,得到一樣的結(jié)果的可能性非常??大,就可以有效避免差分攻擊。這是一種加入隨機(jī)性的方法,提供隱私保護(hù)最常??用的方法就是使用拉普拉斯機(jī)制丨例如,Hayetal.?(2009)],也就是將獨(dú)立同分布的??拉普拉斯變量加入到輸入數(shù)據(jù)中。拉普拉斯機(jī)制有一個(gè)很好的特性就是滿足“差??分隱私”。Dworketal.?(2006)提出了滿足差分隱私(DP)的拉普拉斯機(jī)制,也為??統(tǒng)計(jì)數(shù)據(jù)分析提供了嚴(yán)格的差分隱私定義,保證一條數(shù)據(jù)的變化不會(huì)對(duì)隨機(jī)數(shù)據(jù)??釋放機(jī)制中的輸出分布產(chǎn)生顯著影響。??這里把拉普拉斯分布作為特例,考慮噪聲變量的一般分布。我們稱變量X是??參數(shù)為k?>?OfVershynin?(2012)]的次指數(shù),如果??[E|X|p]1/p</cp,Vp>l.?(1.1)??這里假設(shè)隨機(jī)變量丨6,+丨『=1,?是相互獨(dú)立、參數(shù)均為K的次指數(shù)分布。然后??4??
本文編號(hào):3500821
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3500821.html
最近更新
教材專著