眾包平臺(tái)下基于差分隱私的激勵(lì)機(jī)制和數(shù)據(jù)分析方法研究
發(fā)布時(shí)間:2021-12-09 04:13
眾包的概念被提出以來就日益受到學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,隨著互聯(lián)網(wǎng)技術(shù)和移動(dòng)智能設(shè)備的蓬勃發(fā)展,眾包任務(wù)的執(zhí)行也變得更加高效。但是,隨著眾包模式的廣泛應(yīng)用,隱私問題也隨之而來,人們在執(zhí)行眾包任務(wù)時(shí)不希望透露過多的個(gè)人信息。概括來說,眾包系統(tǒng)中隱私問題主要存在于以下兩方面:一方面,在基于反向拍賣的激勵(lì)機(jī)制中存在著披露眾包工作者競標(biāo)信息的風(fēng)險(xiǎn);另一方面,利用眾包工作者提供的數(shù)據(jù)進(jìn)行預(yù)測模型訓(xùn)練的階段可能會(huì)泄露工作者的個(gè)人隱私。針對眾包場景下的隱私泄露問題,本文的主要貢獻(xiàn)如下:針對基于反向拍賣的激勵(lì)機(jī)制中眾包工作者競標(biāo)信息泄露問題,本文提出了一種基于差分隱私的激勵(lì)機(jī)制,簡稱DP-mp RA。在工作者上傳自己的競標(biāo)信息后,平臺(tái)確定支付的價(jià)格集合,對于集合中的每一個(gè)價(jià)格,在滿足數(shù)據(jù)聚集后誤差閾值的限制條件下,選出獲勝者集合。應(yīng)用差分隱私的指數(shù)機(jī)制,以一定的概率選出最終獲勝者集合。最后,根據(jù)每個(gè)工作者的評級進(jìn)行差異化付款,進(jìn)一步減少平臺(tái)付款總額。經(jīng)過理論證明,DP-mp RA滿足差分隱私保護(hù),同時(shí)也滿足真實(shí)性和個(gè)人理性。通過實(shí)驗(yàn)仿真表明在保證相同隱私級別的前提下,DP-mp RA機(jī)制得到的平臺(tái)付款...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于反向拍賣的眾包系統(tǒng)
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第二章相關(guān)背景知識介紹12圖2.2差分隱私機(jī)制圖解差分隱私具備幾個(gè)重要的屬性,例如可組合性、魯棒性等等?山M合性實(shí)現(xiàn)了差分隱私機(jī)制的模塊化設(shè)計(jì):如果機(jī)制的所有組件都服從差分隱私的,那么它們的組合也服從差分隱私;魯棒性意味著差分隱私將不會(huì)受對手任何可用的輔助信息的影響。這些在本文的場景中非常有用。實(shí)現(xiàn)-差分隱私的通用方法有兩種,拉普拉斯機(jī)制和指數(shù)機(jī)制。下面我們將重點(diǎn)介紹下這兩種機(jī)制。2.2.1拉普拉斯機(jī)制拉普拉斯機(jī)制是實(shí)現(xiàn)差分隱私保護(hù)的一種方式,這種機(jī)制僅適用于查詢結(jié)果為數(shù)值型數(shù)據(jù)的場景。在介紹拉普拉斯機(jī)制之前,先引入一個(gè)基本概念:全局敏感度GSx。定義2-8(全局敏感度):對于任意一個(gè)查詢函數(shù)::→z,其中是一個(gè)給定的數(shù)據(jù)集,z為 維實(shí)數(shù)向量,是查詢函數(shù)的返回結(jié)果,在任意一對相鄰數(shù)據(jù)集和k,全局敏感度定義為: x=∥k∥; (2.5)中∥(k)∥;表示 和(k)之間的曼哈頓(Manhattan)距離。全局敏感度反應(yīng)了一個(gè)查詢函數(shù)在一對相鄰數(shù)據(jù)集上查詢變化的最大范圍。一些函數(shù)的全局敏感度較小,那只需要加入少量的噪聲,就可以掩蓋一條記錄的刪除對查詢結(jié)果的影響,最終實(shí)現(xiàn)差分隱私保護(hù),若函數(shù)具有較大的全局敏感度(如平均值),必須在函數(shù)輸出時(shí)添加足夠大的噪聲才能保證隱私的安全。
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第二章相關(guān)背景知識介紹13定義2-9(拉普拉斯機(jī)制):對于一個(gè)查詢函數(shù):→z,GSx表示查詢函數(shù)的全局敏感度,如果隨機(jī)算法滿足:=+,則A滿足差分隱私保護(hù),特別說明,的概率密度為:= 2xx2.6即服從均值為0,尺度參數(shù)λ為x/的拉普拉斯分布。從公式2.6中可以看到添加的噪聲量和全局敏感度GSx成正比,和隱私預(yù)算成反比。圖2.3給出了拉普拉斯分布圖,由下圖可以觀察到,全局敏感度GSx越大,隱私預(yù)算就越小,引入的噪聲量就越多,隱私保護(hù)的級別越高。圖2.3不同ε下的概率密度函數(shù)2.2.2指數(shù)機(jī)制由于拉普拉斯機(jī)制僅適用于數(shù)值型結(jié)果,在一些特定的場景中,往往需要返回離散型結(jié)果,例如某一方案或某一選擇。為此,McSherry等人提出了指數(shù)機(jī)制。下面給出以下定義定義2-10(可用性函數(shù)):設(shè)查詢函數(shù)的輸出對象組成值域Range,域中的每一個(gè)值∈是一個(gè)實(shí)體對象,為給定的數(shù)據(jù)集,函數(shù)q,→稱為輸出值的可用性函數(shù),用來評估輸出值的優(yōu)劣程度。設(shè);和為任意一對相鄰數(shù)據(jù)集,函數(shù)q的敏感度定義為:q=,∥;,,∥2.7
【參考文獻(xiàn)】:
期刊論文
[1]面向數(shù)據(jù)庫應(yīng)用的隱私保護(hù)研究綜述[J]. 周水庚,李豐,陶宇飛,肖小奎. 計(jì)算機(jī)學(xué)報(bào). 2009(05)
本文編號:3529896
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
基于反向拍賣的眾包系統(tǒng)
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第二章相關(guān)背景知識介紹12圖2.2差分隱私機(jī)制圖解差分隱私具備幾個(gè)重要的屬性,例如可組合性、魯棒性等等?山M合性實(shí)現(xiàn)了差分隱私機(jī)制的模塊化設(shè)計(jì):如果機(jī)制的所有組件都服從差分隱私的,那么它們的組合也服從差分隱私;魯棒性意味著差分隱私將不會(huì)受對手任何可用的輔助信息的影響。這些在本文的場景中非常有用。實(shí)現(xiàn)-差分隱私的通用方法有兩種,拉普拉斯機(jī)制和指數(shù)機(jī)制。下面我們將重點(diǎn)介紹下這兩種機(jī)制。2.2.1拉普拉斯機(jī)制拉普拉斯機(jī)制是實(shí)現(xiàn)差分隱私保護(hù)的一種方式,這種機(jī)制僅適用于查詢結(jié)果為數(shù)值型數(shù)據(jù)的場景。在介紹拉普拉斯機(jī)制之前,先引入一個(gè)基本概念:全局敏感度GSx。定義2-8(全局敏感度):對于任意一個(gè)查詢函數(shù)::→z,其中是一個(gè)給定的數(shù)據(jù)集,z為 維實(shí)數(shù)向量,是查詢函數(shù)的返回結(jié)果,在任意一對相鄰數(shù)據(jù)集和k,全局敏感度定義為: x=∥k∥; (2.5)中∥(k)∥;表示 和(k)之間的曼哈頓(Manhattan)距離。全局敏感度反應(yīng)了一個(gè)查詢函數(shù)在一對相鄰數(shù)據(jù)集上查詢變化的最大范圍。一些函數(shù)的全局敏感度較小,那只需要加入少量的噪聲,就可以掩蓋一條記錄的刪除對查詢結(jié)果的影響,最終實(shí)現(xiàn)差分隱私保護(hù),若函數(shù)具有較大的全局敏感度(如平均值),必須在函數(shù)輸出時(shí)添加足夠大的噪聲才能保證隱私的安全。
南京郵電大學(xué)專業(yè)學(xué)位碩士研究生學(xué)位論文第二章相關(guān)背景知識介紹13定義2-9(拉普拉斯機(jī)制):對于一個(gè)查詢函數(shù):→z,GSx表示查詢函數(shù)的全局敏感度,如果隨機(jī)算法滿足:=+,則A滿足差分隱私保護(hù),特別說明,的概率密度為:= 2xx2.6即服從均值為0,尺度參數(shù)λ為x/的拉普拉斯分布。從公式2.6中可以看到添加的噪聲量和全局敏感度GSx成正比,和隱私預(yù)算成反比。圖2.3給出了拉普拉斯分布圖,由下圖可以觀察到,全局敏感度GSx越大,隱私預(yù)算就越小,引入的噪聲量就越多,隱私保護(hù)的級別越高。圖2.3不同ε下的概率密度函數(shù)2.2.2指數(shù)機(jī)制由于拉普拉斯機(jī)制僅適用于數(shù)值型結(jié)果,在一些特定的場景中,往往需要返回離散型結(jié)果,例如某一方案或某一選擇。為此,McSherry等人提出了指數(shù)機(jī)制。下面給出以下定義定義2-10(可用性函數(shù)):設(shè)查詢函數(shù)的輸出對象組成值域Range,域中的每一個(gè)值∈是一個(gè)實(shí)體對象,為給定的數(shù)據(jù)集,函數(shù)q,→稱為輸出值的可用性函數(shù),用來評估輸出值的優(yōu)劣程度。設(shè);和為任意一對相鄰數(shù)據(jù)集,函數(shù)q的敏感度定義為:q=,∥;,,∥2.7
【參考文獻(xiàn)】:
期刊論文
[1]面向數(shù)據(jù)庫應(yīng)用的隱私保護(hù)研究綜述[J]. 周水庚,李豐,陶宇飛,肖小奎. 計(jì)算機(jī)學(xué)報(bào). 2009(05)
本文編號:3529896
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3529896.html
最近更新
教材專著