神經(jīng)網(wǎng)絡(luò)中的隱私保護(hù)研究
發(fā)布時(shí)間:2020-05-29 12:21
【摘要】:隨著人工智能的不斷發(fā)展,神經(jīng)網(wǎng)絡(luò)已經(jīng)在人臉識(shí)別,醫(yī)療診斷等領(lǐng)域被廣泛使用,越來越受人關(guān)注。神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和預(yù)測(cè)都需要數(shù)據(jù)的支持,然而,數(shù)據(jù)總是不可避免的包含敏感、機(jī)密的信息,因此,在神經(jīng)網(wǎng)絡(luò)給我們的生活帶來便利的同時(shí),也帶來了隱私泄露的隱患,如何利用神經(jīng)網(wǎng)絡(luò)同時(shí)又不會(huì)泄露隱私信息已經(jīng)成為一個(gè)重要的研究領(lǐng)域。本論文針對(duì)幾類典型的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):感知器、卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行隱私保護(hù)的研究。感知器是一種簡單的神經(jīng)網(wǎng)絡(luò),它雖然結(jié)構(gòu)簡單,但是可以有效地處理復(fù)雜的二分類問題,要實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的隱私保護(hù),首先要考慮的就是如何實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)基本單元——感知器的隱私保護(hù)。針對(duì)感知器的訓(xùn)練,本文提出一個(gè)基于加同態(tài)加密的隱私保護(hù)訓(xùn)練協(xié)議,該協(xié)議可以保證數(shù)據(jù)提供者在提供訓(xùn)練數(shù)據(jù)給訓(xùn)練機(jī)構(gòu)時(shí)訓(xùn)練數(shù)據(jù)不會(huì)泄露。針對(duì)感知器的預(yù)測(cè),提出了一個(gè)云輔助的基于加同態(tài)加密的隱私保護(hù)預(yù)測(cè)協(xié)議,該協(xié)議可以有效保護(hù)預(yù)測(cè)過程中輸入特征和模型參數(shù)的隱私同時(shí)借助云平臺(tái)的強(qiáng)大計(jì)算和存儲(chǔ)能力有效降低用戶管理和處理數(shù)據(jù)的負(fù)擔(dān)。最終,本文用真實(shí)數(shù)據(jù)集驗(yàn)證了本文感知器隱私保護(hù)協(xié)議的準(zhǔn)確性和效率。卷積神經(jīng)網(wǎng)絡(luò)是一種擅長分析視覺圖像,在圖像和視頻識(shí)別、圖像分類和自然語言處理等方面有著廣泛的應(yīng)用的一種特殊神經(jīng)網(wǎng)絡(luò),與其他圖片分類算法相比,卷積神經(jīng)網(wǎng)絡(luò)不需要對(duì)圖像進(jìn)行復(fù)雜的預(yù)處理,因此卷積神經(jīng)網(wǎng)絡(luò)在實(shí)際中得到了更加廣泛的應(yīng)用。目前已經(jīng)存在的卷積神經(jīng)網(wǎng)絡(luò)的隱私保護(hù)方案很多都采用全同態(tài)加密技術(shù)來實(shí)現(xiàn),而且都忽略了對(duì)網(wǎng)絡(luò)最后一層的輸出的保護(hù)。本文提出了一個(gè)基于加同態(tài)加密的卷積神經(jīng)網(wǎng)絡(luò)隱私保護(hù)協(xié)議,本文的協(xié)議可以保護(hù)用戶的隱私輸入,服務(wù)器的模型參數(shù),以及計(jì)算的中間值。最終,本文利用真實(shí)數(shù)據(jù)集驗(yàn)證了本文協(xié)議的正確性和可用性。
【圖文】:
第 3 章 理論基礎(chǔ)性的映射。在卷積神經(jīng)網(wǎng)絡(luò)中,,往往采用修正線性單元函數(shù)(RELU)作為激活數(shù),RELU 能夠使網(wǎng)絡(luò)中只有大概 50%的神經(jīng)元處于激活狀態(tài),有效降低過擬合情況的出現(xiàn),而且它可以有效避免梯度爆炸和梯度消失的問題。修正線性單元數(shù)的數(shù)學(xué)形式為f ( x ) max(0, x),其函數(shù)圖像如圖 3-3 所示。
IRIS 數(shù)據(jù)集(鳶尾花數(shù)據(jù)集),它包含 150 個(gè)樣本,每一個(gè)樣本擁有四個(gè)特征屬性,分別是花萼的長度,寬度以及花瓣的長度和寬度。鳶尾花的類別有三種,分別是山鳶尾,雜色鳶尾以及維吉尼亞鳶尾,每個(gè)類別的數(shù)據(jù)各有 50 條,在本文中,我們采用前 100 個(gè)線性可分樣本(分類結(jié)果只有兩類)來做感知器隱私保護(hù)方案的訓(xùn)練和預(yù)測(cè)。LOWBWT 數(shù)據(jù)集(低出生體重?cái)?shù)據(jù)集)包含 189 個(gè)樣本,每一個(gè)樣本擁有 9個(gè)特征屬性,分別是母親的年齡,母親在最后月經(jīng)期的體重,人種,孕期吸煙狀況,早產(chǎn)史,高血壓病史,子宮過敏,懷孕前三個(gè)月的內(nèi)科醫(yī)生就診次數(shù),出生體重。出生體重的類別有兩種,分別是低出生體重,正常出生體重,這兩個(gè)類別的數(shù)據(jù)分別有 59 條,189 條。由于數(shù)據(jù)集中第九個(gè)特征屬性值是嬰兒的出生體重,所以在實(shí)驗(yàn)過程中,我們只使用數(shù)據(jù)的前八個(gè)特征屬性。為了更好地了解數(shù)據(jù)集的分布情況,我們利用 IRIS 和 LOWBWT 數(shù)據(jù)集的兩個(gè)特征屬性對(duì)數(shù)據(jù)進(jìn)行可視化(如圖 5-3)。
【學(xué)位授予單位】:廣州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP183;TP309
本文編號(hào):2686921
【圖文】:
第 3 章 理論基礎(chǔ)性的映射。在卷積神經(jīng)網(wǎng)絡(luò)中,,往往采用修正線性單元函數(shù)(RELU)作為激活數(shù),RELU 能夠使網(wǎng)絡(luò)中只有大概 50%的神經(jīng)元處于激活狀態(tài),有效降低過擬合情況的出現(xiàn),而且它可以有效避免梯度爆炸和梯度消失的問題。修正線性單元數(shù)的數(shù)學(xué)形式為f ( x ) max(0, x),其函數(shù)圖像如圖 3-3 所示。
IRIS 數(shù)據(jù)集(鳶尾花數(shù)據(jù)集),它包含 150 個(gè)樣本,每一個(gè)樣本擁有四個(gè)特征屬性,分別是花萼的長度,寬度以及花瓣的長度和寬度。鳶尾花的類別有三種,分別是山鳶尾,雜色鳶尾以及維吉尼亞鳶尾,每個(gè)類別的數(shù)據(jù)各有 50 條,在本文中,我們采用前 100 個(gè)線性可分樣本(分類結(jié)果只有兩類)來做感知器隱私保護(hù)方案的訓(xùn)練和預(yù)測(cè)。LOWBWT 數(shù)據(jù)集(低出生體重?cái)?shù)據(jù)集)包含 189 個(gè)樣本,每一個(gè)樣本擁有 9個(gè)特征屬性,分別是母親的年齡,母親在最后月經(jīng)期的體重,人種,孕期吸煙狀況,早產(chǎn)史,高血壓病史,子宮過敏,懷孕前三個(gè)月的內(nèi)科醫(yī)生就診次數(shù),出生體重。出生體重的類別有兩種,分別是低出生體重,正常出生體重,這兩個(gè)類別的數(shù)據(jù)分別有 59 條,189 條。由于數(shù)據(jù)集中第九個(gè)特征屬性值是嬰兒的出生體重,所以在實(shí)驗(yàn)過程中,我們只使用數(shù)據(jù)的前八個(gè)特征屬性。為了更好地了解數(shù)據(jù)集的分布情況,我們利用 IRIS 和 LOWBWT 數(shù)據(jù)集的兩個(gè)特征屬性對(duì)數(shù)據(jù)進(jìn)行可視化(如圖 5-3)。
【學(xué)位授予單位】:廣州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP183;TP309
【參考文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前1條
1 王晶晶;支持隱私保護(hù)的高效單層感知機(jī)學(xué)習(xí)算法研究[D];西安電子科技大學(xué);2018年
本文編號(hào):2686921
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2686921.html
最近更新
教材專著