天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

支持隱私計算的非結(jié)構(gòu)化大數(shù)據(jù)查詢處理

發(fā)布時間:2021-01-25 18:27
  如今信息廣泛流通,大數(shù)據(jù)已成為不可或缺的時代產(chǎn)物,借助大數(shù)據(jù)技術(shù)展現(xiàn)出的優(yōu)勢愈發(fā)顯著。這也促使人們需要不斷探索更高效的新技術(shù)對大數(shù)據(jù)進行處理,包括數(shù)據(jù)的存儲、查詢和分析等。其中,大數(shù)據(jù)查詢處理在信息整合篩選等過程占有重要地位。然而,當(dāng)人們從大數(shù)據(jù)技術(shù)中受益時,保護個人隱私也變得越來越困難,非法泄露個人信息或利用數(shù)據(jù)挖掘分析潛在的敏感數(shù)據(jù)等現(xiàn)象頻發(fā),導(dǎo)致個人隱私岌岌可危,因此隱私保護亟待得到更多的關(guān)注。經(jīng)研究發(fā)現(xiàn),在大數(shù)據(jù)查詢領(lǐng)域中對相似性連接查詢的研究大多面向查詢時間優(yōu)化,而其作為數(shù)據(jù)處理中的基本操作之一,在提升查詢效率的同時也應(yīng)關(guān)注個人隱私的保護,因為兩個或多個文件之間的連接更容易識別出個體身份造成信息泄露。相似連接需耗費大量資源和時間,在滿足高效性的前提下平衡數(shù)據(jù)機密性和可用性也是一項挑戰(zhàn)。綜合以上考慮因素,一種基于MapReduce的隱私保護相似性連接查詢(以下簡稱PSJoin)設(shè)法給出了一個解決方案。具體而言,PSJoin確保了在相似性連接查詢過程中和結(jié)果發(fā)布后的數(shù)據(jù)隱私性,該工作重點研究隱私泄露問題,定義了隱私相似連接查詢,并搭建整體框架,提出一種隱私全局排序策略來處理前綴過... 

【文章來源】:華中科技大學(xué)湖北省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:58 頁

【學(xué)位級別】:碩士

【部分圖文】:

支持隱私計算的非結(jié)構(gòu)化大數(shù)據(jù)查詢處理


DPGO性能測試

條形圖,相對誤差,隱私保護


華 中 科 技 大 學(xué) 碩 士 學(xué) 位 論 文圍從 0.25 到 1,RE 與 的條形圖見圖 4.2,RE 普遍較低,說明相似對的輸出受到擾動的影響較小,相似對的統(tǒng)計數(shù)有很高的準確性,呈現(xiàn)這種形勢主要是因為 DPGO對相似對的數(shù)量幾乎沒有影響,參見圖 4.1,而本文提出的差分隱私相似度函數(shù)是在相似值上實施的擾動,因此,像相似記錄號、相似對數(shù)目等的查詢操作仍然可以得到準確答復(fù)。額外的,如果有對這方面的隱私保護需求,本課題也可以為該查詢提供差分隱私保護策略,即是在輸出結(jié)果數(shù)目上進行擾動,不過需要修正隱私保護全局敏感度,還可以采用 3.1 章節(jié)中提到主要針對非數(shù)值型輸出的指數(shù)機制,由于實際結(jié)果顯示的效果類似以及篇幅所限,本文忽略了詳細的描述。

數(shù)據(jù)集,運行時間,相似度函數(shù),隱私


(c) CITESEERX 數(shù)據(jù)集 (d) DBLP+數(shù)據(jù)集圖 4.3 PSJoin 的性能測試4.3 擴展性分析為了評估所提出方法的查詢效率及可擴展性,本節(jié)測量了 PSJoin 在不同數(shù)據(jù)集上不同階段的運行時間。設(shè)置了四個典型相似性閾值 ,范圍從 0.4 到 1。根據(jù)前面的研究發(fā)現(xiàn),2 對 PSJoin 算法的運行時間影響不大,差分隱私相似度函數(shù)和 BSJoin的相似度函數(shù)的時間復(fù)雜度都是平方量級的,因此本實驗可以忽略其值的變化對查詢時間的影響,將其設(shè)定為 = 1.0。但是,實驗發(fā)現(xiàn) DPGO 與執(zhí)行時間是密切相關(guān)的,因為它將直接控制前綴過濾的效果,候選集的大小影響著需要進行相似度計算的次數(shù),進而對查詢時間造成影響。因此,本實驗設(shè)定了1 等于 0.5 或 0.75,在相同的因素下比較了四個不同數(shù)據(jù)集的查詢時間。圖 4.4 和圖 4.5 顯示了四個數(shù)據(jù)集上 PSJoin 的運行時間,圖 4.4 中 設(shè)置為 0.5,圖 4.5 中 設(shè)置為 0.75。為了進一步明確隱私相似連接查詢不同階段的運行時間,本

【參考文獻】:
期刊論文
[1]大數(shù)據(jù)相似性連接查詢技術(shù)研究進展[J]. 馬友忠,張智輝,林春杰.  計算機應(yīng)用. 2018(04)
[2]大數(shù)據(jù)安全與隱私保護研究進展[J]. 曹珍富,董曉蕾,周俊,沈佳辰,寧建廷,鞏俊卿.  計算機研究與發(fā)展. 2016(10)



本文編號:2999679

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2999679.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dc84b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com