基于MapReduce可搜索加密的排序方案
發(fā)布時(shí)間:2017-08-18 10:11
本文關(guān)鍵詞:基于MapReduce可搜索加密的排序方案
更多相關(guān)文章: 云計(jì)算 可搜索加密 相關(guān)度排序 MapReduce
【摘要】:互聯(lián)網(wǎng)的高速發(fā)展使得人們越來越傾向于將信息存儲(chǔ)在網(wǎng)絡(luò)上,而云服務(wù)器的高存儲(chǔ)能力也吸引了越來越多的用戶進(jìn)行數(shù)據(jù)存儲(chǔ),與此同時(shí),用戶也開始越來越重視自己的個(gè)人隱私及數(shù)據(jù)安全。最簡單保護(hù)數(shù)據(jù)安全的方式是數(shù)據(jù)擁有者將數(shù)據(jù)先進(jìn)行加密處理,再存儲(chǔ)到云服務(wù)器上。但是將會(huì)帶來如何在密文上進(jìn)行檢索的難題。因此,對(duì)密文數(shù)據(jù)的高效搜索成了熱門的研究領(lǐng)域,現(xiàn)在比較普遍的解決方案就是使用可搜索加密機(jī)制。而大多數(shù)的可搜索加密方案基本上是將搜索到的符合條件的所有結(jié)果都返還給用戶,并沒有對(duì)其進(jìn)行篩選或排序。為數(shù)不多的幾個(gè)可搜索加密排序方案沒有考慮用戶下載后反饋以及不同關(guān)鍵字初始的權(quán)重有可能不一樣這兩個(gè)問題,而且它們的權(quán)重計(jì)算和建立索引都是由數(shù)據(jù)所有者完成。這樣使得可搜索加密排序方案并沒能高效、準(zhǔn)確的完成。 TF/IDF作為一種統(tǒng)計(jì)方法,經(jīng)常應(yīng)用于資訊檢索與文本挖掘的領(lǐng)域,它可以衡量一個(gè)關(guān)鍵字對(duì)于一個(gè)文件集中的某一文件的重要程度。TF/IDF的各種形式之所以在搜索引擎中得到廣泛應(yīng)用,是因?yàn)樗且环N簡單有效的度量方式,可以用來評(píng)估用戶查詢的關(guān)鍵字與文件之間的相關(guān)度大小。相關(guān)度的大小與查詢的關(guān)鍵字在一個(gè)文件中的出現(xiàn)的頻率成正比,與在文件集中出現(xiàn)的頻率成反比,這一特性就可以幫助我們用來區(qū)別文檔。 作為一種可以解決海量數(shù)據(jù)上計(jì)算問題的分布式計(jì)算模型,MapReduce主要應(yīng)用于搜索領(lǐng)域。MapReduce分為兩個(gè)處理階段:Map和Reduce。Map的主要作用是在海量數(shù)據(jù)集上進(jìn)行分解操作,而Reduce是將分解后得到的中間值進(jìn)行歸約,從而得到最終的結(jié)果。 為了能夠高效的實(shí)現(xiàn)密文檢索,同時(shí)能夠保證安全、可靠的將結(jié)果進(jìn)行排序,本文借助MapReduce來實(shí)現(xiàn)可搜索加密的排序方案。 本文的主要研究成果如下: (1)提出了一個(gè)基于MapReduce對(duì)稱可搜索加密的排序方案,,由數(shù)據(jù)擁有者計(jì)算關(guān)鍵字相關(guān)度,云服務(wù)器按其相關(guān)度進(jìn)行排序后,返回給用戶前k個(gè)搜索結(jié)果。 (2)在原方案上進(jìn)行改進(jìn),提出一個(gè)改進(jìn)方案。該方案考慮到關(guān)鍵字初始權(quán)重不同,修改權(quán)重設(shè)定;將關(guān)鍵字相關(guān)度的部分計(jì)算放到服務(wù)器端進(jìn)行,為數(shù)據(jù)擁有者減少本地計(jì)算開銷;考慮安全因素,使用相對(duì)詞頻代替真實(shí)詞頻;增加反饋機(jī)制,更加貼合用戶所需。 (3)在Hadoop平臺(tái)的編程模型MapReduce上設(shè)計(jì)并實(shí)現(xiàn)上述兩個(gè)方案。通過分析和對(duì)比原始方案和改進(jìn)方案,可以看出改進(jìn)方案更加符合用戶要求。
【關(guān)鍵詞】:云計(jì)算 可搜索加密 相關(guān)度排序 MapReduce
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP309.7
【目錄】:
- 摘要4-6
- Abstract6-10
- 第1章 緒論10-15
- 1.1 研究的背景和意義10-11
- 1.2 國內(nèi)外發(fā)展現(xiàn)狀11-13
- 1.2.1 可搜索加密的發(fā)展11-12
- 1.2.2 密文排序的現(xiàn)狀12-13
- 1.3 本文主要內(nèi)容13-14
- 1.4 本文內(nèi)容安排14-15
- 第2章 相關(guān)研究15-28
- 2.1 可搜索加密15-20
- 2.1.1 對(duì)稱可搜索加密16-19
- 2.1.2 公鑰可搜索加密19-20
- 2.2 TF/IDF20-21
- 2.3 開源云計(jì)算平臺(tái) Hadoop21-26
- 2.3.1 分布式文件系統(tǒng) HDFS21-22
- 2.3.2 并行編程模型 MapReduce22-26
- 2.4 本章小結(jié)26-28
- 第3章 基于 MapReduce 對(duì)稱可搜索加密的排序方案設(shè)計(jì)28-37
- 3.1 方案需求分析28-29
- 3.2 基本方案29-32
- 3.2.1 符號(hào)約定29
- 3.2.2 算法定義29-30
- 3.2.3 方案設(shè)計(jì)30-32
- 3.3 改進(jìn)方案32-36
- 3.3.1 改進(jìn)方案的提出32-33
- 3.3.2 相關(guān)度計(jì)算33-34
- 3.3.3 符號(hào)約定34-35
- 3.3.4 算法定義35-36
- 3.4 本章小結(jié)36-37
- 第4章 方案的實(shí)現(xiàn)及分析37-44
- 4.1 試驗(yàn)環(huán)境37
- 4.2 試驗(yàn)實(shí)現(xiàn)37-41
- 4.2.1 數(shù)據(jù)擁有者操作37-40
- 4.2.2 服務(wù)器操作40-41
- 4.3 實(shí)驗(yàn)評(píng)價(jià)41-43
- 4.3.1 評(píng)價(jià)指標(biāo)41-42
- 4.3.2 實(shí)驗(yàn)結(jié)果42-43
- 4.4 算法評(píng)價(jià)43
- 4.5 本章小結(jié)43-44
- 第5章 總結(jié)與展望44-46
- 5.1 論文總結(jié)44-45
- 5.2 工作展望45-46
- 參考文獻(xiàn)46-50
- 作者簡介及碩士期間科研成果50-51
- 致謝51
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 程芳權(quán);彭智勇;宋偉;王書林;崔一輝;;云環(huán)境下一種隱私保護(hù)的高效密文排序查詢方法[J];計(jì)算機(jī)學(xué)報(bào);2012年11期
本文編號(hào):694002
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/694002.html
最近更新
教材專著