云環(huán)境下模糊可搜索加密的設(shè)計和實現(xiàn)
發(fā)布時間:2020-11-03 21:26
隨著云計算普及發(fā)展,越來越多公司和個人將數(shù)據(jù)存放到云服務(wù)器,降低了大量的時間成本和人力成本。由于這些數(shù)據(jù)可能涉及用戶的隱私信息,因此在數(shù)據(jù)上傳到云服務(wù)器前,需要應(yīng)用加密技術(shù)對數(shù)據(jù)進行加密,從而保護用戶隱私。但此時用戶將會遇到如何在密文狀態(tài)下進行數(shù)據(jù)查找的難題,因為適用于明文狀態(tài)下的處理策略往往無法直接應(yīng)用于密文狀態(tài)下的數(shù)據(jù)。可搜索加密是一種支持用戶在密文狀態(tài)下進行關(guān)鍵詞查找的密碼學(xué)原語,它可以滿足我們在保護數(shù)據(jù)隱私的前提下查找數(shù)據(jù)的需求。在信息檢索系統(tǒng)中,用戶在輸入數(shù)據(jù)的時候經(jīng)常會出現(xiàn)輕微的錯別字和格式不一致,為此本文聚焦于模糊搜索功能,提高系統(tǒng)實用性。首先,本文針對不同的應(yīng)用場景類型,分別提出了基于Paillier加密算法的非對稱模糊可搜索加密方案(PFSE)和基于Secure KNN加密算法的對稱模糊可搜索加密方案(SFSE),滿足用戶在不同應(yīng)用場景的需求。目前大部分的可搜索加密方案只支持對英文字母或者ASCII碼表里的字符進行模糊搜索,我們通過對關(guān)鍵詞進行預(yù)處理,從而使得本文的兩個方案能夠支持漢字模糊搜索和英文亂序搜索,模糊搜索功能更加完善。此外,本文的兩個方案利用TF-IDF對搜索的結(jié)果進行篩選,每次只返回若干個與查詢關(guān)鍵詞最相關(guān)的數(shù)據(jù),降低了傳輸開銷,同時保證了用戶良好的搜索體驗。其次,在搜索階段PFSE方案相較于實驗對比方案,當(dāng)關(guān)鍵詞長度為6時,時間開銷降低了25%,雖然在初始化階段PFSE方案空間開銷和時間開銷有所增大。但搜索階段才是耗時最多,同時搜索功能也是最主要的功能,因此PFSE方案相較于對比方案更加高效。此外,實驗對比方案在搜索階段會泄漏部分密鑰,而PFSE方案通過對系統(tǒng)結(jié)構(gòu)進行改進優(yōu)化后,在各個階段都不會泄漏任何密鑰信息,因此PFSE方案更加安全。在SFSE方案中通過構(gòu)建基于倒排索引的索引,使得SFSE方案相較于實驗對比方案效率更加高效,同時搜索準(zhǔn)確率更高。最后,利用關(guān)鍵詞提取算法、自動文本摘要生成算法、詞干提取算法和詞形還原算法對本文的方案進行優(yōu)化。此外,還實現(xiàn)了密文狀態(tài)下數(shù)值區(qū)間模糊搜索功能。
【學(xué)位單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP309.7
【部分圖文】:
開的公鑰pk對明文消息進行加密,得到密文數(shù)據(jù),然后將密文數(shù)據(jù)發(fā)送給甲方;甲方在??接收到乙方發(fā)送過來的密文數(shù)據(jù)后,使用它自己的私鑰sk對密文消息進行解密,從而獲??取乙方發(fā)送給它的明文消息(具體過程如圖2-2所示)。??非對稱加密算法的特點是:加解密算法比較復(fù)雜,因此非對稱加密算法的加解密速??度沒有對稱加密算法的加解密速度快;但是,在對稱加密算法中,加密操作和解密操作??使用的是同一個密鑰,因此數(shù)據(jù)發(fā)送方必須把加密密鑰發(fā)送給數(shù)據(jù)接收方,這樣數(shù)據(jù)接??收方才能對密文數(shù)據(jù)進行解密,所以要保證非對稱加密算法的安全性就必須要確保密鑰??15??
發(fā)送方?接收方??圖2-1對稱加密算法流程圖??在對稱加密算法中加密和解密使用的是同一個秘鑰,然而在非對稱加密算法中一般??使用公鑰(public?key,簡稱pk)進行加密和使用私鑰(private?key,簡稱sk)進行??解密。并且公鑰與私鑰是一對的,假如用公鑰pk對明文消息進行加密,那么只有使用相??應(yīng)的私鑰才能對密文進行解密;如果用私鑰sk對明文消息進行加密,那么只有使用相應(yīng)??的公鑰才能對密文數(shù)據(jù)進行解密。因為加密操作和解密加密使用的是一對密鑰中的兩個??不同密鑰,所以這種加密算法稱為非對稱加密算法。具體的非對稱加密算法一般是以某??個困難問題為基礎(chǔ)來構(gòu)建的。??當(dāng)通信雙方使用非對稱加密算法來加密明文消息時,其一般過程是:首先甲方生成??一對公私鑰,并將公鑰pk向其它任意方公開;當(dāng)乙方想要和甲方通信時,它使用甲方公??開的公鑰pk對明文消息進行加密
首先將關(guān)鍵詞中的每個字符轉(zhuǎn)換成ASCII碼,然后將16進制的ASCII碼轉(zhuǎn)換成10進制的整??數(shù),最后將這些整數(shù)累加得到一個大整數(shù)。我們將關(guān)鍵詞轉(zhuǎn)換成大整數(shù)的算法取名為WTI,??具體流程如圖3-2所示。??關(guān)鍵詞 ̄?I?w?I?Q?I?r?I?d???;??????ASCII?SB?0X77?OX6F?0X72?0X64????v?\l-?4;??十進制整數(shù)?119?111?114?l〇〇??累?to?0?????0????士??十翻徽?444??Paillier?加密??密文??^?-??圖3-2?WTI流程圖??3.2.2漢字預(yù)處理算法??漢字作為世界上使用人口最多的文字,支持漢字模糊可搜索加密是十分有必要且有??意義的。一個漢字通?梢杂扇舾蓚拼音字母或者若干筆畫組成,因此一個漢字存在同??音字和形近字。本文中的漢字模糊搜索,主要是指輸入一個漢字,我們可以找到其同音??字和形近字。對于同音字,漢字由若干個拼音字母組成與英文單詞相似,只要增加一位??用來保存聲調(diào),就可以使用WTI算法實現(xiàn)同音字模糊搜索。而對于形近字,我們通過對??20??
【參考文獻】
本文編號:2869123
【學(xué)位單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP309.7
【部分圖文】:
開的公鑰pk對明文消息進行加密,得到密文數(shù)據(jù),然后將密文數(shù)據(jù)發(fā)送給甲方;甲方在??接收到乙方發(fā)送過來的密文數(shù)據(jù)后,使用它自己的私鑰sk對密文消息進行解密,從而獲??取乙方發(fā)送給它的明文消息(具體過程如圖2-2所示)。??非對稱加密算法的特點是:加解密算法比較復(fù)雜,因此非對稱加密算法的加解密速??度沒有對稱加密算法的加解密速度快;但是,在對稱加密算法中,加密操作和解密操作??使用的是同一個密鑰,因此數(shù)據(jù)發(fā)送方必須把加密密鑰發(fā)送給數(shù)據(jù)接收方,這樣數(shù)據(jù)接??收方才能對密文數(shù)據(jù)進行解密,所以要保證非對稱加密算法的安全性就必須要確保密鑰??15??
發(fā)送方?接收方??圖2-1對稱加密算法流程圖??在對稱加密算法中加密和解密使用的是同一個秘鑰,然而在非對稱加密算法中一般??使用公鑰(public?key,簡稱pk)進行加密和使用私鑰(private?key,簡稱sk)進行??解密。并且公鑰與私鑰是一對的,假如用公鑰pk對明文消息進行加密,那么只有使用相??應(yīng)的私鑰才能對密文進行解密;如果用私鑰sk對明文消息進行加密,那么只有使用相應(yīng)??的公鑰才能對密文數(shù)據(jù)進行解密。因為加密操作和解密加密使用的是一對密鑰中的兩個??不同密鑰,所以這種加密算法稱為非對稱加密算法。具體的非對稱加密算法一般是以某??個困難問題為基礎(chǔ)來構(gòu)建的。??當(dāng)通信雙方使用非對稱加密算法來加密明文消息時,其一般過程是:首先甲方生成??一對公私鑰,并將公鑰pk向其它任意方公開;當(dāng)乙方想要和甲方通信時,它使用甲方公??開的公鑰pk對明文消息進行加密
首先將關(guān)鍵詞中的每個字符轉(zhuǎn)換成ASCII碼,然后將16進制的ASCII碼轉(zhuǎn)換成10進制的整??數(shù),最后將這些整數(shù)累加得到一個大整數(shù)。我們將關(guān)鍵詞轉(zhuǎn)換成大整數(shù)的算法取名為WTI,??具體流程如圖3-2所示。??關(guān)鍵詞 ̄?I?w?I?Q?I?r?I?d???;??????ASCII?SB?0X77?OX6F?0X72?0X64????v?\l-?4;??十進制整數(shù)?119?111?114?l〇〇??累?to?0?????0????士??十翻徽?444??Paillier?加密??密文??^?-??圖3-2?WTI流程圖??3.2.2漢字預(yù)處理算法??漢字作為世界上使用人口最多的文字,支持漢字模糊可搜索加密是十分有必要且有??意義的。一個漢字通?梢杂扇舾蓚拼音字母或者若干筆畫組成,因此一個漢字存在同??音字和形近字。本文中的漢字模糊搜索,主要是指輸入一個漢字,我們可以找到其同音??字和形近字。對于同音字,漢字由若干個拼音字母組成與英文單詞相似,只要增加一位??用來保存聲調(diào),就可以使用WTI算法實現(xiàn)同音字模糊搜索。而對于形近字,我們通過對??20??
【參考文獻】
相關(guān)期刊論文 前2條
1 秦志光;包文意;趙洋;熊虎;;云存儲中一種模糊關(guān)鍵字搜索加密方案[J];信息網(wǎng)絡(luò)安全;2015年06期
2 李喬;鄭嘯;;云計算研究現(xiàn)狀綜述[J];計算機科學(xué);2011年04期
本文編號:2869123
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2869123.html
最近更新
教材專著