加密云數(shù)據(jù)下基于Simhash的模糊排序搜索方案
本文選題:云計算 + 加密云數(shù)據(jù); 參考:《計算機學報》2017年02期
【摘要】:為了保護數(shù)據(jù)隱私,數(shù)據(jù)擁有者會將敏感數(shù)據(jù)的密文外包到云服務器,這使得傳統(tǒng)明文搜索技術難以使用.因此可搜索加密技術被用于對密文數(shù)據(jù)進行搜索,實現(xiàn)高效的數(shù)據(jù)利用.然而目前在加密云數(shù)據(jù)中,關鍵詞模糊搜索方案主要是通過構(gòu)造關鍵詞模糊集合來實現(xiàn),其需要大量的計算和存儲開銷.本文提出的搜索方案,無需構(gòu)造關鍵詞模糊集合,而是基于Simhash的降維思想,將文檔關鍵詞做n-gram處理并得到Simhash指紋來實現(xiàn)模糊搜索.該文結(jié)合漢明距離和關鍵詞相關度分數(shù),設計了雙因子排序算法對查詢結(jié)果進行排序.使用樹索引結(jié)構(gòu)和新型遍歷方法進一步提高了搜索效率.通過新型遍歷方法,即使樹的節(jié)點值與期望值不相等,也能夠?qū)溥M行遍歷.理論分析和實驗結(jié)果表明:該方案實現(xiàn)了加密云數(shù)據(jù)下的關鍵詞模糊搜索,同時極大地節(jié)約了時間和空間成本.
[Abstract]:In order to protect data privacy, data owners outsource ciphertext of sensitive data to cloud servers, which makes it difficult for traditional plaintext search technology to use. Therefore searchable encryption technology is used to search ciphertext data to achieve efficient data utilization. However, in encrypted cloud data, keyword fuzzy search scheme is mainly implemented by constructing fuzzy set of keywords, which requires a large amount of computation and storage overhead. The search scheme proposed in this paper does not need to construct the fuzzy set of keywords, but based on the dimensionality reduction idea of Simhash, the document keywords are processed by n-gram and the Simhash fingerprint is obtained to realize the fuzzy search. Combining hamming distance and keyword correlation score, a two-factor sorting algorithm is designed to sort the query results. The search efficiency is further improved by using tree index structure and new traversal method. Through the new traversal method, the tree can be traversed even if the node value is not equal to the expected value. The theoretical analysis and experimental results show that the proposed scheme realizes the keyword fuzzy search under encrypted cloud data and saves the cost of time and space greatly at the same time.
【作者單位】: 福州大學數(shù)學與計算機科學學院;網(wǎng)絡系統(tǒng)信息安全福建省高校重點實驗室;福州大學物理與信息工程學院;
【基金】:國家自然科學基金(61402112,61472307,61472309,61303198) 福建省教育廳科技項目(JA12028) 福建省重大科技項目(2015H6013) 福州大學科技發(fā)展基金項目(2012-XY-17)資助~~
【分類號】:TP309
【相似文獻】
相關期刊論文 前10條
1 梁銀;董永權(quán);;基于對象集合的空間關鍵詞查詢[J];計算機應用;2014年07期
2 張穎;李昕;;一種關系數(shù)據(jù)庫上的關鍵詞查詢排序方法[J];遼寧工業(yè)大學學報(自然科學版);2013年05期
3 寇蘇玲;蔡慶生;;應用于用戶興趣建模的多文本關鍵詞抽取研究[J];計算機仿真;2007年02期
4 林子雨;楊冬青;王騰蛟;張東站;;基于關系數(shù)據(jù)庫的關鍵詞查詢[J];軟件學報;2010年10期
5 林子雨;鄒權(quán);賴永炫;林琛;;關系數(shù)據(jù)庫中的關鍵詞查詢結(jié)果動態(tài)優(yōu)化[J];軟件學報;2014年03期
6 李益民;;一種大規(guī)模Deep Web查詢重構(gòu)技術[J];情報科學;2014年01期
7 李慧穎;瞿裕忠;;基于關鍵詞的RDF數(shù)據(jù)查詢方法[J];東南大學學報(自然科學版);2010年02期
8 楊書新;徐慧琴;;基于數(shù)據(jù)圖的關系數(shù)據(jù)庫關鍵詞查詢排序研究[J];計算機應用研究;2014年02期
9 海沫;郭樹行;;網(wǎng)絡環(huán)境中基于語義聚類的多關鍵詞查詢機制[J];圖書情報工作;2012年20期
10 安鎮(zhèn)宙;楊鑒;仇汶;;一種新的基于分層查詢表的關鍵詞識別模型[J];計算機工程與應用;2008年02期
相關會議論文 前3條
1 修慧蘭;;臺灣大學生個人競爭力之相關研究[A];全國教育與心理統(tǒng)計與測量學術年會暨第八屆海峽兩岸心理與教育測驗學術研討會論文摘要集[C];2008年
2 楊艷;何天宇;;基于短語的關系數(shù)據(jù)庫關鍵詞查詢方法[A];第29屆中國數(shù)據(jù)庫學術會議論文集(B輯)(NDBC2012)[C];2012年
3 李_,
本文編號:1955718
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1955718.html