天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

分布式搜索引擎中關(guān)鍵詞倒排索引方法仿真

發(fā)布時間:2021-09-17 09:50
  針對當(dāng)前信息檢索方法存在的檢索效率低、檢索過程安全性和準(zhǔn)確性差的問題,提出分布式搜索引擎中關(guān)鍵詞倒排索引方法。以倒排索引理論分析為依據(jù),構(gòu)建關(guān)鍵詞倒排索引體系,并解析索引中的關(guān)鍵技術(shù)。使用該技術(shù)將多種特征向量構(gòu)建的超向量當(dāng)作文檔特征提取出來,將取值不同的各維特征向量歸一化。提取特征后,將各維特征均值與標(biāo)準(zhǔn)差作為規(guī)整向量,完成文檔特征規(guī)整。依據(jù)特征特征規(guī)整,利用模糊K均值聚類法生成檢索詞典。分析詞典,構(gòu)建明文倒排索引文檔,對文檔中相關(guān)記錄信息加密,生成密文文檔并構(gòu)建密文文檔倒排索引。索引服務(wù)器根據(jù)CRC32算法處理密文索引詞,利用特征提取技術(shù)將索引詞劃分成不同段,根據(jù)詞典將其轉(zhuǎn)換成字序列用于檢索,以命中關(guān)鍵詞在每個候選文檔中占據(jù)的比例當(dāng)作檢索詞與全部候選文檔相似程度的判定依據(jù),將相似度值按從大到小順序排列,將排列結(jié)果返給用戶,完成一次索引。實驗結(jié)果表明,上述方法檢索耗時短、安全系數(shù)高,檢索結(jié)果準(zhǔn)確性優(yōu)于當(dāng)前方法,適用性強。 

【文章來源】:計算機仿真. 2019,36(08)北大核心

【文章頁數(shù)】:5 頁

【文章目錄】:
1 引言
2 分布式搜索引擎中關(guān)鍵詞倒排索引方法
    2.1 倒排索引分析
    2.2 關(guān)鍵詞倒排索引體系和索引關(guān)鍵技術(shù)分析
    2.3 關(guān)鍵詞倒排索引與檢索
3 實驗結(jié)果與分析
4 結(jié)束語


【參考文獻】:
期刊論文
[1]分布式RDF關(guān)鍵詞近似搜索方法[J]. 陳遠,汪璟玢.  中國科學(xué)技術(shù)大學(xué)學(xué)報. 2017(10)
[2]基于.NET的分布式軟件體系結(jié)構(gòu)設(shè)計與實現(xiàn)[J]. 李嵐.  電子設(shè)計工程. 2017(16)
[3]海量圖書信息快速檢索優(yōu)化管理仿真研究[J]. 李云霞.  計算機仿真. 2017(05)
[4]基于LDA主題模型的分布式信息檢索集合選擇方法[J]. 何旭峰,陳嶺,陳根才,錢坤,吳勇,王敬昌.  中文信息學(xué)報. 2017(03)
[5]一種可抵抗統(tǒng)計攻擊的安全索引[J]. 惠榛,馮登國,張敏,洪澄.  計算機研究與發(fā)展. 2017(02)
[6]基于云計算及大數(shù)據(jù)技術(shù)的電力搜索引擎技術(shù)研究[J]. 樓鳳丹,裴旭斌,王志強,紀德良.  電網(wǎng)與清潔能源. 2016(12)
[7]基于simhash與倒排索引的復(fù)用代碼快速溯源方法[J]. 喬延臣,云曉春,庹宇鵬,張永錚.  通信學(xué)報. 2016(11)
[8]一種基于指紋因子的魯棒音頻檢索方法[J]. 林靜,楊繼臣,張雪源,李新超.  數(shù)據(jù)采集與處理. 2016(05)
[9]地理數(shù)據(jù)空間本體構(gòu)建及其在數(shù)據(jù)檢索中的應(yīng)用[J]. 王東旭,諸云強,潘鵬,羅侃,侯志偉.  地球信息科學(xué)學(xué)報. 2016(04)
[10]ElasticSearch分布式搜索引擎在天文大數(shù)據(jù)檢索中的應(yīng)用研究[J]. 陳亞杰,王鋒,鄧輝,劉應(yīng)波.  天文學(xué)報. 2016(02)



本文編號:3398474

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3398474.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e7f5b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com