Web搜索引擎的一種檢索結(jié)構(gòu)優(yōu)化方法
發(fā)布時(shí)間:2017-09-25 07:21
本文關(guān)鍵詞:Web搜索引擎的一種檢索結(jié)構(gòu)優(yōu)化方法
更多相關(guān)文章: Web搜索引擎 分布式搜索 檢索結(jié)構(gòu) 吞吐量 分類索引
【摘要】:為了提升Web引擎的檢索服務(wù)性能和擴(kuò)展性,提出了一種索引劃分方法,依據(jù)該方法改進(jìn)了檢索結(jié)構(gòu),避免了冗余查詢,并加速了內(nèi)部并行化查詢過程。按照文檔主題和相似URL對(duì)索引文檔分類,而索引節(jié)點(diǎn)內(nèi)則按照詞項(xiàng)劃分,實(shí)現(xiàn)了索引節(jié)點(diǎn)查詢間和查詢內(nèi)的并行。根據(jù)索引分類的結(jié)構(gòu),改進(jìn)了系統(tǒng)內(nèi)部查詢邏輯,設(shè)計(jì)了Aggregator(簡(jiǎn)稱Agg)進(jìn)程隊(duì)列,實(shí)現(xiàn)了異步處理高并發(fā)查詢。實(shí)驗(yàn)結(jié)果表明,優(yōu)化的Web引擎結(jié)構(gòu)總體上能夠降低查詢開銷,提高系統(tǒng)吞吐量,相對(duì)于傳統(tǒng)Web搜索模型,其查詢速度和吞吐量分別提高了20%和25%。
【作者單位】: 哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【關(guān)鍵詞】: Web搜索引擎 分布式搜索 檢索結(jié)構(gòu) 吞吐量 分類索引
【基金】:國(guó)家自然科學(xué)基金(61173024)資助項(xiàng)目
【分類號(hào)】:TP391.3
【正文快照】: n 索引節(jié)點(diǎn)的g涸睪徒郵輾窠峁諍系母涸亟,
本文編號(hào):916098
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/916098.html
最近更新
教材專著