一種基于時間敏感度的實時搜索模型研究
發(fā)布時間:2017-10-05 09:08
本文關鍵詞:一種基于時間敏感度的實時搜索模型研究
【摘要】:隨著新的內(nèi)容通過各種方式來獲得,實時搜索引擎成為非常具有挑戰(zhàn)性的工作。搜索引擎應具有高效的索引機制,同時也要確保索引的新鮮度和覆蓋的范圍。這樣就要求搜索引擎支持更快的索引更新。延遲索引的檢索延遲和索引延遲對新鮮度發(fā)揮了重要作用。前者是基于時間獲取內(nèi)容,而后者是根據(jù)發(fā)布時間讓索引獲取更新的內(nèi)容。提出了一種框架,優(yōu)化索引延遲和索引覆蓋,并對實驗結(jié)果進行了分析,證明該框架能夠?qū)崿F(xiàn)索引的新鮮和覆蓋,從而支持更快地對搜索查詢的處理。
【作者單位】: 廣東女子職業(yè)技術學院應用外語系;湖北工業(yè)大學計算機學院;
【關鍵詞】: 搜索引擎 索引新鮮 索引覆蓋 信息檢索
【分類號】:TP391.3
【正文快照】: 引言實時搜索引擎不斷地搜索來自Web內(nèi)容的數(shù)據(jù)流,數(shù)據(jù)流是指一組在網(wǎng)站上發(fā)布用的命令文件,并且是源源不斷地到來。目前獲得來自數(shù)據(jù)流的內(nèi)容有兩種方式:即Atom(自動文摘技術)提要和通過基于分銷協(xié)議的RSS(真正簡易聚合)推送和輪詢來獲取通知。這兩項技術在圖書情報上應用無,
本文編號:975927
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/975927.html
最近更新
教材專著