分布式搜索引擎的模型綜述
本文關(guān)鍵詞:分布式搜索引擎的模型綜述
更多相關(guān)文章: 分布式索引 搜索引擎 倒排索引 查詢處理
【摘要】:本文綜述了分布式搜索引擎的模型、結(jié)構(gòu)和查詢方法,并討論了搜索引擎的評價指標(biāo)。從搜索引擎的離線處理和在線處理討論了搜索引擎的基本模塊,在線查詢過程速度決定了搜索引擎性能的關(guān)鍵因素;從分布式搜索引擎的模型上劃分,搜索引擎包含四個主要子系統(tǒng):網(wǎng)頁爬蟲系統(tǒng)、索引構(gòu)建系統(tǒng)、檢索系統(tǒng)和日志分析系統(tǒng);倒排索引結(jié)構(gòu)是以詞典(dictionary)和倒排文件(inverted file)組成,分為文檔編號遞增排序和詞頻(或影響力)得分遞減排序。然后討論了當(dāng)前搜索引擎典型的三類查詢處理策略,并比較各自適應(yīng)的條件。最后,綜述評價搜索引擎的兩個重要指標(biāo):查詢效率和查詢結(jié)果的質(zhì)量,并列舉定量評價公式。
【作者單位】: 哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【關(guān)鍵詞】: 分布式索引 搜索引擎 倒排索引 查詢處理
【基金】:國家自然科學(xué)基金(61173024)
【分類號】:TP391.3
【正文快照】: 0引言隨著互聯(lián)網(wǎng)業(yè)務(wù)的快速發(fā)展,搜索已成為人們學(xué)習(xí)和生活中的必需工具。面對日益激增的網(wǎng)絡(luò)數(shù)據(jù)和復(fù)雜的用戶需求,強(qiáng)大的搜索能力將成為推動互聯(lián)網(wǎng)發(fā)展的關(guān)鍵要素。在工業(yè)界分布式引擎得到廣泛應(yīng)用,Google、Yahoo!、百度、阿里巴巴等巨大網(wǎng)絡(luò)引擎公司,都在充分有效地利用分
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊建武,陳曉鷗;基于倒排索引的文本相似搜索[J];計(jì)算機(jī)工程;2005年05期
2 王冬;左萬利;赫楓齡;彭濤;張長利;;一種增量倒排索引結(jié)構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)[J];吉林大學(xué)學(xué)報(理學(xué)版);2007年06期
3 林潔;李丹寧;吳曉;;基于用戶的個性化綜合倒排索引[J];杭州師范大學(xué)學(xué)報(自然科學(xué)版);2008年03期
4 寧可為;王煒;;基于倒排索引的答疑系統(tǒng)知識庫文本研究[J];湖北廣播電視大學(xué)學(xué)報;2010年06期
5 譚斌;丁莎;車念;徐力;聶清彬;譚錢茂;黃翔;;一種面向域的高效倒排索引結(jié)構(gòu)及實(shí)時更新[J];四川大學(xué)學(xué)報(自然科學(xué)版);2011年02期
6 成毅;葛文;鄭仲;陳科;;分布式倒排索引的地理信息服務(wù)搜索方法研究[J];測繪科學(xué)技術(shù)學(xué)報;2014年01期
7 賈崇,陸玉昌,魯明羽;一種支持高效檢索的即時更新倒排索引方法[J];計(jì)算機(jī)工程與應(yīng)用;2003年29期
8 鄺礫;鄧水光;李瑩;吳健;吳朝暉;;使用倒排索引優(yōu)化面向組合的語義服務(wù)發(fā)現(xiàn)[J];軟件學(xué)報;2007年08期
9 趙亮;;基于復(fù)合結(jié)構(gòu)的高效索引在線更新策略[J];計(jì)算機(jī)工程;2008年02期
10 吳曉;李丹寧;呂爽;林潔;李丹;;基于綜合倒排索引的個性化搜索引擎研究[J];微計(jì)算機(jī)信息;2008年27期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 李棟;史曉東;;對搜索引擎中倒排索引更新策略的研究和改進(jìn)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
2 劉小珠;孫莎;曾承;彭智勇;;基于緩存的倒排索引機(jī)制研究[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年
3 維尼拉·木沙江;吳俊森;吐爾根·依布拉音;;維吾爾文搜索引擎的倒排索引設(shè)計(jì)與實(shí)現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年
4 孫宇;劉憬;張宇;劉挺;;基于分詞和倒排索引的短文本檢索技術(shù)的研究與實(shí)現(xiàn)[A];黑龍江省計(jì)算機(jī)學(xué)會2007年學(xué)術(shù)交流年會論文集[C];2007年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 艾列富;基于內(nèi)容的大規(guī)模圖像索引與檢索方法研究[D];華中科技大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 劉興宇;基于倒排索引的全文檢索技術(shù)研究[D];華中科技大學(xué);2004年
2 劉紅雨;基于倒排索引的微博話題檢測[D];哈爾濱工業(yè)大學(xué);2013年
3 汪紅敏;基于固態(tài)硬盤的倒排索引動態(tài)更新策略及其優(yōu)化研究[D];華中科技大學(xué);2013年
4 毛福林;倒排索引壓縮算法研究[D];北京交通大學(xué);2015年
5 林潔;基于綜合倒排索引的個性化搜索技術(shù)研究[D];貴州大學(xué);2008年
6 吳俊森;維哈柯多語種搜索引擎倒排索引模塊的實(shí)現(xiàn)[D];新疆大學(xué);2007年
7 陳雪帆;基于固態(tài)硬盤的倒排索引構(gòu)建與維護(hù)策略研究[D];華中科技大學(xué);2012年
8 董長春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年
9 潘勝一;基于倒排索引的壓縮算法性能研究[D];杭州電子科技大學(xué);2009年
10 代萬能;倒排索引技術(shù)在Hadoop平臺上的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2013年
,本文編號:797591
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/797591.html