天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

分布式搜索引擎的模型綜述

發(fā)布時間:2017-09-05 11:06

  本文關(guān)鍵詞:分布式搜索引擎的模型綜述


  更多相關(guān)文章: 分布式索引 搜索引擎 倒排索引 查詢處理


【摘要】:本文綜述了分布式搜索引擎的模型、結(jié)構(gòu)和查詢方法,并討論了搜索引擎的評價指標(biāo)。從搜索引擎的離線處理和在線處理討論了搜索引擎的基本模塊,在線查詢過程速度決定了搜索引擎性能的關(guān)鍵因素;從分布式搜索引擎的模型上劃分,搜索引擎包含四個主要子系統(tǒng):網(wǎng)頁爬蟲系統(tǒng)、索引構(gòu)建系統(tǒng)、檢索系統(tǒng)和日志分析系統(tǒng);倒排索引結(jié)構(gòu)是以詞典(dictionary)和倒排文件(inverted file)組成,分為文檔編號遞增排序和詞頻(或影響力)得分遞減排序。然后討論了當(dāng)前搜索引擎典型的三類查詢處理策略,并比較各自適應(yīng)的條件。最后,綜述評價搜索引擎的兩個重要指標(biāo):查詢效率和查詢結(jié)果的質(zhì)量,并列舉定量評價公式。
【作者單位】: 哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【關(guān)鍵詞】分布式索引 搜索引擎 倒排索引 查詢處理
【基金】:國家自然科學(xué)基金(61173024)
【分類號】:TP391.3
【正文快照】: 0引言隨著互聯(lián)網(wǎng)業(yè)務(wù)的快速發(fā)展,搜索已成為人們學(xué)習(xí)和生活中的必需工具。面對日益激增的網(wǎng)絡(luò)數(shù)據(jù)和復(fù)雜的用戶需求,強(qiáng)大的搜索能力將成為推動互聯(lián)網(wǎng)發(fā)展的關(guān)鍵要素。在工業(yè)界分布式引擎得到廣泛應(yīng)用,Google、Yahoo!、百度、阿里巴巴等巨大網(wǎng)絡(luò)引擎公司,都在充分有效地利用分

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 楊建武,陳曉鷗;基于倒排索引的文本相似搜索[J];計(jì)算機(jī)工程;2005年05期

2 王冬;左萬利;赫楓齡;彭濤;張長利;;一種增量倒排索引結(jié)構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)[J];吉林大學(xué)學(xué)報(理學(xué)版);2007年06期

3 林潔;李丹寧;吳曉;;基于用戶的個性化綜合倒排索引[J];杭州師范大學(xué)學(xué)報(自然科學(xué)版);2008年03期

4 寧可為;王煒;;基于倒排索引的答疑系統(tǒng)知識庫文本研究[J];湖北廣播電視大學(xué)學(xué)報;2010年06期

5 譚斌;丁莎;車念;徐力;聶清彬;譚錢茂;黃翔;;一種面向域的高效倒排索引結(jié)構(gòu)及實(shí)時更新[J];四川大學(xué)學(xué)報(自然科學(xué)版);2011年02期

6 成毅;葛文;鄭仲;陳科;;分布式倒排索引的地理信息服務(wù)搜索方法研究[J];測繪科學(xué)技術(shù)學(xué)報;2014年01期

7 賈崇,陸玉昌,魯明羽;一種支持高效檢索的即時更新倒排索引方法[J];計(jì)算機(jī)工程與應(yīng)用;2003年29期

8 鄺礫;鄧水光;李瑩;吳健;吳朝暉;;使用倒排索引優(yōu)化面向組合的語義服務(wù)發(fā)現(xiàn)[J];軟件學(xué)報;2007年08期

9 趙亮;;基于復(fù)合結(jié)構(gòu)的高效索引在線更新策略[J];計(jì)算機(jī)工程;2008年02期

10 吳曉;李丹寧;呂爽;林潔;李丹;;基于綜合倒排索引的個性化搜索引擎研究[J];微計(jì)算機(jī)信息;2008年27期

中國重要會議論文全文數(shù)據(jù)庫 前4條

1 李棟;史曉東;;對搜索引擎中倒排索引更新策略的研究和改進(jìn)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年

2 劉小珠;孫莎;曾承;彭智勇;;基于緩存的倒排索引機(jī)制研究[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2007年

3 維尼拉·木沙江;吳俊森;吐爾根·依布拉音;;維吾爾文搜索引擎的倒排索引設(shè)計(jì)與實(shí)現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集[C];2007年

4 孫宇;劉憬;張宇;劉挺;;基于分詞和倒排索引的短文本檢索技術(shù)的研究與實(shí)現(xiàn)[A];黑龍江省計(jì)算機(jī)學(xué)會2007年學(xué)術(shù)交流年會論文集[C];2007年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 艾列富;基于內(nèi)容的大規(guī)模圖像索引與檢索方法研究[D];華中科技大學(xué);2014年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 劉興宇;基于倒排索引的全文檢索技術(shù)研究[D];華中科技大學(xué);2004年

2 劉紅雨;基于倒排索引的微博話題檢測[D];哈爾濱工業(yè)大學(xué);2013年

3 汪紅敏;基于固態(tài)硬盤的倒排索引動態(tài)更新策略及其優(yōu)化研究[D];華中科技大學(xué);2013年

4 毛福林;倒排索引壓縮算法研究[D];北京交通大學(xué);2015年

5 林潔;基于綜合倒排索引的個性化搜索技術(shù)研究[D];貴州大學(xué);2008年

6 吳俊森;維哈柯多語種搜索引擎倒排索引模塊的實(shí)現(xiàn)[D];新疆大學(xué);2007年

7 陳雪帆;基于固態(tài)硬盤的倒排索引構(gòu)建與維護(hù)策略研究[D];華中科技大學(xué);2012年

8 董長春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年

9 潘勝一;基于倒排索引的壓縮算法性能研究[D];杭州電子科技大學(xué);2009年

10 代萬能;倒排索引技術(shù)在Hadoop平臺上的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2013年

,

本文編號:797591

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/797591.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶89cbf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com