分布式索引在東華搜索引擎中的研究和應(yīng)用.doc
本文關(guān)鍵詞:分布式索引在東華搜索引擎中的研究和應(yīng)用,由筆耕文化傳播整理發(fā)布。
文檔介紹:
【精品】畢業(yè)論文優(yōu)秀畢業(yè)論文本科論文專業(yè)學(xué)術(shù)論文參考文獻(xiàn)資料計(jì)算機(jī)軟件與理論專業(yè)優(yōu)秀論文--分布式索引在東華搜索引擎中的研究和應(yīng)用關(guān)鍵詞:分布式索引搜索引擎負(fù)載平衡計(jì)算模型 Lucene 核心包摘要:隨著 IT 技術(shù)高速發(fā)展,社會(huì)生活已經(jīng)進(jìn)入了信息爆炸的時(shí)代。遍布互聯(lián)網(wǎng)的信息資源日趨豐富,應(yīng)用范圍也在不斷擴(kuò)大,而搜索引擎則為信息獲取提供了巨大的便利,是使用率最高的互聯(lián)網(wǎng)工具之一。但是日益增長(zhǎng)的用戶和數(shù)據(jù)讓傳統(tǒng)的集中式搜索引擎不堪重負(fù),由此所衍生的,是對(duì)搜索引擎性能問(wèn)題的研究。索引是搜索引擎中十分重要的組成部分,通過(guò)對(duì)搜索引擎的相關(guān)理論和技術(shù)進(jìn)行分析和討論,本文著眼于東華大學(xué)搜索引擎索引部分的研究和實(shí)現(xiàn),構(gòu)建了一套可擴(kuò)展的分布式索引框架,并最終應(yīng)用于東華大學(xué)搜索引擎。主要研究?jī)?nèi)容如下:論述目前搜索引擎的國(guó)內(nèi)外發(fā)展現(xiàn)狀,存在的問(wèn)題以及發(fā)展趨勢(shì);分析搜索引擎的工作原理以及索引部分的組織和流程機(jī)制;對(duì)分布式技術(shù)理論,負(fù)載平衡理論以及 Map/Reduce 計(jì)算模型進(jìn)行分析和研究。對(duì)開源搜索引擎工具包 Lucene和 RMI(遠(yuǎn)程方法調(diào)用)技術(shù)進(jìn)行了分析和研究。主要貢獻(xiàn)如下:1.使用 Lucene 核心包提供的索引組織方式創(chuàng)建倒排索引,基于 RMI 技術(shù)將待索引的文件...
內(nèi)容來(lái)自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:分布式索引在東華搜索引擎中的研究和應(yīng)用,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):57917
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/57917.html