基于分布式架構(gòu)元搜索引擎系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf 全文
本文關(guān)鍵詞:基于分布式架構(gòu)的元搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
太原理工大學(xué)碩士研究生學(xué)位論文
基于分布式架構(gòu)的元搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
摘要
1愀嬲
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和計(jì)算機(jī)技術(shù)的廣泛應(yīng)用,人類(lèi)已經(jīng)步入
了信息爆炸的時(shí)代。在互聯(lián)網(wǎng)上涌現(xiàn)的大量信息以及信息結(jié)構(gòu)的多樣化,
使得人們很難在沒(méi)有其它工具幫助的情況下快速搜尋到自己想要的信息。
出,隨著互聯(lián)網(wǎng)的快速發(fā)展,互聯(lián)網(wǎng)上的數(shù)據(jù)繼續(xù)保持著爆炸式的增長(zhǎng)模
式,每年的增長(zhǎng)率已經(jīng)超過(guò)10倍。用戶(hù)在互聯(lián)網(wǎng)上獲取信息的渠道雖然呈
現(xiàn)多元化發(fā)展的趨勢(shì),但門(mén)戶(hù)網(wǎng)站、搜索引擎、博客、微博、論壇、社交
網(wǎng)站等仍是用戶(hù)獲取信息的主要渠道。
元搜索引擎是信息檢索中Web檢索技術(shù)不斷發(fā)展的產(chǎn)物,由于它能夠
集合多個(gè)成員搜索引擎的檢索結(jié)果,并通過(guò)相應(yīng)的算法優(yōu)化檢索結(jié)果的排
序,所以它返回的結(jié)果能大大提高檢索結(jié)果的查全率和查準(zhǔn)率,因此受到
了互聯(lián)網(wǎng)用戶(hù)的廣泛歡迎。但是,隨著成員搜索引擎數(shù)量上升,返回結(jié)果
較多時(shí),檢索的效率以及文檔最后的排序問(wèn)題成為了現(xiàn)在元搜索引擎發(fā)展
的瓶頸。
分布式系統(tǒng)的發(fā)展,旨在聯(lián)合網(wǎng)絡(luò)上的單個(gè)主機(jī),,將一個(gè)復(fù)雜的大任
務(wù)分解為多個(gè)規(guī)模小、復(fù)雜度低的子任務(wù)。通過(guò)利用網(wǎng)絡(luò)上大量的廉價(jià)機(jī)
處理規(guī)模較小、復(fù)雜度低的子任務(wù),可以將串行工作模式改為并行工作的
模式,這樣的改進(jìn)可以大大提高用戶(hù)檢索的效率。
本文首先闡述了近幾年國(guó)內(nèi)外元搜索引擎系統(tǒng)的發(fā)展現(xiàn)狀,在此基礎(chǔ)
上引出了論文的主要研究?jī)?nèi)容。針對(duì)元搜索引擎系統(tǒng)在檢索結(jié)果排序融合
T
本文關(guān)鍵詞:基于分布式架構(gòu)的元搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):79634
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/79634.html