搜索引擎的可行性研究_元搜索引擎的發(fā)展現(xiàn)狀與展望
本文關(guān)鍵詞:元搜索引擎的現(xiàn)狀與發(fā)展,由筆耕文化傳播整理發(fā)布。
當前所在位置:中國論文網(wǎng) > 醫(yī)學論文發(fā)表 > 元搜索引擎的發(fā)展現(xiàn)狀與展望
元搜索引擎的發(fā)展現(xiàn)狀與展望
發(fā)布日期: 2014-05-19 發(fā)布:
2013年12期目錄 本期共收錄文章20篇
摘 要:元搜索引擎是查詢網(wǎng)絡(luò)資源的重要的工具,本文簡述了元搜索引擎的發(fā)展現(xiàn)狀及發(fā)展方向,對近幾年來關(guān)于元搜索引擎的研究進行了分析總結(jié),并提出幾點建議以期推動中文元搜索引擎的開發(fā)與研究,旨在為對元搜索引擎的進一步研究提供參考。
中國論文網(wǎng)
關(guān)鍵詞:元搜索引擎;搜索引擎
引言
近幾年Internet上的信息容量呈爆炸性趨勢增長,人們也越來越多地通過搜索引擎獲取信息。隨著網(wǎng)絡(luò)技術(shù)及搜索技術(shù)的日臻完善,中外搜索引擎已廣為人們熟知和使用。但任何搜索引擎的設(shè)計,均有其特定的數(shù)據(jù)庫索引范圍、獨特的功能和使用方法以及預(yù)期的用戶群指向。且Internet上的信息過于龐雜,具有不穩(wěn)定和變動快的特點,沒有一個索引系統(tǒng)能適時地全面覆蓋Web的文檔。因而一個搜索引擎通常不能找到用戶需要的所有信息,用戶在進行檢索時需要在多個搜索引擎之間進行切換,在多個檢索結(jié)果列表之中挑選對自己有用的內(nèi)容。為解決逐一登陸各搜索引擎,并在各搜索引擎中分別多次輸入同一檢索提問式等煩瑣操作,一個能集成不同搜索引擎檢索結(jié)果的檢索工具-元搜索引擎出現(xiàn)了。
1.工作原理
元搜索引擎主要由三部分組成,即:
“請求提交代理”負責實現(xiàn)用戶個性化的檢索設(shè)置要求,包括調(diào)用哪些搜索引擎、檢索時間限制、結(jié)果數(shù)量限等;
“檢索接口代理”負責將用戶的檢索請求轉(zhuǎn)化成滿足不同搜索引擎“本地化”要求的格式;
“結(jié)果顯示代理”負責所有源搜索引擎檢索結(jié)果的去重、合并、輸出處理等。
元搜索引擎是在統(tǒng)一的用戶查詢界面和信息反饋形式下,共享多個獨立搜索引擎的資源庫為用戶提供信息資源檢索的調(diào)用其它獨立搜索引擎的引擎系統(tǒng)。[1]檢索時,元搜索引擎根據(jù)用戶提交的檢索請求,調(diào)用多個獨立搜索引擎進行搜索,獨立搜索引擎執(zhí)行元搜索引擎檢索請求后將檢索結(jié)果以應(yīng)答形式傳送給元搜索引擎,元搜索引擎將獲得的檢索結(jié)果經(jīng)過匯集、去重、排列等優(yōu)化處理后,以統(tǒng)一格式在同一界面集中傳送給用戶。
2.實現(xiàn)方式
2.1All-in-one
這類元搜索引擎沒有統(tǒng)一的全局外部模式,而是以各搜索引擎的檢索模式和數(shù)據(jù)格式直接面對用戶,即直接把來自多個搜索引擎的搜索結(jié)果列在一個頁面上,不作重新計算或更改,如國內(nèi)的元搜。
2.2桌面元搜索引擎
桌面元搜索引擎是一個包括多個成員搜索引擎的完整系統(tǒng),允許用戶自定義檢索時運行的搜索引擎集合?蓪崿F(xiàn)對多個搜索引擎的并行檢索和后期處理功能。例如用戶定義結(jié)果排序方式、刪除重復(fù)記錄等功能,如SearchX2000、颶風搜索通、SearchWolf、BeeLine等。
2.3多線索式元搜索引擎
提供統(tǒng)一界面及對各搜索引擎特點介紹和選擇機制用戶通過全局界面實現(xiàn)對多個或任意一個搜索引擎的檢索。統(tǒng)一結(jié)果集的組織與顯示:元搜索引擎對各目標搜索引擎返回的結(jié)果進行處理,形成全局結(jié)果集,并以統(tǒng)一格式顯示,主要涉及數(shù)據(jù)格式轉(zhuǎn)換、去重、統(tǒng)一排序等。國外多數(shù)元搜索引擎都是采用這種方式,如MetaFisher、MetaCrawler、Dogpile、萬緯等。
3.中外元搜索引擎的性能比較
根據(jù)元搜索引擎的特點,本文選擇了主頁設(shè)置、搜索范圍、響應(yīng)時間、搜索技術(shù)、檢索結(jié)果等14個具體指標對中外元搜索引擎的性能進行比較(表1)[3]。
從對中外元搜索引擎的比較分析看,目前英文元搜索引擎發(fā)展較快,而中文元搜索引擎發(fā)展緩慢,與英文元搜索引擎相比,還存在較大差距,無論是從元搜索引擎的數(shù)量,還是其頁面設(shè)置、檢功能、結(jié)果處理等方面都還存在一些問題,因此如何借鑒英文元搜索引擎的經(jīng)驗,這就需要我們發(fā)展更多自己的中文元搜索引擎以適應(yīng)信息檢索技術(shù)不斷進步的需要。
4.元搜索引擎發(fā)展方向探討
4.1加強對檢索結(jié)果的處理
由于在不同的搜索引擎在搜集信息的數(shù)量、收集信息的范圍、采用的索引方法、使用的相似度評價等方面的巨大差異,再加上元搜索引擎的設(shè)計者不能獲取這些搜索引擎的很多技術(shù)細節(jié),對不同的搜索引擎返回結(jié)果不能很好地進行排序。
4.2個性化
評價元搜索引擎質(zhì)量標準主要是看其檢索請求提交機制。[4]在檢索方法的設(shè)置上,提供給用戶更多的自由空間,讓用戶有充分的個性化要求,使用戶可以靈活設(shè)置一些檢索變量,按照自己的意愿合理的組織檢索式。
4.3智能化
一方面,元搜索引擎通過對用戶搜索習慣和興趣的把握,達到自動選擇合適的獨立搜索引擎的效果,從而進行搜索。另一方面,用戶可利用其它方式的輸入查詢(如聲音、圖像、視頻等),實現(xiàn)智能的查詢轉(zhuǎn)換功能,從而得到預(yù)想的結(jié)果。
4.4專業(yè)化
專業(yè)元搜索引擎是個很好的概念,不但網(wǎng)絡(luò)資源可以比普通元搜索引擎挖得更深更多,搜索負擔還小得多,符合網(wǎng)絡(luò)發(fā)展方向的。
5.結(jié)論
搜索引擎已經(jīng)成為信息領(lǐng)域的產(chǎn)業(yè)之一,元搜索引擎作為其中一個新的研究、開發(fā)領(lǐng)域,具有綜合性和挑戰(zhàn)性。相信在未來的互聯(lián)網(wǎng)信息檢索領(lǐng)域,元搜索引擎肯定會有更廣闊的應(yīng)用前景,尤其中文元搜索引擎大多還處于起步階段,發(fā)展余地很大,在不久的將來會有更多、更好的元搜索引擎出現(xiàn)。(作者單位:河北大學管理學院圖書館學系)
參考文獻
[1] 何曉聰,元搜索引擎的理論與實踐[J],現(xiàn)代情報,2004,8(8):34~35
[2] 原福永,元搜索引擎的現(xiàn)狀與發(fā)展[J],計算機工程與設(shè)計,2005,26(12):3279~3280
[3] 晏一平,中外元搜索引擎的比較研究[J],圖書館學研究,2005,22(11):21~23
[4] 王敏,基于主題的個性化元搜索引擎的設(shè)計與實現(xiàn)[J],情報雜志年第,,2005,(7):57~58
本文關(guān)鍵詞:元搜索引擎的現(xiàn)狀與發(fā)展,由筆耕文化傳播整理發(fā)布。
本文編號:179733
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/179733.html