一種改進(jìn)的主題網(wǎng)絡(luò)蜘蛛搜索算法
本文選題:主題網(wǎng)絡(luò)蜘蛛 切入點(diǎn):Best-First算法 出處:《計(jì)算機(jī)工程與應(yīng)用》2007年10期 論文類型:期刊論文
【摘要】:主題網(wǎng)絡(luò)蜘蛛搜索策略是專業(yè)搜索引擎的核心技術(shù)。但是目前的主題搜索算法往往存在很大貪婪性,難以在全局范圍內(nèi)找到最優(yōu)解。通過比較分析發(fā)現(xiàn)Best-First算法雖然有它的不足,但是它在幾種算法中表現(xiàn)的性能最優(yōu)。故以Best-First算法為基礎(chǔ),提出了BS-BS算法。對(duì)BS-BS算法進(jìn)行性能評(píng)價(jià),發(fā)現(xiàn)應(yīng)用此算法搜索不但“召回率”有所提高,還能在一定程度上找到全局范圍內(nèi)的最優(yōu)解。
[Abstract]:Topic web spider search strategy is the core technology of professional search engine. However, the current topic search algorithm often has great greed, and it is difficult to find the optimal solution in the global scope. Through comparative analysis, it is found that Best-First algorithm has its shortcomings. But it has the best performance in several algorithms. Therefore, based on the Best-First algorithm, the BS-BS algorithm is proposed. The performance evaluation of the BS-BS algorithm is carried out, and it is found that the algorithm search not only improves the recall rate, but also improves the performance of the BS-BS algorithm. The optimal solution in the global scope can be found to a certain extent.
【作者單位】: 燕山大學(xué)信息科學(xué)與工程學(xué)院 燕山大學(xué)信息科學(xué)與工程學(xué)院 燕山大學(xué)信息科學(xué)與工程學(xué)院 燕山大學(xué)信息科學(xué)與工程學(xué)院
【分類號(hào)】:TP301.6
【共引文獻(xiàn)】
相關(guān)期刊論文 前3條
1 徐林昊,楊文柱,張紹華,薛文玲,李天柱;Web信息查詢研究進(jìn)展[J];河北大學(xué)學(xué)報(bào)(自然科學(xué)版);2001年03期
2 喻海飛;汪定偉;;人工生命與人工生命計(jì)算[J];計(jì)算機(jī)工程與應(yīng)用;2007年01期
3 喻海飛,汪定偉;人工生命研究綜述[J];信息與控制;2004年04期
相關(guān)博士學(xué)位論文 前8條
1 李常洪;多Agent合作機(jī)制與合作結(jié)構(gòu)研究[D];天津大學(xué);2003年
2 陳治平;智能搜索引擎理論與應(yīng)用研究[D];湖南大學(xué);2003年
3 茍先太;下一代網(wǎng)絡(luò)中支持多媒體通信任務(wù)的多代理技術(shù)研究[D];西南交通大學(xué);2005年
4 王俊偉;粒子群優(yōu)化算法的改進(jìn)及應(yīng)用[D];東北大學(xué);2006年
5 喻海飛;食物鏈算法及其在供應(yīng)鏈管理中的應(yīng)用[D];東北大學(xué);2005年
6 彭濤;面向?qū)I(yè)搜索引擎的主題爬行技術(shù)研究[D];吉林大學(xué);2007年
7 王輝;基于質(zhì)心具有增量性質(zhì)的主題爬行[D];吉林大學(xué);2007年
8 宗校軍;中文網(wǎng)頁(yè)定題采集及分類研究[D];華中科技大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 羅清磊;引入本體機(jī)制的Web智能信息Agent[D];廣東工業(yè)大學(xué);2003年
2 張必勇;強(qiáng)化學(xué)習(xí)在用戶學(xué)習(xí)中的應(yīng)用研究[D];太原理工大學(xué);2003年
3 楊文柱;基于領(lǐng)域知識(shí)和信息抽取的個(gè)性化Web查詢系統(tǒng)[D];河北大學(xué);2002年
4 盧方國(guó);強(qiáng)化學(xué)習(xí)在個(gè)性化信息Agent的應(yīng)用研究[D];廣東工業(yè)大學(xué);2004年
5 李益;基于多Agent的智能搜索引擎系統(tǒng)研究[D];哈爾濱工程大學(xué);2004年
6 吳平博;基于事件框架的主題相關(guān)文檔智能檢索的初步研究[D];清華大學(xué);2004年
7 王煜;基于頁(yè)面劃分的網(wǎng)面預(yù)測(cè)[D];吉林大學(xué);2005年
8 張玲;智能信息采集搜索策略研究[D];湖南大學(xué);2004年
9 周本達(dá);多Agent系統(tǒng)模型概率框架的研究[D];合肥工業(yè)大學(xué);2005年
10 陳旨明;網(wǎng)絡(luò)信息代理的設(shè)計(jì)與實(shí)現(xiàn)[D];廣東工業(yè)大學(xué);2005年
【相似文獻(xiàn)】
相關(guān)會(huì)議論文 前1條
1 林海霞;原福永;陳金森;;主題網(wǎng)絡(luò)蜘蛛搜索策略貪婪性解決方法[A];2006年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(三)[C];2006年
相關(guān)碩士學(xué)位論文 前1條
1 林海霞;中文專業(yè)搜索引擎優(yōu)化策略研究[D];燕山大學(xué);2006年
,本文編號(hào):1560758
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1560758.html