FTP搜索引擎數(shù)據(jù)采集策略的研究
發(fā)布時(shí)間:2024-03-03 15:15
為了解決傳統(tǒng)FTP Search Engine的檢索時(shí)效性問題,提出了一種有針對性的數(shù)據(jù)采集更新模型。在該模型中,更新頻率被設(shè)計(jì)用于解決在怎樣盡可能降低服務(wù)器負(fù)載壓力的前提下保證較高的平均有效下載比率的問題,而隊(duì)列排序用于解決在一次數(shù)據(jù)采集更新中怎樣確定FTP站點(diǎn)隊(duì)列采集對象順序的策略優(yōu)化。
【文章頁數(shù)】:3 頁
【部分圖文】:
本文編號:3917976
【文章頁數(shù)】:3 頁
【部分圖文】:
圖1FTPSearchEngine檢索結(jié)果可下載性對比
大的隨意性,可能只是臨時(shí)提供文件下載。大多相關(guān)研究認(rèn)為在這個(gè)時(shí)效性問題中數(shù)據(jù)采集更新策略是提高FTPSearchEngine檢索結(jié)果可訪問性的關(guān)鍵性影響因素。在圖1中,X軸為當(dāng)前互聯(lián)網(wǎng)上比較有影響力的FTPSearchEngine,Y軸表示檢索結(jié)果中平均有效下載....
圖2數(shù)據(jù)采集更新頻率與平均有效下載比率的關(guān)系
=在測試評估中,對比各種不同的數(shù)據(jù)采集更新頻率,數(shù)據(jù)采集更新頻率與平均有效下載比率的關(guān)系如圖2所示。我們可以看出數(shù)據(jù)采集更新頻率與平均有效下載比率成正比關(guān)系,數(shù)據(jù)采集更新頻率越高,平均有效下載比率也越高,但隨著數(shù)據(jù)采集更新頻率增長,平均有效下載比率接近一個(gè)臨界值。在實(shí)際運(yùn)行中....
本文編號:3917976
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3917976.html
最近更新
教材專著