互聯(lián)網(wǎng)上FTP文件的分布特征及啟示
發(fā)布時間:2018-08-29 07:24
【摘要】:北京大學(xué)網(wǎng)絡(luò)實驗室的“天網(wǎng)”文件搜索引擎是國內(nèi)自主開發(fā)的一個海量(FTP和HTTP)文件搜索引擎系統(tǒng),它的數(shù)據(jù)庫維護著1千多萬的FTP文件與目錄信息,索引了國內(nèi)大部分匿名FTP站點。該文對“天網(wǎng)”的海量FTP文件目錄信息的分布特征進行了研究,并分析了其對文件搜索引擎設(shè)計以及FTP服務(wù)器分類管理等方面的某些重要啟示。該文的研究成果將增強人們對互聯(lián)網(wǎng)上文件分布特征的了解,對于設(shè)計和優(yōu)化一個大規(guī)模的文件搜索引擎系統(tǒng)具有積極的指導(dǎo)作用。
[Abstract]:The Skynet File search engine of Peking University Network Laboratory is a large (FTP and HTTP) file search engine system developed independently in China. Its database maintains more than 10 million FTP files and directory information. Index most anonymous FTP sites in China. This paper studies the distribution characteristics of the massive FTP file directory information of Skynet, and analyzes some important implications for the design of file search engine and the classification management of FTP server. The research results in this paper will enhance people's understanding of the distribution characteristics of files on the Internet and play a positive role in the design and optimization of a large-scale file search engine system.
【作者單位】: 北京大學(xué)計算機系網(wǎng)絡(luò)實驗室 北京大學(xué)計算機系網(wǎng)絡(luò)實驗室 北京大學(xué)計算機系網(wǎng)絡(luò)實驗室 北京大學(xué)計算機系網(wǎng)絡(luò)實驗室
【基金】:國家973重點基礎(chǔ)研究發(fā)展規(guī)劃:網(wǎng)絡(luò)環(huán)境下海量信息的理論與方法研究(編號:G1999032706)
【分類號】:TP393.097
[Abstract]:The Skynet File search engine of Peking University Network Laboratory is a large (FTP and HTTP) file search engine system developed independently in China. Its database maintains more than 10 million FTP files and directory information. Index most anonymous FTP sites in China. This paper studies the distribution characteristics of the massive FTP file directory information of Skynet, and analyzes some important implications for the design of file search engine and the classification management of FTP server. The research results in this paper will enhance people's understanding of the distribution characteristics of files on the Internet and play a positive role in the design and optimization of a large-scale file search engine system.
【作者單位】: 北京大學(xué)計算機系網(wǎng)絡(luò)實驗室 北京大學(xué)計算機系網(wǎng)絡(luò)實驗室 北京大學(xué)計算機系網(wǎng)絡(luò)實驗室 北京大學(xué)計算機系網(wǎng)絡(luò)實驗室
【基金】:國家973重點基礎(chǔ)研究發(fā)展規(guī)劃:網(wǎng)絡(luò)環(huán)境下海量信息的理論與方法研究(編號:G1999032706)
【分類號】:TP393.097
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 王建勇,單松巍,雷鳴,謝正茂,李曉明;海量Web搜索引擎系統(tǒng)中用戶行為的分布特征及其啟示[J];中國科學(xué)E輯;2001年04期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 盧效峰,鄭權(quán);基于用戶行為分析的搜索引擎模型[J];北方工業(yè)大學(xué)學(xué)報;2004年03期
2 程軍,劉斌中;數(shù)字圖書館海量文本全文檢索系統(tǒng)[J];大學(xué)圖書館學(xué)報;2002年05期
3 張春元,康耀紅,王曙光,張莉;中文搜索引擎的缺陷與改進[J];海南大學(xué)學(xué)報(自然科學(xué)版);2004年01期
4 王繼民,陳,
本文編號:2210596
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2210596.html
最近更新
教材專著