基于內(nèi)容的分布式FTP搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)
本文選題:分布式計(jì)算 切入點(diǎn):FTP檢索 出處:《計(jì)算機(jī)研究與發(fā)展》2011年S3期 論文類型:期刊論文
【摘要】:隨著互聯(lián)網(wǎng)的發(fā)展,FTP作為文件共享的主要方式得到了快速的發(fā)展.和HTTP相比,FTP具有一些不同的特點(diǎn),例如區(qū)域化、封閉化,這些特點(diǎn)增加了FTP站點(diǎn)的索引與查詢工作的難度.目前常見針對(duì)FTP文件索引的工作均是圍繞文件名開展,用戶難以獲取到需要的內(nèi)容信息.iSearch系統(tǒng)作為基于內(nèi)容的分布式FTP搜索引擎,它能夠基于文件內(nèi)容進(jìn)行檢索,具有增量式索引、可插拔配置、負(fù)載均衡、查詢分發(fā)等特點(diǎn),同時(shí)它通過減少索引過程中的網(wǎng)絡(luò)傳輸代價(jià)、索引盡可能多的文本信息和充分利用用戶的反饋,提供更為準(zhǔn)確與穩(wěn)定的查詢服務(wù).
[Abstract]:With the development of the Internet, FTP has been developing rapidly as the main way of file sharing. Compared with HTTP, it has some different characteristics, such as regionalization, closure, etc. These features increase the difficulty of indexing and querying FTP sites. As a distributed FTP search engine based on content, it can be retrieved based on file content. It has the characteristics of incremental index, pluggable configuration, load balancing, query distribution and so on. At the same time, it provides a more accurate and stable query service by reducing the network transmission cost in the indexing process, indexing as much text information as possible and making full use of user feedback.
【作者單位】: 清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系;清華大學(xué)軟件學(xué)院;清華信息科學(xué)與技術(shù)國家實(shí)驗(yàn)室(籌;清華大學(xué));信息系統(tǒng)安全教育部重點(diǎn)實(shí)驗(yàn)室(清華大學(xué));
【基金】:國家自然科學(xué)基金項(xiàng)目(60803016,61073005) 清華信息科學(xué)與技術(shù)國家實(shí)驗(yàn)室(籌)學(xué)科交叉基金項(xiàng)目 國家核高基科技重大專項(xiàng)基金項(xiàng)目(2010ZX01042-002-002-01)
【分類號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 方冰;張一中;;高性能FTP搜索引擎的設(shè)計(jì)[J];南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期
【共引文獻(xiàn)】
相關(guān)期刊論文 前2條
1 謝欣,劉菲菲,李曉明;天網(wǎng)千帆——一種新型文件搜索引擎[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
2 陳金陽,蔣建中,李曉靜,郭軍利,張良勝;FTP文件信息采集過濾系統(tǒng)的研究實(shí)現(xiàn)[J];信息工程大學(xué)學(xué)報(bào);2004年04期
相關(guān)碩士學(xué)位論文 前3條
1 黃素珍;并行多元搜索引擎的研究與設(shè)計(jì)[D];廣西大學(xué);2001年
2 關(guān)峪;基于P2P技術(shù)的即時(shí)通信系統(tǒng)研究與實(shí)現(xiàn)[D];北京交通大學(xué);2007年
3 劉佳;中文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];東華大學(xué);2008年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 王顯芳,杜利民;一種能夠檢測(cè)所有交叉歧義的漢語分詞算法[J];電子學(xué)報(bào);2004年01期
2 謝欣,劉菲菲,李曉明;天網(wǎng)千帆——一種新型文件搜索引擎[J];華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2004年S1期
3 陳華,王繼民,韓近強(qiáng),謝欣;互聯(lián)網(wǎng)上FTP文件的分布特征及啟示[J];計(jì)算機(jī)工程與應(yīng)用;2004年01期
4 彭波;;大規(guī)模搜索引擎檢索系統(tǒng)框架與實(shí)現(xiàn)要點(diǎn)[J];計(jì)算機(jī)工程與科學(xué);2006年03期
5 吳棟,滕育平;中文信息檢索引擎中的分詞與檢索技術(shù)[J];計(jì)算機(jī)應(yīng)用;2004年07期
6 陳瑋,陳玉鵬,石晶,陸達(dá);一種高效的全文檢索索引技術(shù)[J];計(jì)算機(jī)應(yīng)用研究;2004年07期
7 皮鵬,張國印;智能元搜索引擎的研究[J];應(yīng)用科技;2001年08期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳輝林;陳偉;王愛國;關(guān)春喜;;中間件軟件開發(fā)構(gòu)架探討[J];工業(yè)設(shè)計(jì);2011年05期
2 華翔;康鳳舉;;一種分布式的電磁場(chǎng)可視化疊加法[J];西安郵電學(xué)院學(xué)報(bào);2011年04期
3 李靜;高正紅;黃江濤;趙軻;;基于分布式粒子群算法的翼型優(yōu)化設(shè)計(jì)[J];空氣動(dòng)力學(xué)學(xué)報(bào);2011年04期
4 楊愛軍;王紅艷;;分布式雷達(dá)產(chǎn)品生成系統(tǒng)設(shè)計(jì)[J];山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期
5 金欣;王晶;沈奇威;;分布式最小生成樹聚類的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2011年07期
6 ;2011年選題方向和重點(diǎn)欄目組稿內(nèi)容[J];計(jì)算機(jī)應(yīng)用;2011年08期
7 ;2011年選題方向和重點(diǎn)欄目組稿內(nèi)容[J];計(jì)算機(jī)應(yīng)用;2011年S1期
8 蔣杰;;深入淺出數(shù)據(jù)倉庫平臺(tái)統(tǒng)一架構(gòu)[J];程序員;2010年11期
9 顧宏久;;淺談虛擬化與云計(jì)算的關(guān)系[J];科學(xué)咨詢(科技·管理);2011年08期
10 余晟;霍炬;;2000-2010十大最具技術(shù)影響力產(chǎn)品(國外)[J];程序員;2010年12期
相關(guān)會(huì)議論文 前10條
1 段德豐;鐘慧娟;劉肖琳;;分布式計(jì)算在可視化仿真中的應(yīng)用研究[A];’2004系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2004年
2 蘇運(yùn)霖;;網(wǎng)格計(jì)算在電網(wǎng)管理中的應(yīng)用[A];第十一屆全國電工數(shù)學(xué)學(xué)術(shù)年會(huì)論文集[C];2007年
3 馬明全;周明全;耿國華;;分布式大規(guī)模交通網(wǎng)絡(luò)實(shí)時(shí)模擬系統(tǒng)[A];2006年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(三)[C];2006年
4 胡同森;陳慶章;;利用CORBA實(shí)現(xiàn)對(duì)各類關(guān)系數(shù)據(jù)庫的訪問[A];全國第十五屆計(jì)算機(jī)科學(xué)與技術(shù)應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2003年
5 吳鵬;;計(jì)算機(jī)實(shí)時(shí)協(xié)同設(shè)計(jì)系統(tǒng)中同步過程的實(shí)現(xiàn)[A];浙江省電子學(xué)會(huì)2006年學(xué)術(shù)年會(huì)論文集[C];2006年
6 劉曉強(qiáng);顧佳晨;張強(qiáng);;鋼鐵企業(yè)MES平臺(tái)軟件研究[A];中國金屬學(xué)會(huì)2003中國鋼鐵年會(huì)論文集(3)[C];2003年
7 陳曉錚;林新華;李明祿;伍民友;;基于SAGE的分布式虛擬現(xiàn)實(shí)框架[A];2008年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2008年
8 何峰;吳樂南;;分布式測(cè)試系統(tǒng)計(jì)算對(duì)象模型分析[A];2006年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(三)[C];2006年
9 牧之內(nèi)顯文;有次正義;白光一;于戈;金子邦彥;;一個(gè)支持”數(shù)據(jù)集約性”應(yīng)用的并行持久性語言的設(shè)計(jì)與實(shí)現(xiàn)[A];數(shù)據(jù)庫研究與進(jìn)展95——第十三屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集[C];1995年
10 李雪蘋;楊宗煦;;一種基于組件的DSS模型管理方法的設(shè)計(jì)與實(shí)現(xiàn)[A];2003中國控制與決策學(xué)術(shù)年會(huì)論文集[C];2003年
相關(guān)重要報(bào)紙文章 前10條
1 于尚民;IONA SOA:全面改善IT系統(tǒng)[N];通信產(chǎn)業(yè)報(bào);2007年
2 何進(jìn)偉;邁向分布式計(jì)算的C++[N];中國計(jì)算機(jī)報(bào);2002年
3 蒙克;“云”中漫步—解密云計(jì)算[N];網(wǎng)絡(luò)世界;2008年
4 ;IT部門死亡之說夸大其詞?[N];網(wǎng)絡(luò)世界;2008年
5 ;虛擬化主題變奏曲[N];網(wǎng)絡(luò)世界;2007年
6 楊霞清;張亞勤:云計(jì)算,微軟并沒有遲到[N];計(jì)算機(jī)世界;2008年
7 張旭軍;立體云[N];網(wǎng)絡(luò)世界;2010年
8 偉文;幫助企業(yè)實(shí)現(xiàn)隨需應(yīng)變[N];中國計(jì)算機(jī)報(bào);2003年
9 雷陽;傾力高端企業(yè)市場(chǎng) 微軟發(fā)布WCCS 2003[N];電腦商報(bào);2006年
10 ;IONA基于Artix的電信解決方案[N];計(jì)算機(jī)世界;2006年
相關(guān)博士學(xué)位論文 前10條
1 姚鶴嶺;基于REST的GIS Web服務(wù)研究[D];中國人民解放軍信息工程大學(xué);2005年
2 駱正虎;移動(dòng)Agent系統(tǒng)若干關(guān)鍵技術(shù)問題研究[D];合肥工業(yè)大學(xué);2002年
3 程欣;面向環(huán)和結(jié)的分布式死鎖檢測(cè)算法研究[D];哈爾濱工業(yè)大學(xué);2006年
4 謝鯤;布魯姆過濾器查詢算法及其應(yīng)用研究[D];湖南大學(xué);2007年
5 齊德昱;可擴(kuò)展的獨(dú)立分布式應(yīng)用互操作與集成模型[D];華南理工大學(xué);1999年
6 徐向華;可適應(yīng)的實(shí)時(shí)協(xié)同編輯系統(tǒng)若干問題研究[D];浙江大學(xué);2005年
7 李成安;分布式環(huán)境下聚類分析新方法的研究[D];浙江大學(xué);2006年
8 楊晗;端口—連接型產(chǎn)品配置研究與實(shí)現(xiàn)[D];浙江大學(xué);2004年
9 宋勇;基于回路信息表達(dá)的新型聯(lián)想記憶模型與算法研究[D];中國科學(xué)技術(shù)大學(xué);2006年
10 任建武;GRID GIS關(guān)鍵技術(shù)研究[D];南京師范大學(xué);2003年
相關(guān)碩士學(xué)位論文 前10條
1 向曉明;基于分布式蟻群算法的TSP問題研究[D];西南交通大學(xué);2009年
2 王明宇;基于Mesh網(wǎng)絡(luò)連通性問題求解的分布式計(jì)算平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];中南大學(xué);2004年
3 王坤;基于分布式計(jì)算技術(shù)的RP通用軟件系統(tǒng)的應(yīng)用研究[D];南京航空航天大學(xué);2002年
4 吳榮騰;基于DCOM的分布并行計(jì)算系統(tǒng)[D];福州大學(xué);2004年
5 郭春燕;基于SOA的企業(yè)應(yīng)用的研究與實(shí)現(xiàn)[D];大連理工大學(xué);2006年
6 丁大虎;一個(gè)基于Web的分布式的共享數(shù)據(jù)庫的工作流管理系統(tǒng)DFlow[D];天津大學(xué);2005年
7 李明;基于CORBA的態(tài)勢(shì)推演系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2007年
8 李書卉;分布式計(jì)算中的數(shù)據(jù)傳輸與管理的研究與實(shí)現(xiàn)[D];大連理工大學(xué);2004年
9 王友良;基于CORBA中間件的負(fù)載平衡服務(wù)的研究[D];湖南大學(xué);2005年
10 李冰;基于網(wǎng)閘的分布式工作流系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)[D];華中科技大學(xué);2008年
,本文編號(hào):1606028
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1606028.html