Clair:一種基于P2P的BitTorrent關(guān)鍵詞檢索系統(tǒng)
本文關(guān)鍵詞: 對等網(wǎng)絡(luò) 關(guān)鍵詞檢索 比特流 搜索引擎 索引 相關(guān)性排序 出處:《計(jì)算機(jī)工程與應(yīng)用》2006年18期 論文類型:期刊論文
【摘要】:P2P技術(shù)是近年學(xué)術(shù)界和工業(yè)界關(guān)注的焦點(diǎn)。BitTorrent(以下簡稱BT)作為一個P2P文件共享系統(tǒng),用戶量不斷增長,已逐漸成為網(wǎng)絡(luò)帶寬的主要消耗者之一。BT用戶必須到各個發(fā)布站點(diǎn)上查找種子文件,致使用戶查詢的效率比較低。為此,論文提出了基于對等網(wǎng)絡(luò)的針對BT關(guān)鍵詞檢索系統(tǒng)Clair,該系統(tǒng)能夠高效采集網(wǎng)頁上存在的“元信息”文件,快速索引文本以及索引的均勻切分,同時通過針對性的相關(guān)性排序算法,給予用戶較好的查詢結(jié)果。實(shí)驗(yàn)結(jié)果表明,Clair系統(tǒng)具有較好的綜合性能。
[Abstract]:P2P technology is the focus of academia and industry in recent years. BitTorrent (hereinafter referred to as BTT) as a P2P file sharing system, the number of users is growing. It has gradually become one of the main users of network bandwidth. BT users must look up the seed files on each publishing site, resulting in low efficiency of user query. For this reason. This paper proposes a peer-to-peer network based search system for BT keywords, which can efficiently collect "meta-information" files, fast index text and uniform segmentation of index. At the same time, through the pertinence sorting algorithm, the users are given better query results. The experimental results show that the Clair system has better comprehensive performance.
【作者單位】: 清華大學(xué)計(jì)算機(jī)系清華信息科學(xué)與技術(shù)國家實(shí)驗(yàn)室 清華大學(xué)計(jì)算機(jī)系清華信息科學(xué)與技術(shù)國家實(shí)驗(yàn)室
【基金】:國家自然科學(xué)基金資助項(xiàng)目(編號:60373004,60373005,90412006,90412011,60573110,90612016) 國家973基礎(chǔ)研究規(guī)劃資助項(xiàng)目(編號:2004CB318000,2003CB316907)
【分類號】:TP391.3
【正文快照】: 1引言對等網(wǎng)絡(luò)(Peer-to-Peer,簡稱P2P)技術(shù)的流行和發(fā)展,引發(fā)了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。從1999年最早出現(xiàn)的Napster[1],到后來的Gnutella[2],以及到現(xiàn)在流行的BitTorrent[3],P2P共享文件系統(tǒng)的用戶數(shù)量急劇增長,根據(jù)2005年國內(nèi)互聯(lián)網(wǎng)流量的測量統(tǒng)計(jì)[6],P2P流量占據(jù)了互聯(lián)
【共引文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前7條
1 石中金;我國固網(wǎng)運(yùn)營商戰(zhàn)略轉(zhuǎn)型研究[D];北京郵電大學(xué);2006年
2 任肖麗;P2P流量識別的研究與實(shí)現(xiàn)[D];華東師范大學(xué);2007年
3 王金;由飛行案看P2P技術(shù)應(yīng)用中的相關(guān)法律問題[D];蘭州大學(xué);2007年
4 蔡向峰;基于應(yīng)用層的P2P流量識別研究[D];北京郵電大學(xué);2007年
5 肖敏;DHT節(jié)點(diǎn)多域緩存服務(wù)研究[D];重慶大學(xué);2007年
6 楊淼;嵌入式小型安全網(wǎng)關(guān)的研究與實(shí)現(xiàn)[D];解放軍信息工程大學(xué);2007年
7 段小華;P2P服務(wù)提供商版權(quán)間接侵權(quán)問題研究[D];廈門大學(xué);2007年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 曾祥勇;王睿;鄧本江;胡溪媛;;基于對等網(wǎng)絡(luò)的構(gòu)件庫互聯(lián)設(shè)計(jì)[J];計(jì)算機(jī)工程與設(shè)計(jì);2011年06期
2 楊靖宇;張永生;蔡暢;;多用戶全球三維仿真的數(shù)據(jù)組織與調(diào)度研究[J];系統(tǒng)仿真學(xué)報;2011年09期
3 樊宇;王宇楠;王俊杰;曹奇;;論文檢索系統(tǒng)及檢索算法設(shè)計(jì)[J];價值工程;2011年21期
4 白曉亮;;數(shù)據(jù)庫關(guān)鍵詞檢索中候選元組集連接樹生成算法的研究[J];電腦知識與技術(shù);2011年16期
5 黃軍偉;何元飛;;基于插值編碼的分塊倒排文檔索引的網(wǎng)頁關(guān)鍵詞檢索[J];科教新報(教育科研);2011年27期
6 張永興;孫四明;張峰;;基于本體的信息檢索系統(tǒng)研究[J];微計(jì)算機(jī)信息;2011年07期
7 樊紅梅;;淺析網(wǎng)絡(luò)操作系統(tǒng)[J];電腦知識與技術(shù);2011年17期
8 肖離離;;淺議基于RSS技術(shù)的博客搜索引擎[J];電子商務(wù);2011年09期
9 孫掌印;;搜索引擎Yahoo與Google的比較分析[J];科技情報開發(fā)與經(jīng)濟(jì);2011年17期
10 張鼐;;一種基于語義Web的數(shù)字圖書館模型研究[J];圖書館學(xué)研究;2011年17期
相關(guān)會議論文 前10條
1 劉喜平;萬常選;劉德喜;;基于語義返回XML關(guān)鍵詞檢索結(jié)果[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
2 李求實(shí);王秋月;王珊;;平衡IO和CPU的XML關(guān)鍵詞檢索技術(shù)[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(A輯)[C];2009年
3 劉勘;劉萍;;一種對學(xué)術(shù)論文關(guān)鍵詞權(quán)值的動態(tài)調(diào)整方法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2007年
4 張常有;秦曉靜;李文清;曹元大;;一種面向?qū)Φ染W(wǎng)絡(luò)的Web服務(wù)快速查找算法[A];2009年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(上冊)[C];2009年
5 張洪偉;陳萍;;基于socket的網(wǎng)絡(luò)虛擬實(shí)驗(yàn)室的研究[A];2005通信理論與技術(shù)新進(jìn)展——第十屆全國青年通信學(xué)術(shù)會議論文集[C];2005年
6 曹摯;姜淑娟;;P2P文件污染及其檢測方法研究[A];2006年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(三)[C];2006年
7 向永清;鄧志鴻;于航;高寧;;面向XML文檔的二級索引技術(shù)及其在XML關(guān)鍵詞檢索中的應(yīng)用研究[A];第26屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2009年
8 葉偉芳;;基于P2P的搜索技術(shù)和方法研究[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
9 羅駿;歐智堅(jiān);;一種高效的語音關(guān)鍵詞檢索系統(tǒng)[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會'2005論文集(下冊)[C];2005年
10 陳德華;黃曉虎;樂嘉錦;葛孝X;;基于DHT對等網(wǎng)絡(luò)的軟件構(gòu)件共享系統(tǒng)研究[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2005年
相關(guān)重要報紙文章 前10條
1 沈建苗 編譯;Windows Vista RC1新鮮體驗(yàn)[N];計(jì)算機(jī)世界;2006年
2 譚嘯;盤活政府網(wǎng)站的信息資源[N];計(jì)算機(jī)世界;2006年
3 陳立娜;互聯(lián)網(wǎng)上的圖像搜索引擎[N];網(wǎng)絡(luò)世界;2000年
4 本報記者 劉昕;云計(jì)算角逐人性化創(chuàng)新[N];國際商報;2011年
5 ;技術(shù)突破信息化教育的新動向[N];中國電腦教育報;2006年
6 李剛;王志東:我IM我怕誰?[N];中國計(jì)算機(jī)報;2006年
7 文/宋建東;協(xié)同應(yīng)用關(guān)鍵詞[N];計(jì)算機(jī)世界;2004年
8 肖勝;點(diǎn)擊科技的制造業(yè)解決方案[N];中華工商時報;2004年
9 本報記者 齊柳明;紙質(zhì)資料數(shù)字化突破識別率難關(guān)[N];光明日報;2006年
10 紅兵;KM-Server強(qiáng)化文件共享[N];中國計(jì)算機(jī)報;2001年
相關(guān)博士學(xué)位論文 前10條
1 陳漢華;基于對等網(wǎng)絡(luò)的大規(guī)模內(nèi)容檢索研究[D];華中科技大學(xué);2010年
2 陳漢華;基于對等網(wǎng)絡(luò)的大地規(guī)模內(nèi)容檢索研究[D];華中科技大學(xué);2010年
3 黎方正;關(guān)系數(shù)據(jù)庫的關(guān)鍵詞檢索技術(shù)研究[D];中南大學(xué);2010年
4 吳宇;對等網(wǎng)絡(luò)內(nèi)容搜索及索引緩存研究[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2006年
5 史慶偉;基于小世界模型的P2P網(wǎng)絡(luò)文本檢索[D];天津大學(xué);2008年
6 賀德強(qiáng);網(wǎng)絡(luò)化制造中設(shè)備層信息交互平臺的研究[D];重慶大學(xué);2004年
7 陳德華;基于對等網(wǎng)絡(luò)的分布式構(gòu)件庫系統(tǒng)若干關(guān)鍵技術(shù)研究[D];東華大學(xué);2006年
8 葉作亮;基于制造網(wǎng)格的制造資源管理若干關(guān)鍵技術(shù)研究[D];浙江大學(xué);2006年
9 武浩;資源共享網(wǎng)絡(luò)中語義信息管理與檢索研究[D];華中科技大學(xué);2007年
10 徐婕;基于對等網(wǎng)絡(luò)的資源搜索策略的研究[D];華中科技大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 施聰;對等網(wǎng)絡(luò)中基于關(guān)鍵字的搜索[D];上海交通大學(xué);2008年
2 王芳;對等網(wǎng)絡(luò)有效資源搜索技術(shù)及其應(yīng)用研究[D];山東師范大學(xué);2006年
3 尹佐寧;對等網(wǎng)絡(luò)文件共享系統(tǒng)索引結(jié)構(gòu)的研究[D];華中科技大學(xué);2006年
4 董克欽;基于P2P服務(wù)的搜索引擎研究[D];浙江大學(xué);2006年
5 李雄;一種對等網(wǎng)絡(luò)文件共享算法的大規(guī)模仿真與分析[D];華中科技大學(xué);2008年
6 陸聰慧;計(jì)算機(jī)協(xié)同感知模型的研究與實(shí)現(xiàn)[D];大連交通大學(xué);2010年
7 王曉華;移動Agent技術(shù)在對等計(jì)算中的應(yīng)用研究[D];西北工業(yè)大學(xué);2006年
8 苗坤;JXTA架構(gòu)下的協(xié)同辦公系統(tǒng)的應(yīng)用研究[D];重慶大學(xué);2008年
9 趙飛;對等網(wǎng)環(huán)境下的語義檢索研究[D];西安電子科技大學(xué);2009年
10 熊晶;P2P環(huán)境下基于Ontology的搜索引擎[D];中國海洋大學(xué);2006年
,本文編號:1479171
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1479171.html