基于主題相關(guān)的P2P全文搜索引擎的研究.pdf 全文
本文關(guān)鍵詞:基于主題相關(guān)的P2P全文搜索引擎的研究,由筆耕文化傳播整理發(fā)布。
重慶大學(xué)
碩士學(xué)位論文
基于主題相關(guān)的P2P全文搜索引擎的研究
姓名:徐傳運(yùn)
申請(qǐng)學(xué)位級(jí)別:碩士
專業(yè):計(jì)算機(jī)軟件與理論(軟件工程)
指導(dǎo)教師:楊丹
20061001
重慶大學(xué)碩士學(xué)位論文
中文摘要
摘
要
隨著互聯(lián)網(wǎng)的高速發(fā)展和網(wǎng)絡(luò)資源的指數(shù)級(jí)數(shù)增長(zhǎng),搜索引擎的發(fā)展水平在
一定程度上決定著互聯(lián)網(wǎng)資源的利用率,但現(xiàn)有搜索引擎存在的問(wèn)題,促使學(xué)術(shù)
界不斷進(jìn)行各種搜索理論和技術(shù)的研究。P2P全文搜索引擎作為一種全新的搜索方
式,日益受到學(xué)術(shù)界的關(guān)注,各種改進(jìn)的搜索算法被相繼提出,并應(yīng)用于實(shí)踐。
本文分析了國(guó)內(nèi)外有關(guān)搜索引擎的研究現(xiàn)狀,剖析了全文搜索與P2P技術(shù),
闡述了P2P全文搜索技術(shù)的優(yōu)點(diǎn)和缺點(diǎn),指出了當(dāng)前P2P全文搜索引擎存在查全
率的提高將導(dǎo)致搜索時(shí)間較大增長(zhǎng)和網(wǎng)絡(luò)效率明顯降低的問(wèn)題。針對(duì)此問(wèn)題,提
出了“基于k-高頻詞主題相關(guān)性的搜索路由算法”,并把此算法應(yīng)用到基于主題相
關(guān)的P2P全文搜索引擎原型中,通過(guò)實(shí)驗(yàn)驗(yàn)證了算法的可行性和有效性。
本文的主要內(nèi)容有:
1 剖析了全文搜索和P2P技術(shù),這是P2P全文搜索引擎的基礎(chǔ),也是本論文
必須的背景知識(shí);
發(fā)Yooyoo搜索引擎原型的基礎(chǔ);
3 針對(duì)采用聚類算法建立主題的方法不適合P2P環(huán)境的問(wèn)題,提出了以k.高
頻詞向量表示文檔集合主題的方法,該方法具有計(jì)算量小、可伸縮性好、便于主
題相似性計(jì)算等特點(diǎn),因此適用于P2P環(huán)境;
4 針對(duì)
本文關(guān)鍵詞:基于主題相關(guān)的P2P全文搜索引擎的研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):80544
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/80544.html