搜索引擎中爬蟲的若干問題研究.pdf 全文
本文關(guān)鍵詞:搜索引擎中爬蟲的若干問題研究,由筆耕文化傳播整理發(fā)布。
北京郵電大學(xué)
碩士學(xué)位論文
搜索引擎中爬蟲的若干問題研究
姓名:楊溥
申請(qǐng)學(xué)位級(jí)別:碩士
專業(yè):模式識(shí)別與智能系統(tǒng)
指導(dǎo)教師:郭軍
20090116
北京Illgi乜人學(xué)碩一I-學(xué)位論文
搜索引擎中爬蟲的若干問題研究
摘要
本文針對(duì)爬蟲在當(dāng)前網(wǎng)絡(luò)環(huán)境中衍生的不同的性質(zhì)提出一些針
對(duì)各個(gè)性質(zhì)的爬蟲構(gòu)架方法,,并對(duì)各種方法進(jìn)行實(shí)驗(yàn)分析,主要?jiǎng)?chuàng)新
工作和成果如下:
第一,總結(jié)了搜索引擎中爬蟲的基本性質(zhì)。
介紹了搜索引擎中爬蟲的第一個(gè)基本性質(zhì)多線程斷點(diǎn)續(xù)傳,并從
產(chǎn)生背景,實(shí)現(xiàn)和設(shè)計(jì)優(yōu)點(diǎn)三個(gè)方面進(jìn)行闡述,然后介紹了搜索引擎
中爬蟲的第二個(gè)基本性質(zhì)內(nèi)部網(wǎng)可定制,也并從產(chǎn)生背景,實(shí)現(xiàn)和設(shè)
計(jì)優(yōu)點(diǎn)三個(gè)方面進(jìn)行闡述。
第二,總結(jié)了搜索引擎中爬蟲的特色性質(zhì)。
介紹了搜索引擎中爬蟲的六個(gè)特色性質(zhì):針對(duì)布告欄的數(shù)據(jù)分
類,針對(duì)布告欄的并行式關(guān)聯(lián),針對(duì)論壇的自動(dòng)動(dòng)態(tài)更新,針對(duì)論壇
的同話題定位跟蹤,針對(duì)視頻的可預(yù)覽,針對(duì)視頻的真實(shí)尋址,并分
別從產(chǎn)生背景,實(shí)現(xiàn)和設(shè)計(jì)優(yōu)點(diǎn)三個(gè)方面進(jìn)行詳盡闡述。
第三,本文給出八種不同爬蟲系統(tǒng)的設(shè)計(jì)方案及實(shí)現(xiàn)。
針對(duì)搜索引擎中爬蟲的兩個(gè)基本性質(zhì)和六個(gè)特色性質(zhì)實(shí)現(xiàn)爬蟲
系統(tǒng)的架構(gòu)和給出詳細(xì)的構(gòu)造分析。
第四,本文針對(duì)八種不同爬蟲系統(tǒng)給出實(shí)驗(yàn)及結(jié)論。
對(duì)構(gòu)架出的爬蟲系統(tǒng)進(jìn)行性能試驗(yàn)分析,并給出分析結(jié)論。
關(guān)鍵詞:
信息檢索垂直信息檢索搜索引擎爬蟲基本性質(zhì)
本文關(guān)鍵詞:搜索引擎中爬蟲的若干問題研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):82343
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/82343.html