基于網(wǎng)站內(nèi)容框架的聚焦爬蟲算法的優(yōu)化和實(shí)現(xiàn).pdf 全文 文檔投稿網(wǎng)
本文關(guān)鍵詞:基于網(wǎng)站內(nèi)容框架的聚焦爬蟲算法的優(yōu)化和實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
;皇京交戤
專業(yè)碩士學(xué)位論文
基』網(wǎng)站內(nèi)容框架的聚焦爬蟲算法的優(yōu)化和實(shí)現(xiàn)
作者:董晨曦
導(dǎo)師:張紅延副教授
;交通大學(xué)學(xué)位論文版權(quán)使用授權(quán)書
水學(xué)他論史怍擰完傘丁樣北柬交迎人學(xué)仃天保臥、他川學(xué)位論:塒定。特
授權(quán)匕,變通大學(xué)”以將學(xué)位論文的個(gè)部或部分內(nèi)容編入有關(guān)數(shù)抓庫進(jìn)榆索,
提供閱覽服務(wù),并采影印、縮印或扣描諄復(fù)制手段倮存、匯編以供盤闋和卅閩。
㈣意學(xué)校向家打關(guān)舟 或機(jī)掏送變淪文的復(fù)印融船。
保密的學(xué)位論文在解宙后適刷水授權(quán)醴明
學(xué)位論文作者簽名:董段晦
鋤嗽:以矗土乙
簽字同期:卜年月【
簽字期:。年占川
中雪分糞號(hào): 學(xué)校代碼:
密級(jí):公開
北京交通大學(xué)
專業(yè)碩士學(xué)位論文
基于網(wǎng)站內(nèi)容框架的聚焦爬蟲算法的優(yōu)化和實(shí)現(xiàn)
’
學(xué) 號(hào):
作者姓名:董晨曦
職 稱:副教授
導(dǎo)師姓名:張紅延
學(xué)位級(jí)別:碩士
工程領(lǐng)域:軟件工程
北京交通大學(xué)致謝
本論文的工作是在本人的導(dǎo)師張紅延副教授的悉心指導(dǎo)下完成的,張紅延老
師嚴(yán)謹(jǐn)?shù)牟磳W(xué)態(tài)度和科學(xué)的工作方法極大的激勵(lì)了本人。從課題的選擇到課題的
最終完成.張老師一直都給予了本人極大的幫助,在此向張老師表示衷心的謝意
感謝本人的父母,他們的理解和支持使本人能夠在學(xué)校專心完成本人的學(xué)業(yè)。童埴噩
絲塞奎亟丕堂童些亟±生絲監(jiān)奎
中文摘要
伴隨著互聯(lián)網(wǎng)的急速發(fā)展,網(wǎng)絡(luò)信息量以飛快的速度進(jìn)行增長,搜索引擎成為
人們生活中獲取信息的不可缺少的方式之.任現(xiàn)代搜索引擎中,爬蟲起到了至
關(guān)重要的作用,它是搜索引擎的核心,通過爬蟲獲取足夠數(shù)量和質(zhì)量的網(wǎng)頁后,
搜索引擎才可以依據(jù)索引技術(shù)為用戶提供基于關(guān)鍵字搜索的服務(wù)。然而隨著網(wǎng)頁
的爆發(fā)性增長,具有相同主題的網(wǎng)站同漸增多.如何快速的抓取網(wǎng)頁.更加準(zhǔn)確
的分析
本文關(guān)鍵詞:基于網(wǎng)站內(nèi)容框架的聚焦爬蟲算法的優(yōu)化和實(shí)現(xiàn),,由筆耕文化傳播整理發(fā)布。
本文編號(hào):96570
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/96570.html