基于Webdriver爬蟲技術的研究

發(fā)布時間：2017-07-16 15:22

本文關鍵詞：基于Webdriver爬蟲技術的研究

【摘要】：本文提出基于Webdriver測試工具的爬蟲程序實現(xiàn),通過實例化一個瀏覽器再通過代碼自動控制其瀏覽網頁實現(xiàn)對網站數(shù)據(jù)的爬取。通過實現(xiàn)點擊事件方法可以很好地解決傳統(tǒng)爬蟲技術中Ajax網站動態(tài)加載引起的數(shù)據(jù)丟失問題。最后以新聞網站為例,實現(xiàn)了本文所設計的爬蟲程序。
【作者單位】：江西財經大學軟件與通信學院;
【關鍵詞】： Webdriver 爬蟲 Web網頁
【分類號】：TP393.092;TP391.1
【正文快照】： 0引言近年來,互聯(lián)網用戶呈現(xiàn)爆發(fā)式增長,網絡上的信息量十分龐大,這些信息單看貌似不怎么起眼,但是當你將這些數(shù)據(jù)按照既定條件篩選整理成所需要的龐大數(shù)據(jù)信息之后,這些信息將被賦予一定的價值。本文設計了基于Webdriver爬蟲技術的新聞網站內容的爬取。Webdriver爬蟲技術是通，

本文編號：549341

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/549341.html

上一篇：基于混合準則的IMRT計劃優(yōu)化
下一篇：基于分數(shù)階偏微分的路面裂縫圖像增強新模型

論文發(fā)表

·知網|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Webdriver爬蟲技術的研究