基于R語(yǔ)言的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)研究
本文關(guān)鍵詞:基于R語(yǔ)言的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)研究
更多相關(guān)文章: R語(yǔ)言 網(wǎng)絡(luò)爬蟲(chóng) 數(shù)據(jù)采集
【摘要】:網(wǎng)頁(yè)數(shù)據(jù)的采集主要是指采集網(wǎng)頁(yè)中相關(guān)的文本、數(shù)據(jù)信息以及鏈接信息,該文分析網(wǎng)頁(yè)數(shù)據(jù)采集中基本方法和工作原理,通過(guò)系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)網(wǎng)頁(yè)數(shù)據(jù)采集,并實(shí)現(xiàn)基于R語(yǔ)言利用RCurl包進(jìn)行網(wǎng)絡(luò)爬蟲(chóng)。
【作者單位】: 西安歐亞學(xué)院SIGMA數(shù)據(jù)分析研究所;
【關(guān)鍵詞】: R語(yǔ)言 網(wǎng)絡(luò)爬蟲(chóng) 數(shù)據(jù)采集
【分類(lèi)號(hào)】:TP391.3
【正文快照】: 大量的數(shù)據(jù)能夠讓傳統(tǒng)行業(yè)更好地了解客戶(hù)需求,提供個(gè)性化的服務(wù)。定制化服務(wù)的關(guān)鍵是數(shù)據(jù)。如果說(shuō)第三次工業(yè)革命將是一個(gè)從大規(guī)模制造向大規(guī)模定制演進(jìn)的過(guò)程,那么大數(shù)據(jù)時(shí)代則是另一個(gè)科技革命拐點(diǎn)。數(shù)據(jù)能告訴人們,每一個(gè)客戶(hù)的消費(fèi)傾向,他們想要什么,喜歡什么,每個(gè)人的需
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 王艷紅;周軍;;基于Hadoop的網(wǎng)絡(luò)爬蟲(chóng)技術(shù)研究[J];吉林工程技術(shù)師范學(xué)院學(xué)報(bào);2014年08期
2 王映,于滿(mǎn)泉,李盛韜,王斌,余智華;JavaScript引擎在動(dòng)態(tài)網(wǎng)頁(yè)采集技術(shù)中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2004年02期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 王麗娜;李懷;趙磊;;基于模擬用戶(hù)的Ajax Web自動(dòng)化測(cè)試模型[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2016年03期
2 王巍;張皋鵬;;基于網(wǎng)絡(luò)的交互式服裝定制設(shè)計(jì)系統(tǒng)的開(kāi)發(fā)[J];絲綢;2015年05期
3 鄧炳光;石志廣;張治中;;LTE網(wǎng)絡(luò)S1接口用戶(hù)行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];電視技術(shù);2015年09期
4 張躍;;基于網(wǎng)頁(yè)的數(shù)據(jù)采集技術(shù)研究[J];福建電腦;2014年06期
5 陸亮;李東;;支持AJAX的網(wǎng)絡(luò)爬蟲(chóng)設(shè)計(jì)與實(shí)現(xiàn)[J];智能計(jì)算機(jī)與應(yīng)用;2013年06期
6 林振洲;;VFP技術(shù)在網(wǎng)頁(yè)數(shù)據(jù)采集中的應(yīng)用——以高校數(shù)字資源建設(shè)為例[J];計(jì)算機(jī)光盤(pán)軟件與應(yīng)用;2013年14期
7 馬凱;蔡皖東;姚燁;;Web2.0環(huán)境下SQL注入漏洞注入點(diǎn)提取方法[J];計(jì)算機(jī)技術(shù)與發(fā)展;2013年03期
8 李華波;吳禮發(fā);賴(lài)海光;鄭成輝;黃康宇;;有效的爬行Ajax頁(yè)面的網(wǎng)絡(luò)爬行算法[J];電子科技大學(xué)學(xué)報(bào);2013年01期
9 王益強(qiáng);趙靜;;網(wǎng)頁(yè)文本數(shù)據(jù)自動(dòng)采集方法綜述[J];信息與電腦(理論版);2012年09期
10 錢(qián)程;陽(yáng)小蘭;;一種支持Ajax框架的網(wǎng)絡(luò)爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)與數(shù)字工程;2012年04期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 戚欣;;基于本體的主題網(wǎng)絡(luò)爬蟲(chóng)設(shè)計(jì)[J];武漢理工大學(xué)學(xué)報(bào);2009年03期
2 彭軻;廖聞劍;;基于瀏覽器服務(wù)的網(wǎng)絡(luò)爬蟲(chóng)[J];硅谷;2009年04期
3 王江紅;朱麗君;李彩虹;;一種新型網(wǎng)絡(luò)爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[J];微計(jì)算機(jī)信息;2010年03期
4 孫立偉;何國(guó)輝;吳禮發(fā);;網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的研究[J];電腦知識(shí)與技術(shù);2010年15期
5 楊靖韜;陳會(huì)果;;對(duì)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的研究[J];科技創(chuàng)業(yè)月刊;2010年10期
6 于成龍;于洪波;;網(wǎng)絡(luò)爬蟲(chóng)技術(shù)研究[J];東莞理工學(xué)院學(xué)報(bào);2011年03期
7 李志義;;網(wǎng)絡(luò)爬蟲(chóng)的優(yōu)化策略探略[J];現(xiàn)代情報(bào);2011年10期
8 焦賽美;;網(wǎng)絡(luò)爬蟲(chóng)技術(shù)的研究[J];瓊州學(xué)院學(xué)報(bào);2011年05期
9 宋海洋;劉曉然;錢(qián)?;;一種新的主題網(wǎng)絡(luò)爬蟲(chóng)爬行策略[J];計(jì)算機(jī)應(yīng)用與軟件;2011年11期
10 王娟;吳金鵬;;網(wǎng)絡(luò)爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[J];軟件導(dǎo)刊;2012年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前4條
1 夏詔杰;郭力;李曉霞;;化學(xué)主題網(wǎng)絡(luò)爬蟲(chóng)的研究[A];第十屆全國(guó)計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2009年
2 李楠;谷利澤;鈕心忻;;用于XSS掃描的網(wǎng)絡(luò)爬蟲(chóng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2010年全國(guó)通信安全學(xué)術(shù)會(huì)議論文集[C];2010年
3 張軍;于浩;內(nèi)野寬治;;UGC中產(chǎn)品評(píng)論信息的挖掘[A];內(nèi)容計(jì)算的研究與應(yīng)用前沿——第九屆全國(guó)計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議論文集[C];2007年
4 徐劍;柯貴明;;網(wǎng)絡(luò)爬蟲(chóng)技術(shù)在搜索引擎中的應(yīng)用[A];全國(guó)第21屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2010)暨全國(guó)第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2010年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 陶俊文;基于Heritrix框架的專(zhuān)業(yè)鎮(zhèn)信息網(wǎng)絡(luò)爬蟲(chóng)系統(tǒng)[D];華南理工大學(xué);2015年
2 馬漢超;基于主題網(wǎng)絡(luò)爬蟲(chóng)的汽車(chē)行業(yè)多元信息web系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];西南交通大學(xué);2015年
3 李威;基于交通流量圖的交通信息提取技術(shù)研究[D];長(zhǎng)安大學(xué);2015年
4 朱嶸良;分布式并行環(huán)境下的網(wǎng)絡(luò)爬蟲(chóng)研究[D];中央民族大學(xué);2015年
5 周思華;股票系統(tǒng)之熱門(mén)話(huà)題發(fā)現(xiàn)子系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年
6 丁杰;基于網(wǎng)絡(luò)爬蟲(chóng)的虛假網(wǎng)頁(yè)主動(dòng)智能檢測(cè)[D];華北電力大學(xué);2015年
7 唐華棟;網(wǎng)頁(yè)防抓取系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年
8 白劍飛;基于層次主題模型的網(wǎng)絡(luò)新聞匯聚[D];浙江大學(xué);2015年
9 袁野;企業(yè)內(nèi)網(wǎng)搜索引擎關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
10 滕以芳;基于本體的多媒體素材網(wǎng)絡(luò)爬蟲(chóng)設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2015年
,本文編號(hào):630039
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/630039.html