天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

一種使用文檔對(duì)象模型的AJAX爬行方案

發(fā)布時(shí)間:2018-08-23 11:23
【摘要】:許多WEB應(yīng)用程序采用AJAX技術(shù)來(lái)增強(qiáng)用戶體驗(yàn)。但是AJAX的一些特性使它在傳統(tǒng)搜索引擎實(shí)施抓取操作時(shí)非常困難。如谷歌的AJAX爬行方案需要網(wǎng)站改變架構(gòu)并添加額外的代碼,因此只被谷歌支持。針對(duì)這種情況,提出了一種基于文檔對(duì)象模型和廣度優(yōu)先爬行算法的AJAX爬行方案,它可以通過(guò)跟蹤由AJAX事件引發(fā)的DOM樹(shù)的變化,來(lái)建立AJAX WEB應(yīng)用程序的狀態(tài)轉(zhuǎn)換圖,進(jìn)而生成原始AJAX WEB應(yīng)用程序的靜態(tài)鏡像站點(diǎn)。實(shí)驗(yàn)證明,該AJAX爬行方案確實(shí)可以爬行AJAX應(yīng)用程序。
[Abstract]:Many WEB applications use AJAX technology to enhance the user experience. But some of the features of AJAX make it very difficult for traditional search engines to implement crawling operations. Google's AJAX crawl, for example, requires the site to change its architecture and add additional code, so it is supported only by Google. In order to solve this problem, a AJAX crawling scheme based on document object model and breadth-first crawling algorithm is proposed. It can build the state transition diagram of AJAX WEB application by tracking the changes of DOM tree caused by AJAX events. In turn, the static mirror site of the original AJAX WEB application is generated. Experimental results show that the AJAX crawling scheme can indeed crawl AJAX applications.
【作者單位】: 徐州工業(yè)職業(yè)技術(shù)學(xué)院;徐州市工業(yè)信息網(wǎng)絡(luò)工程技術(shù)研究中心;
【基金】:2013年徐州市科技發(fā)展基金計(jì)劃(XF13C035) 2012年徐州工業(yè)職業(yè)技術(shù)學(xué)院科研課題(XGY201213)
【分類號(hào)】:TP312.2

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 郭浩;陸余良;劉金紅;;一種基于狀態(tài)轉(zhuǎn)換圖的Ajax爬行算法[J];計(jì)算機(jī)應(yīng)用研究;2009年11期

【共引文獻(xiàn)】

相關(guān)期刊論文 前4條

1 陸亮;李東;;支持AJAX的網(wǎng)絡(luò)爬蟲(chóng)設(shè)計(jì)與實(shí)現(xiàn)[J];智能計(jì)算機(jī)與應(yīng)用;2013年06期

2 楊俊峰;黎建輝;楊風(fēng)雷;;深層網(wǎng)站Ajax頁(yè)面數(shù)據(jù)采集研究綜述[J];計(jì)算機(jī)應(yīng)用研究;2013年06期

3 陳莉莉;張麗;劉正龍;;搜索引擎中基于狀態(tài)的Ajax動(dòng)態(tài)網(wǎng)頁(yè)提取研究[J];計(jì)算機(jī)應(yīng)用與軟件;2013年07期

4 夏天;;Ajax站點(diǎn)數(shù)據(jù)采集研究綜述[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2010年03期

相關(guān)碩士學(xué)位論文 前7條

1 高暉;面向Web2.0社區(qū)的爬蟲(chóng)關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年

2 管翠花;支持Ajax技術(shù)的Deep Web網(wǎng)絡(luò)爬蟲(chóng)模型研究[D];大連海事大學(xué);2011年

3 劉燁輝;基于知識(shí)的應(yīng)用生命周期管理研究[D];中南大學(xué);2011年

4 陳飛;實(shí)時(shí)垂直搜索引擎的爬蟲(chóng)技術(shù)研究[D];大連理工大學(xué);2011年

5 許龍龍;基于Ajax技術(shù)的J2EE應(yīng)用框架的研究與實(shí)現(xiàn)[D];西北大學(xué);2010年

6 劉凡凡;支持AJAX的定址網(wǎng)絡(luò)爬蟲(chóng)系統(tǒng)的研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2013年

7 鐘少君;面向Ajax的搜索引擎技術(shù)研究[D];浙江大學(xué);2012年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 白勇;;基于文檔對(duì)象模型和遠(yuǎn)程腳本技術(shù)的動(dòng)態(tài)目錄樹(shù)設(shè)計(jì)[J];重慶電力高等專科學(xué)校學(xué)報(bào);2003年01期

2 周宇;吳濤;;用C++語(yǔ)言實(shí)現(xiàn)XML文件解析的一種方案[J];光通信研究;2008年04期

3 侯錕;劉斌;;Web頁(yè)面信息抽取技術(shù)的研究[J];荊楚理工學(xué)院學(xué)報(bào);2009年11期

4 逯鵬;XML文檔解析技術(shù)及其應(yīng)用[J];鄭州大學(xué)學(xué)報(bào)(工學(xué)版);2002年04期

5 李世斌,謝慶生;應(yīng)用集成中BOM及其管理的研究[J];計(jì)算機(jī)與現(xiàn)代化;2003年07期

6 侯錕;羅海龍;;Web頁(yè)面表格信息的自主抽取[J];科技廣場(chǎng);2006年04期

7 和萬(wàn)禮;陳應(yīng)東;崔鐵軍;姚慧敏;;基于SVG的網(wǎng)絡(luò)地圖交互研究[J];海洋測(cè)繪;2006年05期

8 李偉;;基于XML+DOM4J的數(shù)據(jù)庫(kù)集成技術(shù)研究[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年05期

9 郭景錄;朱向東;;XML技術(shù)在控制系統(tǒng)圖形組態(tài)數(shù)據(jù)存儲(chǔ)和訪問(wèn)中的應(yīng)用[J];微計(jì)算機(jī)信息;2010年28期

10 朱敏;賈長(zhǎng)云;;FrontPage網(wǎng)頁(yè)制作自動(dòng)閱卷系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)時(shí)代;2010年11期

相關(guān)會(huì)議論文 前3條

1 呂建華;王國(guó)仁;于戈;;XML數(shù)據(jù)的存儲(chǔ)、索引和查詢優(yōu)化技術(shù)及其性能評(píng)價(jià)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2002年

2 商超;李建中;何震瀛;;信息集成系統(tǒng)中HTML2XML的研究[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年

3 朱利君;張友華;李紹穩(wěn);辜麗川;程波波;;基于茶蟲(chóng)害本體的智能檢索系統(tǒng)設(shè)計(jì)[A];紀(jì)念中國(guó)農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國(guó)農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年

相關(guān)重要報(bào)紙文章 前7條

1 ;W3C大力推進(jìn)XML測(cè)試[N];計(jì)算機(jī)世界;2002年

2 本報(bào)記者 周源;IE 9釋放網(wǎng)絡(luò)之美[N];網(wǎng)絡(luò)世界;2010年

3 王如;數(shù)據(jù)庫(kù)與XML[N];網(wǎng)絡(luò)世界;2002年

4 秦林;《XML完全探索》[N];中華讀書(shū)報(bào);2001年

5 錢小聰;移動(dòng)電子商務(wù)系統(tǒng)架構(gòu)[N];人民郵電;2002年

6 ;無(wú)線互聯(lián)發(fā)展的動(dòng)力是什么[N];人民郵電;2001年

7 方正技術(shù)研究院 XML中國(guó)論壇網(wǎng)(www.xml.net.cn) 李超;應(yīng)用程序接口DOM & SAX[N];網(wǎng)絡(luò)世界;2001年

相關(guān)博士學(xué)位論文 前1條

1 王曄;垂直搜索引擎若干問(wèn)題研究[D];復(fù)旦大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 溫琪;基于XML的MIS開(kāi)發(fā)系統(tǒng)前端應(yīng)用的研究[D];昆明理工大學(xué);2002年

2 張煒;基于ODM的本體建模方法研究[D];吉林大學(xué);2006年

3 苗穎;Web頁(yè)面信息自主抽去技術(shù)的研究[D];吉林大學(xué);2006年

4 陳卓;DOM2分析及其在嵌入式系統(tǒng)上的實(shí)現(xiàn)[D];電子科技大學(xué);2007年

5 劉磊;基于PC的數(shù)字電視軟件的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2007年

6 劉玲;一種通用Web信息抽取系統(tǒng)的研究與實(shí)現(xiàn)[D];西南石油大學(xué);2007年

7 楊春濤;基于SMIL與流媒體技術(shù)的多媒體網(wǎng)絡(luò)教學(xué)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工程大學(xué);2008年

8 劉靖僑;XML文檔對(duì)象模型持久化在OSCAR中的實(shí)現(xiàn)及查詢轉(zhuǎn)換[D];浙江大學(xué);2002年

9 唐明;面向移動(dòng)計(jì)算環(huán)境的可擴(kuò)展標(biāo)記語(yǔ)言轉(zhuǎn)換技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2004年

10 曲貴川;基于.NET電子商務(wù)系統(tǒng)的代碼生成器[D];沈陽(yáng)理工大學(xué);2009年

,

本文編號(hào):2198934

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2198934.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b9959***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com