動(dòng)態(tài)Web廣告的智能獲取技術(shù)研究
本文關(guān)鍵詞:動(dòng)態(tài)Web廣告的智能獲取技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)和電子商務(wù)的發(fā)展,目前許多公司都通過(guò)Web廣告來(lái)推廣自己的產(chǎn)品,很多大型互聯(lián)網(wǎng)公司的主要收入來(lái)源也來(lái)自于Web廣告,因此目前對(duì)Web廣告的研究越來(lái)越熱門。為了研究互聯(lián)網(wǎng)廣告的投放機(jī)制,更加科學(xué)的投放廣告,收集互聯(lián)網(wǎng)上的廣告就成為一項(xiàng)非常有意義的工作,但是,目前針對(duì)互聯(lián)網(wǎng)廣告資源采集的研究卻沒有什么成果,因此,本文主要研究如何從海量的互聯(lián)網(wǎng)資源中智能地獲取盡可能多的Web廣告資源。為了快速準(zhǔn)確獲取互聯(lián)網(wǎng)中的廣告,本文主要做了如下幾個(gè)工作:首先,提出了一種基于DOM樹構(gòu)建的動(dòng)態(tài)腳本解析算法,在建立頁(yè)面DOM樹的過(guò)程中,使用文中所設(shè)計(jì)的基于Rhino封裝后的Javascript解析引擎,解析Web頁(yè)面中的Javascript腳本,加載頁(yè)面中的動(dòng)態(tài)數(shù)據(jù),最終得到加載完動(dòng)態(tài)信息的完整頁(yè)面。基于DOM樹構(gòu)建的解析算法在請(qǐng)求動(dòng)態(tài)數(shù)據(jù)的時(shí)候進(jìn)行了合理的資源分配,因此在解析速度方面比其它動(dòng)態(tài)數(shù)據(jù)獲取方式要快。在章節(jié)的最后,通過(guò)實(shí)驗(yàn)和其它的動(dòng)態(tài)數(shù)據(jù)獲取方式進(jìn)行了比較,實(shí)驗(yàn)證明,算法的速度比其它的方式快。然后,設(shè)計(jì)了基于頁(yè)面塊分類的Web廣告資源定位算法,將頁(yè)面中廣告資源的定位問題轉(zhuǎn)化為二分類問題,在頁(yè)面分塊的基礎(chǔ)上,對(duì)頁(yè)面中所有的塊進(jìn)行廣告塊分類,通過(guò)標(biāo)記其中的廣告塊,最終實(shí)現(xiàn)了廣告資源定位的功能;陧(yè)面塊分類的廣告定位算法,使用頁(yè)面中的URL串作為分類的特征,擁有分類速度快,準(zhǔn)確度高等特點(diǎn)。在章節(jié)的后面,對(duì)比了幾種常用的分類算法在廣告定位上的效果,此外,還給出了基于決策樹分類的廣告定位算法在各種類型的網(wǎng)站上所表現(xiàn)出來(lái)的效果,實(shí)踐證明,基于決策樹的廣告資源定位算法效果比其它的算法的效果好。最后,實(shí)現(xiàn)了動(dòng)態(tài)Web廣告的智能獲取系統(tǒng),用系統(tǒng)的實(shí)際效果驗(yàn)證了本文所提方法的有效性。
【關(guān)鍵詞】:Web廣告 Javascript解析 分類 頁(yè)面分塊
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP393.09
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 緒論8-14
- 1.1 研究背景和意義8-9
- 1.2 動(dòng)態(tài)Web廣告獲取研究現(xiàn)狀9-12
- 1.2.1 動(dòng)態(tài)頁(yè)面解析技術(shù)研究現(xiàn)狀9-11
- 1.2.2 Web頁(yè)面分塊研究現(xiàn)狀11-12
- 1.2.3 國(guó)內(nèi)外研究現(xiàn)狀總結(jié)12
- 1.3 課題研究?jī)?nèi)容12-13
- 1.4 本文的組織結(jié)構(gòu)13-14
- 第2章 動(dòng)態(tài)WEB廣告獲取的相關(guān)知識(shí)14-24
- 2.1 動(dòng)態(tài)頁(yè)面解析技術(shù)14-18
- 2.1.1 Javascript介紹14-15
- 2.1.2 Javascript解析引擎概況15
- 2.1.3 Spider Monkey介紹15-16
- 2.1.4 Rhino介紹16-17
- 2.1.5 文檔對(duì)象模型17-18
- 2.2 頁(yè)面分塊技術(shù)18-19
- 2.3 Web廣告的相關(guān)知識(shí)以及投放技術(shù)19-22
- 2.3.1 Web廣告20
- 2.3.2 Web廣告的投放策略20-22
- 2.4 評(píng)價(jià)指標(biāo)及分析22
- 2.5 本章小結(jié)22-24
- 第3章 基于DOM樹構(gòu)建的JAVASCRIPT解析算法24-35
- 3.1 DOM樹構(gòu)建算法24-27
- 3.1.1 DOM無(wú)效節(jié)點(diǎn)分析24-25
- 3.1.2 基于DFA的DOM樹構(gòu)建過(guò)程25-27
- 3.2 動(dòng)態(tài)腳本Javascript解析方法27-30
- 3.2.1 需要映射的DOM對(duì)象分析28
- 3.2.2 基于Rhino改進(jìn)的解析引擎28-30
- 3.3 基于DOM樹構(gòu)建的動(dòng)態(tài)頁(yè)面解析效率分析30-31
- 3.4 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)準(zhǔn)備31
- 3.5 動(dòng)態(tài)頁(yè)面解析實(shí)驗(yàn)與分析31-34
- 3.5.1 基于DOM樹構(gòu)建的動(dòng)態(tài)頁(yè)面解析算法實(shí)驗(yàn)31-32
- 3.5.2 基于DOM樹構(gòu)建的動(dòng)態(tài)頁(yè)面解析算法的對(duì)比實(shí)驗(yàn)32-34
- 3.6 本章小結(jié)34-35
- 第4章 基于頁(yè)面塊分類的WEB廣告定位算法35-47
- 4.1 一種基于連通分量的頁(yè)面分塊方法35-39
- 4.1.1 基本概念介紹35-36
- 4.1.2 節(jié)點(diǎn)距離公式36-38
- 4.1.3 算法核心思想介紹38-39
- 4.2 基于頁(yè)面塊分類的廣告資源定位算法39-42
- 4.2.1 廣告資源定位算法的特征40-41
- 4.2.2 分類算法用于廣告分類的過(guò)程41-42
- 4.3 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)準(zhǔn)備42
- 4.4 Web廣告資源定位實(shí)驗(yàn)與分析42-46
- 4.4.1 各分類算法的對(duì)比實(shí)驗(yàn)43-44
- 4.4.2 基于決策樹分類的廣告資源定位算法實(shí)驗(yàn)44-46
- 4.5 本章小結(jié)46-47
- 第5章 動(dòng)態(tài)WEB廣告智能獲取系統(tǒng)47-54
- 5.1 系統(tǒng)功能與開發(fā)環(huán)境47-48
- 5.2 系統(tǒng)總體設(shè)計(jì)48-49
- 5.3 系統(tǒng)模塊詳細(xì)設(shè)計(jì)49-52
- 5.3.1 Javascript 解析模塊設(shè)計(jì)49-51
- 5.3.2 廣告定位模塊設(shè)計(jì)51-52
- 5.4 系統(tǒng)展示52-53
- 5.5 本章小結(jié)53-54
- 結(jié)論54-55
- 參考文獻(xiàn)55-61
- 致謝61
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 李廣洲,丁金芳,鄧海山;基于Web的化學(xué)計(jì)算機(jī)化自適應(yīng)測(cè)驗(yàn)系統(tǒng)的實(shí)現(xiàn)[J];計(jì)算機(jī)與應(yīng)用化學(xué);2002年05期
2 趙松林;基于Web服務(wù)的企業(yè)應(yīng)用集成[J];微型機(jī)與應(yīng)用;2003年08期
3 杜保華,劉彈,侯成剛,徐光華;XML WebService在基于Web遠(yuǎn)程分析工具集中的應(yīng)用[J];儀器儀表用戶;2004年02期
4 嚴(yán)毅,唐天兵,寧葵;Web服務(wù)實(shí)現(xiàn)開放式的企業(yè)應(yīng)用集成[J];廣西大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年03期
5 邵文田;;去除使用Web服務(wù)尋找適當(dāng)?shù)某绦蝽?xiàng)目[J];電腦迷;2007年15期
6 宋平;;基于Web服務(wù)的企業(yè)應(yīng)用集成[J];福建電腦;2007年10期
7 鄒丹;;基于Web服務(wù)的醫(yī)院信息管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];大眾科技;2007年06期
8 彭玉華;;基于Web的學(xué)生信息管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];民營(yíng)科技;2010年09期
9 陳波;師惠忠;;一種新型Web應(yīng)用安全漏洞統(tǒng)一描述語(yǔ)言[J];小型微型計(jì)算機(jī)系統(tǒng);2011年10期
10 ;借會(huì)獻(xiàn)技——國(guó)際軟件博覽會(huì)中心議題web計(jì)算及應(yīng)用[J];每周電腦報(bào);1997年43期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 劉正濤;毛宇光;應(yīng)毅;;基于Web服務(wù)的分布式Web應(yīng)用框架研究[A];第一屆全國(guó)Web信息系統(tǒng)及其應(yīng)用會(huì)議(WISA2004)論文集[C];2004年
2 戴琦;;Web上的數(shù)據(jù)挖掘[A];全國(guó)計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用年會(huì)論文集(2001)[C];2001年
3 王衛(wèi);;基于Web的數(shù)據(jù)庫(kù)應(yīng)用[A];第十八屆中國(guó)(天津)’2004IT、網(wǎng)絡(luò)、信息技術(shù)、電子、儀器儀表創(chuàng)新學(xué)術(shù)會(huì)議論文集[C];2004年
4 張默;廖湖聲;杜金蓮;;基于Web服務(wù)的開放式地理信息系統(tǒng)的研究[A];2006年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(三)[C];2006年
5 鄭菊艷;續(xù)愛民;;基于WEB模式的科研項(xiàng)目管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];第十四屆中國(guó)科協(xié)年會(huì)第5分會(huì)場(chǎng):綠色船舶與海洋裝備創(chuàng)新發(fā)展及產(chǎn)業(yè)化論壇論文集[C];2012年
6 鄭菊艷;續(xù)愛民;;基于WEB模式的科研項(xiàng)目管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2012年MIS/S&A學(xué)術(shù)交流會(huì)議論文集[C];2012年
7 李勤;;基于WEB的計(jì)算機(jī)模擬病例考試系統(tǒng)在全科醫(yī)師培訓(xùn)實(shí)踐能力測(cè)試中應(yīng)用研究[A];2012年浙江省全科醫(yī)學(xué)學(xué)術(shù)年會(huì)論文匯編[C];2012年
8 黃海林;孫向陽(yáng);;基于Web的大學(xué)物理試題管理系統(tǒng)的設(shè)計(jì)[A];湖北省物理學(xué)會(huì)、武漢物理學(xué)會(huì)成立70周年慶典暨2002年學(xué)術(shù)年會(huì)論文集[C];2002年
9 于莉莉;張毅;;基于Web的人力資源管理系統(tǒng)研究與設(shè)計(jì)[A];2008全國(guó)制造業(yè)信息化標(biāo)準(zhǔn)化論壇論文集[C];2008年
10 李中華;;企業(yè)Web應(yīng)用安全威脅與防護(hù)[A];創(chuàng)新·融合·發(fā)展——?jiǎng)?chuàng)新型煤炭企業(yè)發(fā)展與信息化高峰論壇論文集[C];2010年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 本報(bào)記者 劉繼安;準(zhǔn)備好了嗎?WEB教師[N];中國(guó)教育報(bào);2001年
2 張承東;Web智能考核廣告[N];網(wǎng)絡(luò)世界;2009年
3 科訊;WEB教師——一個(gè)全新職業(yè)的透析[N];科技日?qǐng)?bào);2001年
4 王雅麗;博客社區(qū)齊上陣 銀行借Web 2.0拉攏未來(lái)客戶[N];中國(guó)計(jì)算機(jī)報(bào);2008年
5 本報(bào)記者 黃智軍;Web應(yīng)用呼喚新型安全系統(tǒng)[N];計(jì)算機(jī)世界;2009年
6 居易;WEB教師熱門起來(lái)[N];組織人事報(bào);2001年
7 本報(bào)記者 趙曉濤;四問“Web防御與云安全”[N];網(wǎng)絡(luò)世界;2008年
8 本報(bào)記者 徐恒;手機(jī)瀏覽器:競(jìng)爭(zhēng)不斷加劇 Web大勢(shì)所趨[N];中國(guó)電子報(bào);2009年
9 電腦商報(bào)記者 張戈;Web應(yīng)用安全正當(dāng)時(shí)[N];電腦商報(bào);2010年
10 李晨;Web應(yīng)用安全應(yīng)貫穿生命周期[N];人民郵電;2009年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 孫慧峰;基于協(xié)同過(guò)濾的個(gè)性化Web推薦[D];北京郵電大學(xué);2012年
2 何儒漢;Web圖像的多模融合檢索研究[D];華中科技大學(xué);2007年
3 張建武;面向Web應(yīng)用的安全評(píng)測(cè)技術(shù)研究[D];北京郵電大學(xué);2012年
4 龍慧云;基于進(jìn)程代數(shù)的Web服務(wù)數(shù)據(jù)和組合的形式化方法研究[D];貴州大學(xué);2009年
5 孫濤;面向市場(chǎng)情報(bào)分析的Web實(shí)體事件融合問題研究[D];山東大學(xué);2014年
6 謝琪;基于協(xié)同過(guò)濾與QoS的個(gè)性化Web服務(wù)推薦研究[D];重慶大學(xué);2012年
7 劉方方;Web服務(wù)合成與可用性的若干關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2007年
8 劉曉光;網(wǎng)絡(luò)化制造中Web服務(wù)自動(dòng)組合的若干關(guān)鍵技術(shù)研究[D];上海交通大學(xué);2008年
9 劉國(guó)奇;面向領(lǐng)域QoS約束的Web服務(wù)選取方法[D];東北大學(xué);2011年
10 李杰;基于服務(wù)質(zhì)量的Web服務(wù)模型及應(yīng)用研究[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李林蓉;基于Restful和OSGI的Web應(yīng)用轉(zhuǎn)換容器的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2015年
2 陳彬彬;基于QoS隨機(jī)性的Web服務(wù)質(zhì)量偏離監(jiān)測(cè)方法研究與實(shí)現(xiàn)[D];昆明理工大學(xué);2015年
3 徐超;機(jī)頂盒中基于Web交互方式的設(shè)計(jì)與實(shí)現(xiàn)[D];西南交通大學(xué);2015年
4 張銳;基于Web技術(shù)下的出差管理系統(tǒng)[D];西安工業(yè)大學(xué);2015年
5 游維;基于Rest的Web業(yè)務(wù)系統(tǒng)日志采集與分析系統(tǒng)的研究與開發(fā)[D];山東大學(xué);2015年
6 陶瑩昌;基于Web的校園二手圖書拍賣平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];西華師范大學(xué);2015年
7 周贏;基于WEB的績(jī)效管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年
8 宋平亮;基于MongoDB的航道數(shù)據(jù)Web服務(wù)研究[D];大連海事大學(xué);2015年
9 汪洋;基于web的普通話新聞檢索技術(shù)研究[D];電子科技大學(xué);2014年
10 吳朝云;基于eyeOS的Web操作系統(tǒng)云存儲(chǔ)研究[D];電子科技大學(xué);2014年
本文關(guān)鍵詞:動(dòng)態(tài)Web廣告的智能獲取技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):417375
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/417375.html