互聯(lián)網(wǎng)網(wǎng)站用戶訪問行為分析
發(fā)布時間:2017-04-04 10:09
本文關(guān)鍵詞:互聯(lián)網(wǎng)網(wǎng)站用戶訪問行為分析,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)的普及程度的變高,網(wǎng)絡(luò)經(jīng)濟競爭日益激烈,用戶對網(wǎng)站的服務(wù)質(zhì)量要求越來越高,網(wǎng)絡(luò)服務(wù)提供商的管理工作也逐漸從盲目走向科學,為此,網(wǎng)站用戶行為分析研究顯得越來越重要。通過用戶行為分析,掌握用戶訪問網(wǎng)站的規(guī)律性特點,將挖掘出的用戶訪問模式應(yīng)用于網(wǎng)站上,在發(fā)現(xiàn)顧客的興趣和偏好,對顧客進行聚類、分類,為顧客提供個性化服務(wù)以及改善網(wǎng)站的建設(shè)等方面都有很重要意義。 識別用戶的點擊行為是分析用戶網(wǎng)站訪問行為的先決條件。而近年來,網(wǎng)絡(luò)成為了廣告炙手可熱的載體。在用戶訪問網(wǎng)站過程中,瀏覽器會自動產(chǎn)生大量的網(wǎng)絡(luò)廣告請求,這對我們識別出用戶點擊行為造成了極大的干擾。因此,如何有效地去除這些廣告干擾已經(jīng)成為重要的研究課題。同時,網(wǎng)頁瀏覽是網(wǎng)絡(luò)用戶最主要的網(wǎng)絡(luò)行為,在準確識別用戶點擊行為的基礎(chǔ)上,研究用戶網(wǎng)站訪問行為同樣具有很重要的現(xiàn)實意義。 本文首先設(shè)計一個網(wǎng)站鏈接樹分析軟件,通過對10個主流領(lǐng)域中的100家媒體網(wǎng)站進行爬蟲分析,發(fā)現(xiàn)了兩種網(wǎng)絡(luò)廣告聯(lián)盟結(jié)構(gòu):二層結(jié)構(gòu)和三層結(jié)構(gòu)。同時也對這10個領(lǐng)域網(wǎng)站的廣告流量進行了分析,得到了網(wǎng)絡(luò)廣告在不同領(lǐng)域網(wǎng)站的分布現(xiàn)狀。 其次,針對目前用戶點擊點識別率不高的問題,研究了一種訪問樹裁剪算法。根據(jù)訪問樹中用戶點擊節(jié)點、網(wǎng)絡(luò)廣告節(jié)點以及非用戶點擊的其他節(jié)點的特點,對訪問樹進行了逐步的裁剪,最終形成了用戶點擊訪問樹。 最后,以企業(yè)網(wǎng)用戶作為分析對象,研究了企業(yè)網(wǎng)用戶在不同類別網(wǎng)站上的訪問樹特點,分析了訪問樹的平均深度,主頁平均訪問次數(shù)等一系列訪問樹指標。同時,還得到了網(wǎng)站點擊量排名等統(tǒng)計分析結(jié)果。
【關(guān)鍵詞】:用戶行為 網(wǎng)絡(luò)廣告 鏈接樹 用戶點擊識別 訪問樹
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP393.092
【目錄】:
- 摘要4-5
- ABSTRACT5-7
- 目錄7-9
- 第一章 緒論9-13
- 1.1 研究背景9-10
- 1.2 論文研究的意義10-11
- 1.3 論文主要工作概述11-12
- 1.4 本章小結(jié)12-13
- 第二章 用戶行為及關(guān)鍵技術(shù)13-23
- 2.1 互聯(lián)網(wǎng)用戶的概念與分類13-14
- 2.2 關(guān)鍵技術(shù)14-17
- 2.2.1 Web應(yīng)用層協(xié)議14-16
- 2.2.2 網(wǎng)絡(luò)報文捕獲16-17
- 2.3 網(wǎng)絡(luò)爬蟲17-20
- 2.3.1 網(wǎng)絡(luò)爬蟲基本流程17-18
- 2.3.2 爬蟲頁面劃分18-19
- 2.3.3 抓取策略19-20
- 2.4 數(shù)據(jù)挖掘20-21
- 2.5 本章小結(jié)21-23
- 第三章 企業(yè)網(wǎng)綜合管理系統(tǒng)23-33
- 3.1 企業(yè)網(wǎng)管理系統(tǒng)架構(gòu)23-26
- 3.1.1 企業(yè)網(wǎng)管理系統(tǒng)工作模式23-25
- 3.1.2 企業(yè)網(wǎng)管理軟件系統(tǒng)架構(gòu)25-26
- 3.2 企業(yè)綜合管理系統(tǒng)的作用26-27
- 3.3 企業(yè)網(wǎng)綜合管理系統(tǒng)主要模塊27-32
- 3.3.1 管理界面27-28
- 3.3.2 網(wǎng)絡(luò)業(yè)務(wù)識別模塊28-29
- 3.3.3 網(wǎng)絡(luò)流量統(tǒng)計模塊29
- 3.3.4 網(wǎng)絡(luò)業(yè)務(wù)排名模塊29-30
- 3.3.5 用戶行為數(shù)據(jù)存儲30-32
- 3.4 本章小結(jié)32-33
- 第四章 基于WEB的在線廣告網(wǎng)絡(luò)的測量與評估33-45
- 4.1 網(wǎng)絡(luò)廣告聯(lián)盟33-34
- 4.2 相關(guān)概念34-36
- 4.2.1 網(wǎng)絡(luò)廣告聯(lián)盟分類34-35
- 4.2.2 網(wǎng)絡(luò)廣告聯(lián)盟產(chǎn)業(yè)鏈35
- 4.2.3 廣告匹配技術(shù)與檢測效果35-36
- 4.3 網(wǎng)站爬蟲分析軟件設(shè)計36-38
- 4.3.1 鏈接樹算法36-38
- 4.3.2 實驗數(shù)據(jù)38
- 4.4 網(wǎng)絡(luò)廣告聯(lián)盟投放廣告機制分析38-42
- 4.4.1 二層結(jié)構(gòu)38-39
- 4.4.2 三層結(jié)構(gòu)39-40
- 4.4.3 網(wǎng)絡(luò)廣告聯(lián)盟分布情況分析40-42
- 4.4.4 網(wǎng)絡(luò)廣告聯(lián)盟分布情況分析42
- 4.5 網(wǎng)絡(luò)廣告流量分析42-44
- 4.5.1 基于鏈接樹-哈希算法的廣告流量分析42-43
- 4.5.2 廣告流量分析結(jié)果43-44
- 4.6 本章小結(jié)44-45
- 第五章 網(wǎng)站用戶點擊識別研究45-51
- 5.1 用戶點擊行為45-46
- 5.1.1 研究現(xiàn)狀45-46
- 5.1.2 用戶點擊行為46
- 5.2 用戶點擊點識別46-48
- 5.2.1 用戶訪問樹裁剪算法47-48
- 5.3 算法驗證與閾值選擇48-50
- 5.3.1 數(shù)據(jù)集48-49
- 5.3.2 用戶點擊識別有效性49-50
- 5.4 本章小結(jié)50-51
- 第六章 用戶網(wǎng)頁瀏覽行為分析51-61
- 6.1 企業(yè)網(wǎng)用戶網(wǎng)站訪問行為分析系統(tǒng)51
- 6.2 企業(yè)網(wǎng)用戶網(wǎng)站訪問行為分析系統(tǒng)模塊51-56
- 6.2.1 企業(yè)網(wǎng)用戶網(wǎng)站訪問行為需求分析51-52
- 6.2.2 數(shù)據(jù)采集52-53
- 6.2.3 數(shù)據(jù)預(yù)處理53-55
- 6.2.4 網(wǎng)站分類55
- 6.2.5 鏈接樹算法55-56
- 6.3 分類網(wǎng)站結(jié)果分析56-57
- 6.3.1 數(shù)據(jù)規(guī)模56
- 6.3.2 平均訪問深度56
- 6.3.3 主頁平均訪問次數(shù)56-57
- 6.3.4 訪問樹深度比例57
- 6.4 統(tǒng)計分析57-58
- 6.4.1 員工在線訪問網(wǎng)頁分布58
- 6.4.2 網(wǎng)站訪問排名58
- 6.5 本章小結(jié)58-61
- 第七章 總結(jié)和展望61-63
- 參考文獻63-65
- 致謝65-67
- 攻讀學位期間發(fā)表的學術(shù)論文目錄67
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前4條
1 但小容;陳軒恕;劉飛;柳德偉;;數(shù)據(jù)挖掘中決策樹分類算法的研究與改進[J];軟件導刊;2009年02期
2 程光,龔儉,丁偉,徐加羚;面向IP流測量的哈希算法研究[J];軟件學報;2005年05期
3 謝逸;余順爭;;基于Web用戶瀏覽行為的統(tǒng)計異常檢測[J];軟件學報;2007年04期
4 趙金仿;趙艷;繆建明;;網(wǎng)頁信息抽取及其自動文本分類的實現(xiàn)[J];計算機技術(shù)與發(fā)展;2008年10期
本文關(guān)鍵詞:互聯(lián)網(wǎng)網(wǎng)站用戶訪問行為分析,由筆耕文化傳播整理發(fā)布。
,本文編號:285345
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/285345.html
最近更新
教材專著