用戶網(wǎng)絡行為分析系統(tǒng)的設計與實現(xiàn)
本文關(guān)鍵詞:用戶網(wǎng)絡行為分析系統(tǒng)的設計與實現(xiàn)
更多相關(guān)文章: 網(wǎng)絡用戶行為分析 web挖掘 web日志挖掘 Pentaho BI
【摘要】:互聯(lián)網(wǎng)的飛速發(fā)展,用戶數(shù)量的迅速增長,企業(yè)信息化建設的逐步深入,使得用戶信息呈爆炸式的增長。而目前很多企業(yè)對用戶數(shù)據(jù)僅僅停留在簡單的查找,缺乏深層次的信息挖掘和分析。本文通過對企業(yè)在客戶關(guān)系管理系統(tǒng)中積累下來的大量數(shù)據(jù)進行分析,實現(xiàn)了網(wǎng)絡用戶的用戶行為分析系統(tǒng)。 本論文是一篇工程性論文,來源于國內(nèi)知名航運服務公司。利用基于Pentaho BI的商務智能分析平臺,從客戶關(guān)系管理系統(tǒng)中獲取數(shù)據(jù)源,實現(xiàn)用戶信息的分析和管理。為企業(yè)的決策提供科學合理的支持。概括來說本論文實現(xiàn)了以下四方面內(nèi)容: (1)從數(shù)據(jù)挖掘的角度,通過web服務器日志、Web網(wǎng)絡爬蟲技術(shù)獲取用戶網(wǎng)絡行為數(shù)據(jù)。進而對用戶網(wǎng)絡行為原始數(shù)據(jù)過濾、分析和,形成用戶數(shù)據(jù)源,利用數(shù)據(jù)挖掘知識對數(shù)據(jù)源進行挖掘。 (2)本項目的總體流程參照軟件工程的思想,首先對用戶網(wǎng)絡行為系統(tǒng)進行需求分析和總體設計,之后對每個模塊進行詳細設計。 (3)本項目運用了多項計算機技術(shù),包括Linux腳本,MySQL數(shù)據(jù)庫存儲過程、Java的并發(fā)編程等,實現(xiàn)對用戶行為數(shù)據(jù)的自動化采集與整合。 (4)應用商務智能(BI)套件,對數(shù)據(jù)進行多維分析、建模。并利用Report Designer組件制作報表,對數(shù)據(jù)分析結(jié)果進行直觀的展不。 通過以上工作,實現(xiàn)了基于Web日志挖掘的用戶網(wǎng)絡行為分析系統(tǒng),為企業(yè)決策者提供智能的、全面的、多角度的用戶分析支持。
【關(guān)鍵詞】:網(wǎng)絡用戶行為分析 web挖掘 web日志挖掘 Pentaho BI
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP393.09
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第一章 緒論8-13
- 1.1 研究背景和意義8-9
- 1.2 研究現(xiàn)狀9-10
- 1.3 碩士期間相關(guān)工作10-11
- 1.4 論文的研究內(nèi)容和主要工作11
- 1.5 論文結(jié)構(gòu)綜述11-13
- 第二章 相關(guān)理論基礎(chǔ)和關(guān)鍵技術(shù)13-24
- 2.1 用戶網(wǎng)絡行為13-15
- 2.1.1 用戶網(wǎng)絡行為定義13-14
- 2.1.2 用戶網(wǎng)絡行為特征14
- 2.1.3 用戶網(wǎng)絡行為分類14-15
- 2.2 Web挖掘技術(shù)15-17
- 2.2.1 Web挖掘的原理15
- 2.2.2 Web挖掘的分類15-16
- 2.2.3 Web日志挖掘16-17
- 2.3 商務智能軟件17-23
- 2.3.1 開源商務智能軟件的優(yōu)勢分析18-19
- 2.3.2 Pentaho平臺集成化分析19-21
- 2.3.3 Pentaho技術(shù)架構(gòu)分析21-23
- 2.4 本章小結(jié)23-24
- 第三章 系統(tǒng)總體設計24-36
- 3.1 系統(tǒng)需求內(nèi)容24-28
- 3.1.1 運營情況分析24-25
- 3.1.2 用戶基本信息分析25-26
- 3.1.3 用戶訪問信息分析26
- 3.1.4 用戶網(wǎng)絡行為維度分析26-27
- 3.1.5 系統(tǒng)需求總結(jié)27-28
- 3.2 系統(tǒng)架構(gòu)設計28-31
- 3.2.1 系統(tǒng)應用分層28-30
- 3.2.2 系統(tǒng)架構(gòu)設計30-31
- 3.3 系統(tǒng)環(huán)境準備31-35
- 3.4 本章小結(jié)35-36
- 第四章 系統(tǒng)模塊設計36-49
- 4.1 數(shù)據(jù)獲取模塊設計36-39
- 4.1.1 數(shù)據(jù)獲取過程36-38
- 4.1.2 日志規(guī)范化處理38-39
- 4.2 數(shù)據(jù)預處理模塊設計39-43
- 4.2.1 數(shù)據(jù)清理39-40
- 4.2.2 用戶識別40-42
- 4.2.3 會話識別42-43
- 4.3 數(shù)據(jù)存儲模塊設計43-48
- 4.3.1 數(shù)據(jù)表關(guān)系43-44
- 4.3.2 表結(jié)構(gòu)詳情44-46
- 4.3.3 維度表表結(jié)構(gòu)46-48
- 4.4 本章小結(jié)48-49
- 第五章 用戶網(wǎng)絡行為分析系統(tǒng)實現(xiàn)49-64
- 5.1 系統(tǒng)多維建模實現(xiàn)49-55
- 5.1.1 用戶網(wǎng)絡行為分析系統(tǒng)的多維模型構(gòu)建49-53
- 5.1.2 用戶行為分析系統(tǒng)多維建模53-55
- 5.2 報表的實現(xiàn)55-59
- 5.2.1 報表架構(gòu)55-56
- 5.2.2 報表實現(xiàn)流程56-59
- 5.3 報表結(jié)果分析59-63
- 5.3.1 每日注冊量分析59-61
- 5.3.2 每周注冊量趨勢分析61
- 5.3.3 用戶每月注冊趨勢分析61-63
- 5.3.4 注冊用戶地域分布63
- 5.4 本章小結(jié)63-64
- 第六章 論文總結(jié)與展望64-66
- 6.1 論文總結(jié)64
- 6.2 下一步展望64-66
- 參考文獻66-68
- 致謝68-69
- 攻讀碩士學位期間學術(shù)論文發(fā)表情況69
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 宋愛波,胡孔法,董逸生;Web日志挖掘[J];東南大學學報(自然科學版);2002年01期
2 李甲林;;Web數(shù)據(jù)挖掘技術(shù)研究綜述[J];電腦知識與技術(shù);2009年36期
3 歐陽秀平;王攀;饒翔;;基于業(yè)務智能感知和行為分析引擎的用戶行為分析模型[J];電信快報;2008年10期
4 姜良華;陳超泉;;Web日志統(tǒng)計分析系統(tǒng)的設計與實現(xiàn)[J];福建電腦;2008年11期
5 宋擒豹,沈鈞毅;Web日志的高效多能挖掘算法[J];計算機研究與發(fā)展;2001年03期
6 寧紅云;劉金蘭;;基于WEB挖掘的企業(yè)營運能力績效評價模型的研究[J];計算機應用與軟件;2007年10期
7 蔡猷花;張岐山;;Web使用模式挖掘及其在電子商務領(lǐng)域的應用[J];科技管理研究;2005年11期
8 寧建飛;;一種基于Web日志的Web用戶群體和URL聚類算法[J];海南大學學報(自然科學版);2012年04期
9 張傳立;;基于Linux的日志分析[J];科技信息;2011年13期
10 陳榮鑫;付永鋼;陳維斌;;基于Pentaho的商業(yè)智能系統(tǒng)[J];計算機工程與設計;2008年09期
,本文編號:542544
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/542544.html