基于用戶(hù)上網(wǎng)日志的數(shù)據(jù)挖掘技術(shù)研究
發(fā)布時(shí)間:2017-04-11 13:09
本文關(guān)鍵詞:基于用戶(hù)上網(wǎng)日志的數(shù)據(jù)挖掘技術(shù)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:伴隨著數(shù)據(jù)挖掘的技術(shù)的成熟發(fā)展,運(yùn)用數(shù)據(jù)挖掘技術(shù)來(lái)對(duì)校園網(wǎng)進(jìn)行研究具有很大的應(yīng)用價(jià)值,對(duì)用戶(hù)的上網(wǎng)日志分析是網(wǎng)絡(luò)研究和管理的主要方向。本文研究的主要內(nèi)容是利用校園網(wǎng)學(xué)生的上網(wǎng)行為數(shù)據(jù)進(jìn)行分析,挖掘出用戶(hù)的上網(wǎng)時(shí)段、用戶(hù)訪問(wèn)網(wǎng)站類(lèi)型等上網(wǎng)行為特征。旨在通過(guò)分析學(xué)生的行為日志記錄的規(guī)律,掌握和預(yù)測(cè)校園網(wǎng)的運(yùn)行狀況,為校園網(wǎng)絡(luò)建設(shè)和管理給出科學(xué)的依據(jù)。論文所做的工作具體如下:首先對(duì)系統(tǒng)分析工作進(jìn)行概述,進(jìn)行校園網(wǎng)中用戶(hù)的上網(wǎng)日志數(shù)據(jù)的采集,通過(guò)數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換等得到適合分析的數(shù)據(jù)屬性集合,將這些數(shù)據(jù)存放在數(shù)據(jù)庫(kù)中以供挖掘使用。然后對(duì)本文所采用的關(guān)聯(lián)規(guī)則Apriori算法做分析與研究,分析算法的不足之處。引用負(fù)關(guān)聯(lián)規(guī)則,將兩種算法結(jié)合在一起,分析其可行性,并且提出自己的改進(jìn)思想,改進(jìn)算法只需要掃描一次數(shù)據(jù)庫(kù),大大提高了算法的運(yùn)行速度,并通過(guò)實(shí)驗(yàn)對(duì)比驗(yàn)證了改進(jìn)算法的有效性。最后對(duì)校園網(wǎng)的學(xué)生上網(wǎng)行為從多方面進(jìn)行研究,包括分時(shí)段在線人數(shù)分析、用戶(hù)訪問(wèn)網(wǎng)站分析、不同類(lèi)別用戶(hù)上網(wǎng)行為分析等。其中,在對(duì)用戶(hù)訪問(wèn)網(wǎng)站分析和不同類(lèi)別用戶(hù)上網(wǎng)分析時(shí),利用Weka數(shù)據(jù)挖掘平臺(tái)進(jìn)行分析,得到相關(guān)用戶(hù)的上網(wǎng)特點(diǎn)。通過(guò)對(duì)學(xué)生的上網(wǎng)行為分析,可以對(duì)校園網(wǎng)的優(yōu)化給出合理的建議。此研究也可以應(yīng)用在商業(yè)領(lǐng)域上,為顧客提供個(gè)性化服務(wù),增強(qiáng)企業(yè)的競(jìng)爭(zhēng)力。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 用戶(hù)上網(wǎng)行為 關(guān)聯(lián)規(guī)則 Apriori算法
【學(xué)位授予單位】:貴州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP311.13
【目錄】:
- 摘要4-5
- Abstract5-7
- 第一章 緒論7-13
- 1.1 課題的研究背景7-8
- 1.2 課題的研究意義8-9
- 1.3 國(guó)內(nèi)外的研究現(xiàn)狀9-11
- 1.3.1 國(guó)內(nèi)研究現(xiàn)狀9-10
- 1.3.2 國(guó)外研究現(xiàn)狀10-11
- 1.4 本文的研究?jī)?nèi)容和文章結(jié)構(gòu)11-12
- 1.4.1 主要的研究?jī)?nèi)容11-12
- 1.4.2 文章結(jié)構(gòu)12
- 1.4.3 論文的主要?jiǎng)?chuàng)新點(diǎn)12
- 1.5 本章小結(jié)12-13
- 第二章 校園網(wǎng)用戶(hù)上網(wǎng)日志分析與數(shù)據(jù)挖掘13-25
- 2.1 網(wǎng)絡(luò)用戶(hù)行為的概念及分類(lèi)13
- 2.2 校園網(wǎng)概況13-14
- 2.3 數(shù)據(jù)挖掘技術(shù)分析14-17
- 2.3.1 數(shù)據(jù)挖掘的過(guò)程15
- 2.3.2 數(shù)據(jù)挖掘的主要方法15-17
- 2.3.3 數(shù)據(jù)挖掘的常用工具17
- 2.4 分析工作概述17-18
- 2.4.1 分析的基本目標(biāo)17-18
- 2.4.2 分析的步驟18
- 2.5 數(shù)據(jù)的采集18-21
- 2.5.1 數(shù)據(jù)來(lái)源18-20
- 2.5.2 數(shù)據(jù)抽取20-21
- 2.6 數(shù)據(jù)預(yù)處理21-24
- 2.6.1 數(shù)據(jù)清理21-22
- 2.6.2 數(shù)據(jù)集成22
- 2.6.3 數(shù)據(jù)變換22-24
- 2.7 本章小結(jié)24-25
- 第三章 關(guān)聯(lián)規(guī)則算法的研究及改進(jìn)25-48
- 3.1 關(guān)聯(lián)規(guī)則Apriori算法25-33
- 3.1.1 Apriori算法的原理25-26
- 3.1.2 Apriori算法的描述26-28
- 3.1.3 關(guān)聯(lián)規(guī)則的生成28-29
- 3.1.4 Apriori算法實(shí)例29-32
- 3.1.5 Apriori算法的缺點(diǎn)32-33
- 3.2 負(fù)關(guān)聯(lián)規(guī)則算法33-36
- 3.2.1 負(fù)關(guān)聯(lián)規(guī)則的提出33-34
- 3.2.2 負(fù)關(guān)聯(lián)規(guī)則的基本定義34-36
- 3.3 基于Apriori算法的負(fù)關(guān)聯(lián)規(guī)則算法36-39
- 3.3.1 算法描述36-38
- 3.3.2 算法驗(yàn)證實(shí)驗(yàn)38-39
- 3.4 改進(jìn)的Apriori算法39-47
- 3.4.1 改進(jìn)算法的思路39-40
- 3.4.2 算法的描述40-42
- 3.4.3 實(shí)例分析42-44
- 3.4.4 實(shí)驗(yàn)結(jié)果分析44-47
- 3.5 本章小結(jié)47-48
- 第四章 數(shù)據(jù)挖掘在校園網(wǎng)用戶(hù)上網(wǎng)日志分析的應(yīng)用48-71
- 4.1 用戶(hù)上網(wǎng)日志應(yīng)用類(lèi)型統(tǒng)計(jì)48-50
- 4.2 Weka平臺(tái)介紹50-55
- 4.2.1 Weka平臺(tái)的特點(diǎn)50-53
- 4.2.2 數(shù)據(jù)挖掘流程53-55
- 4.3 分時(shí)段在線人數(shù)分析55-58
- 4.3.1 實(shí)驗(yàn)分析55-57
- 4.3.2 結(jié)論57-58
- 4.4 用戶(hù)訪問(wèn)網(wǎng)站分析58-63
- 4.4.1 數(shù)據(jù)轉(zhuǎn)換58
- 4.4.2 建立模型58-62
- 4.4.3 關(guān)聯(lián)規(guī)則產(chǎn)生62-63
- 4.5 不同類(lèi)別用戶(hù)上網(wǎng)日志的行為分析63-70
- 4.5.1 數(shù)據(jù)處理63-64
- 4.5.2 文科類(lèi)用戶(hù)上網(wǎng)日志分析64-66
- 4.5.3 理科類(lèi)用戶(hù)上網(wǎng)日志分析66-68
- 4.5.4 工科類(lèi)用戶(hù)上網(wǎng)日志分析68-70
- 4.6 本章小結(jié)70-71
- 第五章 總結(jié)與展望71-73
- 5.1 本文的主要工作總結(jié)71-72
- 5.2 未來(lái)工作展望72-73
- 致謝73-74
- 參考文獻(xiàn)74-77
- 圖版77-79
- 附錄79-80
本文關(guān)鍵詞:基于用戶(hù)上網(wǎng)日志的數(shù)據(jù)挖掘技術(shù)研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):299159
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/299159.html
最近更新
教材專(zhuān)著