天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于聚類(lèi)劃分的關(guān)聯(lián)規(guī)則在Web日志挖掘中的應(yīng)用研究

發(fā)布時(shí)間:2017-06-20 05:09

  本文關(guān)鍵詞:基于聚類(lèi)劃分的關(guān)聯(lián)規(guī)則在Web日志挖掘中的應(yīng)用研究,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著電子商務(wù)、Web服務(wù)以及基于Web的信息系統(tǒng)的快速發(fā)展和壯大,基于Web的組織在日常運(yùn)作中已經(jīng)收集了大量的Web日志信息。分析并發(fā)現(xiàn)這些潛在的規(guī)律及知識(shí),對(duì)于用戶(hù)訪(fǎng)問(wèn)、廣告投放和個(gè)性化服務(wù)等應(yīng)用有著重大的意義。本文將將針對(duì)Web日志中半結(jié)構(gòu)化數(shù)據(jù)集,以發(fā)現(xiàn)Web用戶(hù)訪(fǎng)問(wèn)記錄中潛在的規(guī)律和知識(shí)為目標(biāo)。以Web日志關(guān)聯(lián)規(guī)則挖掘模式為方法,提出了一種改進(jìn)的基于聚類(lèi)劃分的Web日志關(guān)聯(lián)規(guī)則挖掘方法。 Web日志挖掘是指自動(dòng)發(fā)現(xiàn)和分析模式、這些模式來(lái)自于收集的點(diǎn)擊流和相關(guān)數(shù)據(jù)或用戶(hù)與一個(gè)或多個(gè)網(wǎng)站互動(dòng)的結(jié)果。其目標(biāo)是捕捉、建模并分析用戶(hù)與網(wǎng)站交互的行為模式和模型。所發(fā)現(xiàn)的模式經(jīng)常被表示成有著共同需求或興趣的一群用戶(hù)頻繁訪(fǎng)問(wèn)的頁(yè)面、對(duì)象或者資源的集合。而對(duì)整合好的記錄數(shù)據(jù)進(jìn)行分析的類(lèi)型和層次依賴(lài)于分析員的最終目標(biāo)和預(yù)期的結(jié)果。在本文里,,也描述了Web使用記錄挖掘領(lǐng)域里最常用的模式發(fā)現(xiàn)類(lèi)型以及分析技術(shù)在應(yīng)用中的實(shí)踐。 本文工作如下: (1)介紹了Web使用日志挖掘的發(fā)展背景與國(guó)內(nèi)外發(fā)展現(xiàn)狀,總結(jié)了當(dāng)前Web使用日志挖掘技術(shù)的一些算法,并在已有的算法基礎(chǔ)上提出了改進(jìn)的方向; (2)本文再針對(duì)原始Web日志數(shù)據(jù)的半結(jié)構(gòu)化和冗余特性,提出了日志預(yù)處理的一些步驟與方法,針對(duì)預(yù)處理之后的數(shù)據(jù)進(jìn)行了一定的建模,使得后面的挖掘步驟能夠有條不紊的進(jìn)行,也保證了后續(xù)挖掘的數(shù)據(jù)質(zhì)量; (3)針對(duì)Web日志挖掘中的一些關(guān)鍵算法進(jìn)行了詳細(xì)的陳述與分析,對(duì)算法中存在的劣勢(shì)也提出了一些改進(jìn)方向; (4)針對(duì)Web日志中的原始關(guān)聯(lián)規(guī)則Apriori算法提出了基于聚類(lèi)劃分的Apriori算法,克服了原始算法挖掘規(guī)則覆蓋率不夠高的問(wèn)題,并且就原始算法和改進(jìn)的算法做了一個(gè)仿真實(shí)驗(yàn),并針對(duì)實(shí)驗(yàn)后的結(jié)果進(jìn)行了對(duì)比分析,驗(yàn)證了改進(jìn)后的算法在挖掘性能上的提升,最后給出了推薦系統(tǒng)的原型設(shè)計(jì)。
【關(guān)鍵詞】:Web日志挖掘 數(shù)據(jù)建模 聚類(lèi)劃分 Apriori算法
【學(xué)位授予單位】:武漢理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類(lèi)號(hào)】:TP311.13
【目錄】:
  • 摘要4-5
  • ABSTRACT5-7
  • 目錄7-10
  • 第1章 緒論10-13
  • 1.1 課題背景及意義10-11
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀11
  • 1.3 論文主要內(nèi)容和結(jié)構(gòu)11-13
  • 第2章 Web 挖掘與 Web 日志挖掘13-17
  • 2.1 數(shù)據(jù)挖掘與 Web 挖掘13
  • 2.2 Web 挖掘的概述13-14
  • 2.3 Web 日志挖掘的關(guān)鍵元素14-16
  • 2.3.1 Web 日志的來(lái)源14-15
  • 2.3.2 Web 日志的類(lèi)型15
  • 2.3.3 Web 日志挖掘的關(guān)鍵過(guò)程15
  • 2.3.4 Web 日志挖掘的關(guān)鍵應(yīng)用15-16
  • 2.4 本章小結(jié)16-17
  • 第3章 數(shù)據(jù)預(yù)處理與數(shù)據(jù)建模17-28
  • 3.1 數(shù)據(jù)的獲取及預(yù)處理概述17
  • 3.2 Web 日志的不確定性17-18
  • 3.3 Web 日志的預(yù)處理18-22
  • 3.3.1 數(shù)據(jù)清洗18-19
  • 3.3.2 用戶(hù)識(shí)別19-20
  • 3.3.3 會(huì)話(huà)識(shí)別20-21
  • 3.3.4 路徑補(bǔ)充21-22
  • 3.3.5 事務(wù)識(shí)別22
  • 3.4 Web 日志數(shù)據(jù)建;A(chǔ)22-23
  • 3.5 Web 日志數(shù)據(jù)建模的關(guān)鍵元素23-26
  • 3.5.1 Web 頁(yè)面權(quán)重23-24
  • 3.5.2 Web 隱式語(yǔ)義24-26
  • 3.6 日志數(shù)據(jù)倉(cāng)庫(kù)的多維建模26-27
  • 3.7 本章小結(jié)27-28
  • 第4章 Web 日志挖掘算法的研究及改進(jìn)28-41
  • 4.1 Web 日志挖掘算法概述28
  • 4.2 關(guān)聯(lián)規(guī)則和 Apriori 算法的改進(jìn)28-34
  • 4.2.1 關(guān)聯(lián)規(guī)則的基本概念28-29
  • 4.2.2 Apriori 算法的思想及偽碼實(shí)現(xiàn)29-32
  • 4.2.3 Apriori 算法的分析及改進(jìn)32-34
  • 4.3 聚類(lèi)分析和 K-means 算法的改進(jìn)34-39
  • 4.3.1 聚類(lèi)分析的基本概念34-35
  • 4.3.2 聚類(lèi)分析方法的主要分類(lèi)35-36
  • 4.3.3 K-means 算法的思想及偽碼實(shí)現(xiàn)36-37
  • 4.3.4 K-means 算法的分析及改進(jìn)37-39
  • 4.4 K-means 和 Apriori 算法在日志挖掘中的性能評(píng)價(jià)39
  • 4.5 基于 K-means 聚類(lèi)的 Apriori 算法39-40
  • 4.6 本章小結(jié)40-41
  • 第5章 改進(jìn)算法的仿真實(shí)驗(yàn)及結(jié)果分析41-52
  • 5.1 實(shí)驗(yàn)?zāi)康?/span>41
  • 5.2 實(shí)驗(yàn)環(huán)境41-42
  • 5.2.1 實(shí)驗(yàn)平臺(tái)41
  • 5.2.2 實(shí)驗(yàn)數(shù)據(jù)集來(lái)源及特征41-42
  • 5.3 實(shí)驗(yàn)過(guò)程及結(jié)果分析42-51
  • 5.3.1 數(shù)據(jù)準(zhǔn)備階段42-44
  • 5.3.2 算法挖掘階段44-50
  • 5.3.3 實(shí)驗(yàn)結(jié)果分析50-51
  • 5.4 本章小結(jié)51-52
  • 第6章 基于 Web 日志挖掘的原型系統(tǒng)設(shè)計(jì)52-60
  • 6.1 系統(tǒng)總體設(shè)計(jì)52-54
  • 6.1.1 可視化插件服務(wù)53
  • 6.1.2 離線(xiàn)分析服務(wù)53-54
  • 6.1.3 在線(xiàn)推薦服務(wù)54
  • 6.2 功能模塊詳細(xì)設(shè)計(jì)及過(guò)程分析54-58
  • 6.2.1 日志數(shù)據(jù)采集模塊54-56
  • 6.2.2 日志預(yù)處理模塊56-57
  • 6.2.3 日志挖掘模塊57-58
  • 6.2.4 在線(xiàn)推薦服務(wù)模塊58
  • 6.3 系統(tǒng)應(yīng)用場(chǎng)景58-59
  • 6.4 本章小結(jié)59-60
  • 第7章 總結(jié)與展望60-62
  • 7.1 總結(jié)60
  • 7.2 展望60-62
  • 致謝62-63
  • 參考文獻(xiàn)63-64

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前7條

1 肖宏飛;;Web日志挖掘在個(gè)性化網(wǎng)站中的應(yīng)用初探[J];滁州職業(yè)技術(shù)學(xué)院學(xué)報(bào);2011年01期

2 向堅(jiān)持,陳曉紅,劉相濱,徐選華;基于Web Log的數(shù)據(jù)預(yù)處理研究[J];湖南師范大學(xué)自然科學(xué)學(xué)報(bào);2004年04期

3 王旭;劉明剛;;關(guān)聯(lián)規(guī)則研究[J];經(jīng)濟(jì)研究導(dǎo)刊;2010年11期

4 劉立軍;周軍;梅紅巖;;Web使用挖掘的數(shù)據(jù)預(yù)處理[J];計(jì)算機(jī)科學(xué);2007年05期

5 秦東霞;周航;張棟梁;吳文歡;;基于頻繁閉項(xiàng)集的Web日志挖掘算法[J];周口師范學(xué)院學(xué)報(bào);2012年02期

6 李超鋒;;Web使用挖掘數(shù)據(jù)源分析[J];中南民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年04期

7 幸莉仙;黃慧連;;聚類(lèi)與關(guān)聯(lián)規(guī)則在信息舞弊識(shí)別中的應(yīng)用[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2012年12期


  本文關(guān)鍵詞:基于聚類(lèi)劃分的關(guān)聯(lián)規(guī)則在Web日志挖掘中的應(yīng)用研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):464634

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/464634.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)29599***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com