數(shù)據(jù)挖掘技術(shù)在自適應(yīng)網(wǎng)站中的應(yīng)用研究
發(fā)布時(shí)間:2021-10-23 01:58
當(dāng)前網(wǎng)絡(luò)信息的增長(zhǎng)速度讓人瞠目結(jié)舌,海量的數(shù)據(jù)信息讓每一位網(wǎng)絡(luò)用戶無(wú)所適從。針對(duì)目前這種大數(shù)據(jù)信息的網(wǎng)絡(luò)現(xiàn)狀,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。本文提出了在網(wǎng)站上運(yùn)用數(shù)據(jù)挖掘技術(shù)獲取到網(wǎng)絡(luò)用戶的瀏覽模式等知識(shí),并使用這些規(guī)則、知識(shí)有目的性的提升網(wǎng)站使用效率和親和度。本文的主要內(nèi)容:首先,文章闡述了數(shù)據(jù)挖掘,并對(duì)數(shù)據(jù)挖掘技術(shù)中的日志挖掘進(jìn)行了介紹和分析,著重的分析和研究了數(shù)據(jù)挖掘過(guò)程中的數(shù)據(jù)預(yù)處理操作。第二,本文通過(guò)在傳統(tǒng)的關(guān)聯(lián)規(guī)則算法的基礎(chǔ)上做了改進(jìn),主要的思路是:針對(duì)相對(duì)較低的運(yùn)行效率,通過(guò)減少關(guān)聯(lián)規(guī)則算法對(duì)頻繁、冗余的對(duì)數(shù)據(jù)源掃描,以此提高運(yùn)行效率。第三,文章研究了常用的數(shù)據(jù)挖掘算法、最大向前引用算法、會(huì)話識(shí)別以及EM聚類算法等。這些算法的運(yùn)用能幫助我們跟好、更快捷的獲取我們所可能關(guān)心和需要的信息內(nèi)容,極大的提高了在海量的數(shù)據(jù)中提取我們需要的知識(shí)效率。第四,在上述算法和技術(shù)的基礎(chǔ)上,本文對(duì)自適應(yīng)網(wǎng)站進(jìn)行深入研究,將數(shù)據(jù)挖掘技術(shù)和自適應(yīng)網(wǎng)站系統(tǒng)結(jié)合起來(lái),嘗試制作了自適應(yīng)網(wǎng)站系統(tǒng)的基本框架結(jié)構(gòu)。同時(shí)針對(duì)自適應(yīng)網(wǎng)站系統(tǒng)的存在的一般性不足,給出了一些改進(jìn)意見(jiàn)和建議。第五,本文提出了Cookies技術(shù)和...
【文章來(lái)源】:浙江工業(yè)大學(xué)浙江省
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景和現(xiàn)狀
1.1.1 數(shù)據(jù)挖掘的發(fā)展現(xiàn)狀
1.1.2 自適應(yīng)站點(diǎn)的發(fā)展現(xiàn)狀
1.2 論文主要工作
1.3 論文的組織結(jié)構(gòu)
1.4 本章小結(jié)
第2章 數(shù)據(jù)挖掘技術(shù)
2.1 Internet技術(shù)
2.2 數(shù)據(jù)挖掘
2.2.1 數(shù)據(jù)挖掘分類
2.2.2 數(shù)據(jù)挖掘基本流程
2.3 數(shù)據(jù)挖掘的商業(yè)應(yīng)用
2.4 本章小結(jié)
第3章 日志信息挖掘分析與研究
3.1 日志挖掘
3.1.1 日志數(shù)據(jù)分析
3.1.2 日志數(shù)據(jù)挖掘過(guò)程
3.2 日志挖掘的預(yù)處理過(guò)程分析
3.2.1 日志數(shù)據(jù)清洗
3.2.2 用戶身份和會(huì)話識(shí)別
3.2.3 訪問(wèn)路徑填充
3.3 日志挖掘算法
3.3.1 序列模式挖掘算法
3.3.2 聚類算法
3.3.3 Apriori算法改進(jìn)
3.4 本章小結(jié)
第4章 自適應(yīng)網(wǎng)站系統(tǒng)
4.1 自適應(yīng)網(wǎng)站
4.1.1 工作原理
4.1.2 自適應(yīng)網(wǎng)站框架
4.2 自適應(yīng)網(wǎng)站設(shè)計(jì)原則
4.3 本章小結(jié)
第5章 基于日志挖掘的自適應(yīng)網(wǎng)站實(shí)現(xiàn)
5.1 收集日志數(shù)據(jù)
5.2 日志數(shù)據(jù)處理
5.2.1 數(shù)據(jù)優(yōu)化
5.2.2 用戶身份識(shí)別
5.3 添加鏈接
5.4 算法實(shí)驗(yàn)和結(jié)果分析
5.4.1 Apriori算法實(shí)驗(yàn)分析
5.4.2 EM算法實(shí)驗(yàn)分析
5.5 測(cè)試環(huán)境和結(jié)果分析
5.6 本章小結(jié)
第6章 論文總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間的研究成果
本文編號(hào):3452251
【文章來(lái)源】:浙江工業(yè)大學(xué)浙江省
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景和現(xiàn)狀
1.1.1 數(shù)據(jù)挖掘的發(fā)展現(xiàn)狀
1.1.2 自適應(yīng)站點(diǎn)的發(fā)展現(xiàn)狀
1.2 論文主要工作
1.3 論文的組織結(jié)構(gòu)
1.4 本章小結(jié)
第2章 數(shù)據(jù)挖掘技術(shù)
2.1 Internet技術(shù)
2.2 數(shù)據(jù)挖掘
2.2.1 數(shù)據(jù)挖掘分類
2.2.2 數(shù)據(jù)挖掘基本流程
2.3 數(shù)據(jù)挖掘的商業(yè)應(yīng)用
2.4 本章小結(jié)
第3章 日志信息挖掘分析與研究
3.1 日志挖掘
3.1.1 日志數(shù)據(jù)分析
3.1.2 日志數(shù)據(jù)挖掘過(guò)程
3.2 日志挖掘的預(yù)處理過(guò)程分析
3.2.1 日志數(shù)據(jù)清洗
3.2.2 用戶身份和會(huì)話識(shí)別
3.2.3 訪問(wèn)路徑填充
3.3 日志挖掘算法
3.3.1 序列模式挖掘算法
3.3.2 聚類算法
3.3.3 Apriori算法改進(jìn)
3.4 本章小結(jié)
第4章 自適應(yīng)網(wǎng)站系統(tǒng)
4.1 自適應(yīng)網(wǎng)站
4.1.1 工作原理
4.1.2 自適應(yīng)網(wǎng)站框架
4.2 自適應(yīng)網(wǎng)站設(shè)計(jì)原則
4.3 本章小結(jié)
第5章 基于日志挖掘的自適應(yīng)網(wǎng)站實(shí)現(xiàn)
5.1 收集日志數(shù)據(jù)
5.2 日志數(shù)據(jù)處理
5.2.1 數(shù)據(jù)優(yōu)化
5.2.2 用戶身份識(shí)別
5.3 添加鏈接
5.4 算法實(shí)驗(yàn)和結(jié)果分析
5.4.1 Apriori算法實(shí)驗(yàn)分析
5.4.2 EM算法實(shí)驗(yàn)分析
5.5 測(cè)試環(huán)境和結(jié)果分析
5.6 本章小結(jié)
第6章 論文總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間的研究成果
本文編號(hào):3452251
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/3452251.html
最近更新
教材專著