基于頻繁模式挖掘的網站優(yōu)化策略研究
本文關鍵詞:基于頻繁模式挖掘的網站優(yōu)化策略研究
更多相關文章: Web日志挖掘 頻繁模式挖掘 頁面興趣度 用戶頻繁訪問模式
【摘要】:隨著信息技術的發(fā)展,互聯網的應用得到了很大程度的普及,各種門戶網站層出不窮,這雖然豐富了人們獲得信息的途徑,但同時也帶來了一些問題。對于普通用戶來說,從種類繁多的門戶網站中獲得對自己有價值的信息是比較困難的。因此,如何優(yōu)化網站的拓撲結構和網頁內容,方便用戶在海量的數據中獲得其感興趣的信息,是網站建設者和管理者必須考慮的問題。Web日志挖掘指的是從網站的日志數據中挖掘出有價值的信息。其中,頻繁模式挖掘是Web日志挖掘的一種常用方法,挖掘結果通常是用戶感興趣的瀏覽路徑。利用頻繁模式挖掘方法對網站用戶的瀏覽日志進行挖掘,挖掘結果可以用于網站的優(yōu)化和改進。本文系統的闡述了Web日志挖掘的流程和頻繁模式挖掘的相關內容。針對目前頻繁模式挖掘算法中存在的不足做出改進,并且重點研究了在頻繁模式挖掘過程中結合頁面興趣度算法的應用。最后利用本文的算法對重慶市農業(yè)農村信息化網的日志數據進行挖掘,根據挖掘結果優(yōu)化網站,證實了算法的可行性。論文主要研究內容包括:(1)本文提出了雙約束多支持度頻繁模式挖掘算法(DS_MSA)。簡要分析了目前已有的頻繁模式挖掘算法中存在的問題,據此提出了DS_MSA算法。本算法采用多重最小支持度,對模式的最小支持度采用雙重約束的方式,根據項集權重,確定不同的約束條件。采用這種方式,可以根據模式的重要性對其挖掘,保證挖掘結果全部是用戶感興趣的。通過多數據集測試,本算法不論是挖掘數量還是挖掘質量都較其他算法有較大改進。(2)提出了改進的頁面興趣度計算方法。為了表示不同的網頁對于用戶的意義,本文采用頁面興趣度衡量每個頁面的重要程度。本文提出的頁面興趣度計算模型綜合考慮了可以表現用戶興趣的用戶瀏覽行為、頁面出現頻次、頁面瀏覽速度、頁面入度等多個因素,相較以往的頁面興趣度算法更加科學。通過與用戶的顯性數據對比,也證實了算法的有效性。(3)將頁面興趣度模型與DS_MSA算法結合。將DS_MSA算法應用到Web日志挖掘中,把每個頁面當作一個項目,則需要對每個頁面的重要程度進行刻畫。本文采用頁面興趣度來表現頁面的重要程度。根據頁面興趣度確定頁面的權重,并且根據頁面興趣度來限制DS_MSA算法挖掘過程中最小支持度的約束條件。針對重慶市農業(yè)農村信息網的日志數據,利用基于頁面興趣度的DS_MSA算法進行挖掘,得到用戶的頻繁訪問模式,利用該模式對網站拓撲結構和內容進行優(yōu)化和改進,本文對具體的優(yōu)化策略也進行了簡要的說明。本文的主要創(chuàng)新之處在于,改進了頁面興趣度的計算方法,并且采用雙約束的方式限制挖掘模式的最小支持度,使挖掘結果更加貼近用戶的興趣,在一定程度上改善了原有挖掘算法的組合爆炸和稀有項目缺失的問題。利用挖掘結果,可以根據農業(yè)網站用戶的特點,達到網站優(yōu)化的目標。
【學位授予單位】:西南大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.13;TP393.092
【相似文獻】
中國期刊全文數據庫 前10條
1 劉君強,潘云鶴;一種基于樹的頻繁模式挖掘算法[J];系統工程理論與實踐;2003年05期
2 李清勇 ,秦亮曦 ,施智平 ,史忠植;最大目標頻繁模式挖掘算法研究[J];計算機工程與應用;2004年33期
3 申展,江寶林,唐磊,胡運發(fā);基于互關聯后繼樹的頻繁模式挖掘研究[J];計算機工程;2004年21期
4 戰(zhàn)立強;劉大昕;;小波濾波在時間序列頻繁模式挖掘中的應用[J];哈爾濱工程大學學報;2008年01期
5 何海濤;張世玲;;基于矩陣的頻繁模式挖掘及更新算法[J];計算機科學;2008年03期
6 高琳;覃桂敏;周曉峰;;圖數據中頻繁模式挖掘算法研究綜述[J];電子學報;2008年08期
7 孟凡榮;宋春景;張磊;;一種新的多層頻繁模式挖掘算法[J];微計算機信息;2009年03期
8 孟彩霞;;頻繁模式挖掘的約束算法[J];智能系統學報;2009年02期
9 潘立福;朱利晶;敖富江;杜靜;;基于樹搜索方式的頻繁模式挖掘綜述[J];計算機與信息技術;2009年05期
10 白洪濤;歐陽丹彤;何麗莉;;一種基于圖形處理器的頻繁模式挖掘算法[J];儀器儀表學報;2009年10期
中國重要會議論文全文數據庫 前8條
1 侯俊杰;李春平;;一種基于內存索引的頻繁模式挖掘算法[A];第二十二屆中國數據庫學術會議論文集(研究報告篇)[C];2005年
2 任家東;孫亞非;郭盛;;基于約束的交互式頻繁模式挖掘算法[A];第二十四屆中國數據庫學術會議論文集(研究報告篇)[C];2007年
3 袁晴晴;樓宇波;周皓峰;汪衛(wèi);施伯樂;;基于圖論的頻繁模式挖掘[A];第十九屆全國數據庫學術會議論文集(技術報告篇)[C];2002年
4 韓蒙;張煒;李建中;;RAKING:一種高效的不確定圖K-極大頻繁模式挖掘算法[A];NDBC2010第27屆中國數據庫學術會議論文集A輯一[C];2010年
5 曾濤;向勇;包小源;劉胤田;蔣永光;;中醫(yī)古方挖掘:一種頻繁藥組發(fā)現與功效標注算法[A];第二十五屆中國數據庫學術會議論文集(一)[C];2008年
6 楊慧;劉紅巖;何軍;杜小勇;;一種面向高速度數據流的頻繁模式挖掘算法[A];第二十四屆中國數據庫學術會議論文集(研究報告篇)[C];2007年
7 王聞;謝伙生;;基于FP樹和對稱矩陣的最大頻繁模式挖掘算法[A];第二十五屆中國數據庫學術會議論文集(二)[C];2008年
8 馬秀莉;劉健;童云海;唐世渭;楊冬青;;基于模式索引樹的增量挖掘[A];第二十屆全國數據庫學術會議論文集(技術報告篇)[C];2003年
中國博士學位論文全文數據庫 前10條
1 王倩;基于位值壓縮存儲的頻繁模式挖掘方法及應用研究[D];燕山大學;2016年
2 劉勇;頻繁模式挖掘相關技術研究[D];復旦大學;2007年
3 戰(zhàn)立強;頻繁模式挖掘算法研究[D];哈爾濱工程大學;2007年
4 林曉勇;頻繁模式挖掘和動態(tài)維護的理論與方法研究[D];北京化工大學;2008年
5 鄭曉艷;頻繁模式挖掘技術研究及其在供應鏈管理中的應用[D];天津大學;2010年
6 馬海兵;頻繁模式挖掘相關技術研究[D];復旦大學;2005年
7 張磊;基于約束的頻繁模式挖掘方法以及應用研究[D];中國科學技術大學;2014年
8 阮幼林;頻繁模式挖掘算法及在入侵檢測中的應用研究[D];華中科技大學;2004年
9 耿汝年;加權頻繁模式挖掘算法研究[D];江南大學;2008年
10 楊厚群;半結構化數據頻繁模式挖掘相關技術研究[D];重慶大學;2010年
中國碩士學位論文全文數據庫 前10條
1 朱金華;基于頻繁API使用模式挖掘的軟件缺陷定位方法研究[D];華中科技大學;2014年
2 張浩然;基于頻繁模式挖掘的網站優(yōu)化策略研究[D];西南大學;2016年
3 劉金鳳;頻繁模式挖掘技術的研究及其在實時信號處理中的應用[D];電子科技大學;2016年
4 王陽;頻繁模式挖掘技術及其在電信收入保障系統中的應用研究[D];湖南大學;2010年
5 張健;基于頻繁模式挖掘的不良消息文本檢測方法研究與實現[D];復旦大學;2012年
6 張李一;不確定性數據頻繁模式挖掘算法的研究[D];復旦大學;2011年
7 屈松;圖數據庫頻繁模式挖掘關鍵技術研究[D];黑龍江大學;2012年
8 易娟;基于位序列的頻繁模式挖掘算法研究[D];燕山大學;2012年
9 原繼東;基于陣列的頻繁模式挖掘算法研究[D];北京交通大學;2012年
10 陳艷;數據流的最大頻繁模式挖掘研究[D];西安科技大學;2010年
,本文編號:1157363
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1157363.html