天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于模糊聚類的Web訪問模式挖掘

發(fā)布時間:2018-01-03 20:41

  本文關(guān)鍵詞:基于模糊聚類的Web訪問模式挖掘 出處:《山西師范大學》2016年碩士論文 論文類型:學位論文


  更多相關(guān)文章: 聚類 Web使用挖掘 評估函數(shù) Web訪問模式


【摘要】:通過發(fā)現(xiàn)web日志數(shù)據(jù)中有用的訪問模式可以幫助我們更好的實現(xiàn)web個性化和web結(jié)構(gòu)再調(diào)整。目前,對web日志挖掘還處于深入探索階段,成熟的理論和方法還沒有完全形成,有待進一步的研究。傳統(tǒng)的關(guān)聯(lián)規(guī)則算法已不能處理日益龐大的數(shù)據(jù)量和多樣的數(shù)據(jù)類型,而基于頻率的web日志挖掘技術(shù)提取出的信息也往往對于最終用戶來說并沒有太大的效用。本文研究了基于模糊聚類的web訪問模式挖掘算法。首先,為了度量不同用戶訪問模式之間的相似度與相異度,等長的模糊向量被用來刻畫用戶瀏覽網(wǎng)頁的時間,其中的每個要素要么為0,要么為模糊語言所表示的模糊變量,該向量不僅能夠體現(xiàn)用戶是否訪問過該網(wǎng)頁,而且還可以刻畫用戶在網(wǎng)頁上的瀏覽時間。數(shù)據(jù)的瀏覽時間用模糊語言變量來表示,這符合人們的正常思維方式,并且可以忽略訪問時間與訪問時間之間的微小差異。由于類與類之間不存在清晰的邊界,因此使用模糊粗糙K-Means算法對這些表征用戶瀏覽特征的用戶模式進行聚類。實驗表明,該方法能夠有效降低時間復雜度和提高系統(tǒng)準確性。其次,考慮到網(wǎng)頁訪問頻率、訪問時間都可以反映用戶興趣,提出了一個新的方法用來解決網(wǎng)頁訪問模式的提取問題,這個方法在聚類的基礎(chǔ)上可高效提取web訪問模式,模式值運用了一個用戶自定義的評估函數(shù)來計算;诓煌瑪(shù)據(jù)集的實驗表明,上述解決方案可以從大規(guī)模數(shù)據(jù)集中高效發(fā)現(xiàn)web訪問模式。
[Abstract]:By discovering useful access patterns in web log data, we can help us better realize web personalization and web structure readjustment. At present, web log mining is still in the stage of further exploration. Mature theories and methods have not been fully formed and need further research. The traditional association rules algorithm can no longer deal with the growing volume of data and various data types. The information extracted by frequency based web log mining technology is not very effective for the end users. This paper studies the web access pattern mining algorithm based on fuzzy clustering. First of all. In order to measure the similarity and dissimilarity between different user access patterns, the equal length fuzzy vector is used to describe the user browsing time, in which each element is either zero. Or it is a fuzzy variable expressed in fuzzy language, which can not only reflect whether the user has visited the web page. It can also describe the browsing time of users on the web. The browsing time of data is represented by fuzzy language variables, which is in line with the normal way of thinking. And the slight difference between access time and access time can be ignored, because there is no clear boundary between class and class. Therefore, fuzzy rough K-Means algorithm is used to cluster these user patterns that represent user browsing characteristics. Experiments show that this method can effectively reduce the time complexity and improve the accuracy of the system. Considering the frequency of web page access, access time can reflect the interest of users, a new method is proposed to solve the problem of web page access pattern extraction. This method can extract web access patterns efficiently on the basis of clustering. The schema values are calculated by a user-defined evaluation function. The above solutions can efficiently discover web access patterns from large-scale datasets.
【學位授予單位】:山西師范大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TP311.13;TP393.09

【相似文獻】

相關(guān)期刊論文 前10條

1 王宇新;田佳;郭禾;吳樹朋;楊元生;;應用模糊方法的設(shè)計模式挖掘策略研究[J];計算機工程與應用;2010年02期

2 陸億紅;王子仁;黃燕;;適合稀少空間特征的同位模式挖掘算法[J];浙江工業(yè)大學學報;2007年04期

3 郭燕萍;辛伯宇;;高選票例外模式挖掘研究與實現(xiàn)[J];電腦開發(fā)與應用;2007年08期

4 徐顯九;楊燕;岳愛萍;;高效的用戶移動模式挖掘方法[J];計算機應用研究;2007年09期

5 李帆;夏士雄;張磊;;基于模糊理論的不確定軌跡模式挖掘[J];微電子學與計算機;2011年08期

6 李中元;邊馥苓;;空間同位模式挖掘研究進展[J];地理空間信息;2013年06期

7 邢東山,沈鈞毅,宋擒豹;用戶瀏覽偏愛模式挖掘算法的研究[J];西安交通大學學報;2002年04期

8 劉洪輝;吳岳芬;;用戶行為模式挖掘問題的研究[J];計算機技術(shù)與發(fā)展;2006年05期

9 付曉翠;許盈;車路;;游戲訪問模式挖掘的研究與應用[J];鄭州大學學報(理學版);2007年04期

10 顏一鳴;郭鑫;李仁發(fā);;一種非確定樹模式挖掘算法[J];計算機工程與應用;2011年15期

相關(guān)會議論文 前10條

1 王肅;杜軍平;高田;;基于本體與知識背景的模式挖掘框架研究[A];2009年中國智能自動化會議論文集(第二分冊)[C];2009年

2 繆裕青;尹東;;分布式存儲結(jié)構(gòu)的頻繁閉合模式挖掘并行算法[A];2007年全國開放式分布與并行計算機學術(shù)會議論文集(下冊)[C];2007年

3 王淼;尚學群;謝華博;李戰(zhàn)懷;;行常量差異共表達基因模式挖掘算法研究[A];第29屆中國數(shù)據(jù)庫學術(shù)會議論文集(B輯)(NDBC2012)[C];2012年

4 劉玉葆;蔡嘉榮;印鑒;黃志蘭;;基于最大訪問模式挖掘的數(shù)據(jù)庫異常行為檢測[A];第二十三屆中國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2006年

5 陸葉;王麗珍;陳紅梅;趙麗紅;;基于可能世界的不確定空間co-location模式挖掘研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學術(shù)會議論文集(B輯)[C];2010年

6 王麗珍;陸葉;陳紅梅;肖清;;基于前綴樹結(jié)構(gòu)的空間co-location模式挖掘算法研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學術(shù)會議論文集(B輯)[C];2010年

7 胡偉成;曹三省;李丹;;一種基于QPop增量時域分割升維的媒體內(nèi)容應用模式挖掘改進算法[A];第二十二屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2005年

8 薛丹;李德敏;裴仁林;;移動計算中基于PrefixSpan算法的用戶移動模式挖掘[A];第二十一屆中國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2004年

9 宋國杰;馬帥;唐世渭;楊冬青;;基于模式挖掘的交通預測模型[A];第十九屆全國數(shù)據(jù)庫學術(shù)會議論文集(技術(shù)報告篇)[C];2002年

10 夏慶;馬元元;孫志揮;;路徑遍歷模式挖掘方法的改進[A];第十六屆全國數(shù)據(jù)庫學術(shù)會議論文集[C];1999年

相關(guān)重要報紙文章 前1條

1 辛苑薇;誰將分享“大數(shù)據(jù)”的智慧盛宴?[N];21世紀經(jīng)濟報道;2012年

相關(guān)博士學位論文 前7條

1 Shafqat Ali Shad;移動用戶軌跡與行為模式挖掘方法研究[D];中國科學技術(shù)大學;2013年

2 錢烽;同位模式挖掘研究[D];浙江大學;2012年

3 劉勇;圖模式挖掘技術(shù)的研究[D];哈爾濱工業(yè)大學;2010年

4 覃桂敏;復雜網(wǎng)絡(luò)模式挖掘算法研究[D];西安電子科技大學;2012年

5 王樂;數(shù)據(jù)流模式挖掘算法及應用研究[D];大連理工大學;2013年

6 林耀進;多源環(huán)境中數(shù)據(jù)預處理與模式挖掘的研究[D];合肥工業(yè)大學;2014年

7 曾海泉;時間序列挖掘與相似性查找技術(shù)研究[D];復旦大學;2003年

相關(guān)碩士學位論文 前10條

1 張子瀚;面向大數(shù)據(jù)的高效用模式挖掘方法研究[D];北方工業(yè)大學;2016年

2 張剛領(lǐng);一種基于團的閉頻繁Co-location模式挖掘方法[D];云南大學;2016年

3 江萬國;基于領(lǐng)域驅(qū)動的空間高效用Co-location模式挖掘[D];云南大學;2016年

4 吳錫宇;基于約束的城市co-location模式挖掘[D];云南大學;2016年

5 馮魯橋;基于C/C++代碼庫的API調(diào)用模式挖掘研究及實現(xiàn)[D];電子科技大學;2016年

6 王敏;云計算環(huán)境下時空軌跡聚集模式挖掘算法研究[D];南京師范大學;2016年

7 艾雙雙;不確定圖數(shù)據(jù)的頻繁子圖模式挖掘算法的研究與實現(xiàn)[D];東北大學;2014年

8 劉曉慶;條件差異模式挖掘算法研究[D];大連理工大學;2016年

9 劉瀟;基于模糊聚類的Web訪問模式挖掘[D];山西師范大學;2016年

10 岳愛萍;基于時間的用戶移動模式挖掘研究[D];西南交通大學;2008年

,

本文編號:1375530

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1375530.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶43d62***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com