基于路徑聚類(lèi)的頁(yè)面訪(fǎng)問(wèn)次序的挖掘
本文選題:聚類(lèi) 切入點(diǎn):路徑聚類(lèi) 出處:《計(jì)算機(jī)工程與設(shè)計(jì)》2013年01期 論文類(lèi)型:期刊論文
【摘要】:為了發(fā)現(xiàn)用戶(hù)的行為模式以實(shí)現(xiàn)Web站點(diǎn)的結(jié)構(gòu)優(yōu)化,提出了基于用戶(hù)訪(fǎng)問(wèn)路徑的K-PathSearch算法。在對(duì)網(wǎng)頁(yè)實(shí)施預(yù)處理后,結(jié)合頁(yè)面鏈接參數(shù),建立用戶(hù)訪(fǎng)問(wèn)事務(wù)處理模型,形成有用數(shù)據(jù)集。提取樣本分析用戶(hù)的興趣度,主要影響因素體現(xiàn)在訪(fǎng)問(wèn)次序、次數(shù)以及停留時(shí)間三方面,并利用重新定義的相似度將興趣取向相類(lèi)似的用戶(hù)劃分為一類(lèi);在此基礎(chǔ)上,定義用戶(hù)訪(fǎng)問(wèn)最長(zhǎng)擬合路徑,進(jìn)而計(jì)算路徑聚類(lèi)中心。經(jīng)計(jì)算,聚類(lèi)數(shù)和聚類(lèi)中心平均長(zhǎng)度增比顯著,表明模型和算法是可行和有效的。
[Abstract]:In order to discover user behavior patterns to optimize the structure of Web site, a K-PathSearch algorithm based on user access path is proposed. Form useful data set. Extract samples to analyze the interest of users, the main factors are the access order, frequency and stay time, and use the redefined similarity to divide the users with similar interest orientation into a class. On this basis, the user visits the longest fitting path and then calculates the path cluster center. The results show that the clustering number and the average length of the cluster center increase significantly, which shows that the model and algorithm are feasible and effective.
【作者單位】: 遼寧科技大學(xué)軟件學(xué)院;
【分類(lèi)號(hào)】:TP393.09;TP18
【共引文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前2條
1 盧群;UIMA架構(gòu)下Web訪(fǎng)問(wèn)信息的研究和應(yīng)用[D];上海交通大學(xué);2007年
2 趙永梅;基于用戶(hù)瀏覽路徑的協(xié)同過(guò)濾推薦技術(shù)研究[D];西安建筑科技大學(xué);2008年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 孫承杰,關(guān)毅;基于統(tǒng)計(jì)的網(wǎng)頁(yè)正文信息抽取方法的研究[J];中文信息學(xué)報(bào);2004年05期
2 劉國(guó)營(yíng);基于路徑聚類(lèi)的Web用戶(hù)訪(fǎng)問(wèn)模式發(fā)現(xiàn)算法[J];情報(bào)雜志;2005年07期
相關(guān)博士學(xué)位論文 前1條
1 宋余慶;醫(yī)學(xué)圖像數(shù)據(jù)挖掘若干技術(shù)研究[D];東南大學(xué);2005年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 徐欽桂;曹可;;一種置信于主流評(píng)價(jià)的P2P環(huán)境信譽(yù)模型[J];計(jì)算機(jī)應(yīng)用研究;2011年07期
2 劉曉明;;基于通訊網(wǎng)絡(luò)安全模糊聚類(lèi)與量子遺傳理論的入侵檢測(cè)研究[J];開(kāi)封大學(xué)學(xué)報(bào);2011年02期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關(guān)會(huì)議論文 前3條
1 王建偉;謝永強(qiáng);;基于遺傳模糊聚類(lèi)的異常檢測(cè)方法[A];全國(guó)第19屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2008年
2 田小麗;鄭康鋒;鈕心忻;;一種基于改進(jìn)K-Medoids算法的網(wǎng)絡(luò)攻擊檢測(cè)技術(shù)[A];2009通信理論與技術(shù)新發(fā)展——第十四屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2009年
3 王云龍;李遜;;基于數(shù)據(jù)場(chǎng)的數(shù)據(jù)挖掘方法在入侵檢測(cè)中的應(yīng)用[A];第十九次全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2004年
相關(guān)博士學(xué)位論文 前3條
1 秦勝君;復(fù)雜適應(yīng)信息系統(tǒng)體系結(jié)構(gòu)的研究與應(yīng)用[D];大連海事大學(xué);2011年
2 李志華;語(yǔ)義屬性數(shù)據(jù)聚類(lèi)/分類(lèi)算法及其在異常檢測(cè)中的應(yīng)用研究[D];江南大學(xué);2009年
3 王Z,
本文編號(hào):1561146
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1561146.html