基于蟻群算法的WEB日志用戶興趣路徑研究
本文選題:web日志挖掘 + 蟻群算法; 參考:《江西師范大學(xué)》2015年碩士論文
【摘要】:隨著信息技術(shù)的高速發(fā)展,互聯(lián)網(wǎng)信息呈指數(shù)級增長,各類網(wǎng)站如雨后春筍一般活躍在我們的生活中。對于網(wǎng)絡(luò)服務(wù)提供商而言,如何在海量的服務(wù)器日志文件中挖掘出用戶的興趣模式,已經(jīng)成為許多公司的研究熱點(diǎn)。利用蟻群算法對web用戶群體的訪問數(shù)據(jù)進(jìn)行挖掘時,把web用戶看成是人工的螞蟻,算法模型展示的螞蟻偏好路徑,就是用戶的興趣路徑,根據(jù)web用戶的興趣路徑,可以適應(yīng)不同客戶需求,優(yōu)化網(wǎng)站拓?fù)浣Y(jié)構(gòu),改善系統(tǒng)運(yùn)行效率,調(diào)整相應(yīng)營銷策略,提高決策的科學(xué)性,從而為企業(yè)創(chuàng)造更大的商業(yè)價值。實踐與分析表明,優(yōu)化的蟻群算法挖掘web用戶興趣路徑相比于MF等傳統(tǒng)算法具有更高的準(zhǔn)確率,在web日志數(shù)據(jù)挖掘領(lǐng)域有更好的推廣應(yīng)用價值。本文的研究基于蟻群算法的web日志用戶興趣路徑展開,主要工作如下:(1)利用web用戶興趣路徑與蟻群覓食行為的相似性,提出了“瀏覽興趣度”的新概念,用于反應(yīng)web用戶訪問站點(diǎn)的興趣程度,并使用瀏覽興趣度給出了基于蟻群算法的web日志用戶興趣路徑挖掘方法。即通過對信息素進(jìn)行全局更新,計算轉(zhuǎn)移概率,設(shè)置轉(zhuǎn)移概率閾值等步驟最終得到用戶興趣路徑。實驗表明該方法是可行的,能夠準(zhǔn)確反應(yīng)用戶興趣路徑。(2)通過對客戶端日志數(shù)據(jù)的預(yù)處理,從日志數(shù)據(jù)中獲取鼠標(biāo)滾動相對次數(shù)、用戶相對瀏覽時間以及頁面點(diǎn)擊率等能夠反映用戶興趣的關(guān)鍵信息。其中鼠標(biāo)滾動相對次數(shù)表示用戶瀏覽web網(wǎng)頁時的鼠標(biāo)滾動次數(shù)占所有頁面鼠標(biāo)滾動次數(shù)的比例,用戶相對瀏覽時間是指頁面總的瀏覽時間占所有頁面平均訪問時間的比例,頁面點(diǎn)擊率表示頁面訪問的次數(shù)占所有頁面訪問次數(shù)的比例,實驗表明,三者構(gòu)成的信息素能夠更準(zhǔn)確地代表用戶對該站點(diǎn)的興趣度。(3)蟻群算法中?、?決定了信息素濃度和意向偏愛度的影響程度,本文重新定義了?、?,通過?、?的自適應(yīng)調(diào)節(jié)對啟發(fā)函數(shù)進(jìn)行調(diào)整,新定義不僅可以加速算法的收斂速度,而且可以避免局部收斂和早熟,實驗證明,該方法提高了算法的搜索效率。
[Abstract]:With the rapid development of information technology, Internet information is growing exponentially. For the network service provider, how to mine the user's interest pattern in the massive server log file has become the research hotspot of many companies. When using ant colony algorithm to mine the access data of web user group, the web user is regarded as an artificial ant. The ant preference path shown in the algorithm model is the user's interest path, according to the interest path of web user. It can meet the needs of different customers, optimize the topological structure of the website, improve the operating efficiency of the system, adjust the corresponding marketing strategy, and improve the scientific nature of the decision, thus creating greater commercial value for the enterprise. Practice and analysis show that the optimized ant colony algorithm has a higher accuracy rate than traditional algorithms such as MF in mining web user interest paths and has a better application value in the field of web log data mining. In this paper, the web log user interest path based on ant colony algorithm is developed. The main work is as follows: 1) based on the similarity between web user interest path and ant colony foraging behavior, a new concept of "browsing interest degree" is proposed. It is used to reflect the degree of interest of web users to visit the site, and the method of web log user interest path mining based on ant colony algorithm is presented by using browsing interest degree. In other words, the path of user interest is obtained by updating pheromone globally, calculating transition probability and setting threshold of transition probability. Experiments show that this method is feasible and can accurately reflect the path of user interest. By preprocessing the client log data, the relative times of mouse scrolling can be obtained from the log data. User relative browsing time and page click rate can reflect the key information of user interest. The relative number of mouse scrolling means that the number of times of mouse scrolling is the proportion of the number of times of mouse scrolling of all pages when users browse web pages, and the relative browsing time of users refers to the proportion of the total browsing time of the page to the average visit time of all pages. Page click rate indicates that the number of page visits is the proportion of all page visits. The experiment shows that the pheromone formed by the three can more accurately represent the user's interest in the site. This paper redefines the effect of pheromone concentration and intention preference. The new definition can not only accelerate the convergence speed of the algorithm, but also avoid local convergence and premature convergence. Experimental results show that the new method improves the search efficiency of the algorithm.
【學(xué)位授予單位】:江西師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP18;TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王杰;使圖像的編輯更加容易[J];中文信息;1998年Z1期
2 王波,姚敏;基于信息抽取的匿名用戶興趣描述[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2004年S1期
3 董全德;;用戶興趣遷移模式與個性化服務(wù)[J];電腦知識與技術(shù)(學(xué)術(shù)交流);2007年17期
4 鄭運(yùn)剛;馬建國;;基于分類的用戶興趣漂移模型[J];情報雜志;2008年01期
5 張濤;;基于瀏覽歷史的用戶興趣提取模型[J];軟件導(dǎo)刊;2009年06期
6 楊杰;陳恩紅;;面向個性化服務(wù)的用戶興趣偏移檢測及處理方法[J];電子技術(shù);2009年11期
7 陳圣兵;李龍澍;紀(jì)霞;;多層次用戶興趣模式的動態(tài)捕捉[J];計算機(jī)工程與應(yīng)用;2009年36期
8 鄭曉健;龐淑英;何英;;一種面向主題的用戶興趣挖掘模型研究[J];昆明學(xué)院學(xué)報;2010年03期
9 花青松;劉海峰;胡錚;;基于基尼系數(shù)的用戶興趣分布模式度量方法[J];計算機(jī)工程;2012年22期
10 孫雨生;劉偉;仇蓉蓉;黃傳慧;;國內(nèi)用戶興趣建模研究進(jìn)展[J];情報雜志;2013年05期
相關(guān)會議論文 前7條
1 趙琦;駱志剛;田文穎;李聰;丁凡;;一種基于負(fù)反饋信息的用戶興趣模型修正方法[A];中國通信學(xué)會第六屆學(xué)術(shù)年會論文集(下)[C];2009年
2 孫靜;郭奇;張志強(qiáng);馮建華;;一種基于面向領(lǐng)域檢索系統(tǒng)的用戶興趣獲取方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年
3 孫鐵利;教巍巍;;基于馬爾科夫模型的用戶興趣導(dǎo)航模型系統(tǒng)(英文)[A];計算機(jī)技術(shù)與應(yīng)用進(jìn)展——全國第17屆計算機(jī)科學(xué)與技術(shù)應(yīng)用(CACIS)學(xué)術(shù)會議論文集(上冊)[C];2006年
4 廖祝華;劉建勛;易愛平;;基于用戶興趣的Web服務(wù)發(fā)現(xiàn)[A];2006年全國開放式分布與并行計算機(jī)學(xué)術(shù)會議論文集(三)[C];2006年
5 李曉黎;史忠植;梁永全;劉福桃;;INTERNET網(wǎng)上一種識別用戶興趣的學(xué)習(xí)方法[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年
6 田萱;杜小勇;;基于SAM模型的用戶興趣表示研究[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2006年
7 王勇;劉奕群;張敏;馬少平;茹立云;;基于用戶興趣分析的網(wǎng)頁生命周期建模(英文)[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
相關(guān)重要報紙文章 前1條
1 中國科學(xué)院計算技術(shù)研究所 王 斌;內(nèi)容為王[N];計算機(jī)世界;2004年
相關(guān)博士學(xué)位論文 前8條
1 張召;在線論壇用戶興趣圖譜發(fā)現(xiàn)與個性化信息推薦[D];華東師范大學(xué);2012年
2 劉淇;基于用戶興趣建模的推薦方法及應(yīng)用研究[D];中國科學(xué)技術(shù)大學(xué);2013年
3 郭巖;網(wǎng)絡(luò)日志中用戶興趣的挖掘及利用[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2004年
4 吳麗輝;個性化的Web信息采集技術(shù)研究[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2005年
5 謝興;社會網(wǎng)絡(luò)中興趣發(fā)現(xiàn)與信息組織的研究[D];復(fù)旦大學(xué);2011年
6 李東勝;基于興趣與保護(hù)隱私的在線社區(qū)推薦技術(shù)研究[D];復(fù)旦大學(xué);2012年
7 陳浩;Web搜索的用戶興趣與智能優(yōu)化研究[D];中南大學(xué);2012年
8 姜邵巍;基于競爭關(guān)系的推薦技術(shù)研究[D];北京郵電大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 陳媛媛;用戶興趣圖譜演化機(jī)制研究[D];武漢理工大學(xué);2014年
2 梁潤庭(Runting Leung);面向微博用戶的興趣識別算法的研究與實現(xiàn)[D];西南交通大學(xué);2015年
3 俞忻峰;新浪微博的數(shù)據(jù)采集和推薦方案研究[D];南京理工大學(xué);2015年
4 楊梅;基于樹型網(wǎng)絡(luò)的多源用戶興趣數(shù)據(jù)融合方法研究[D];四川師范大學(xué);2015年
5 石光蓮;基于形式概念分析的Folksonomy用戶興趣識別研究[D];西南大學(xué);2015年
6 湯文清;微博用戶的興趣及性格分析[D];上海大學(xué);2015年
7 梅佩;基于瀏覽內(nèi)容的用戶興趣研究[D];北京化工大學(xué);2015年
8 張少杰;基于用戶興趣的微博廣告投放系統(tǒng)的設(shè)計與實現(xiàn)[D];山西大學(xué);2015年
9 黃龍偉;基于蟻群算法的WEB日志用戶興趣路徑研究[D];江西師范大學(xué);2015年
10 蔣萍;基于用戶興趣挖掘的個性化模型研究與設(shè)計[D];蘇州大學(xué);2005年
,本文編號:1978743
本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/1978743.html