Web日志中會(huì)話識(shí)別方法研究與改進(jìn)
本文關(guān)鍵詞:Web日志中會(huì)話識(shí)別方法研究與改進(jìn)
更多相關(guān)文章: Web日志挖掘 會(huì)話識(shí)別 頁面興趣 閥值
【摘要】:隨著Internet的不斷發(fā)展,越來越多的組織、企業(yè)、機(jī)構(gòu)通過網(wǎng)絡(luò)與用戶交流或交易。為了留住已有用戶,爭取潛在客戶,必須提高用戶體驗(yàn),使自己的網(wǎng)站更加實(shí)用,更加有吸引力。為了實(shí)現(xiàn)這個(gè)目標(biāo),必須知道用戶興趣所在,根據(jù)用戶的訪問特點(diǎn)來優(yōu)化網(wǎng)站結(jié)構(gòu),發(fā)展個(gè)性化服務(wù)。通過對(duì)用戶的訪問記錄,即Web日志進(jìn)行分析可以發(fā)現(xiàn)潛在的用戶訪問模式,從而來改善網(wǎng)站結(jié)構(gòu),發(fā)展個(gè)性化服務(wù),提升用戶體驗(yàn)。Web日志挖掘是Web數(shù)據(jù)挖掘的一個(gè)重要子領(lǐng)域,從Web日志數(shù)據(jù)里挖掘潛在的、有用的知識(shí)或模式。會(huì)話識(shí)別是Web日志挖掘中的重要步驟。本文針對(duì)目前各種會(huì)話識(shí)別方法,提出了一種優(yōu)化的會(huì)話識(shí)別方法,即基于頁面興趣度動(dòng)態(tài)閥值會(huì)話識(shí)別方法。該方法通過把頁面興趣度和頁面的動(dòng)態(tài)平均停留時(shí)間相結(jié)合生成基于頁面興趣度動(dòng)態(tài)閥值來識(shí)別會(huì)話。本文主要工作有:1)本文首先系統(tǒng)地介紹了數(shù)據(jù)挖掘、Web挖掘的概念和分類,然后對(duì)Web日志挖掘相關(guān)概念、技術(shù)和過程進(jìn)行了詳細(xì)的闡述,重點(diǎn)研究了Web日志挖掘的數(shù)據(jù)預(yù)處理過程。2)為了生成個(gè)性化的動(dòng)態(tài)閥值來識(shí)別會(huì)話,本文提出了頁面興趣度,即用戶對(duì)頁面感興趣程度,根據(jù)頁面的性質(zhì)和用戶相對(duì)瀏覽速度對(duì)頁面興趣度進(jìn)行量化。3)針對(duì)目前會(huì)話識(shí)別方法存在的問題,提出動(dòng)態(tài)閥值會(huì)話識(shí)別方法,通過把頁面興趣度和頁面的動(dòng)態(tài)平均停留時(shí)間相結(jié)合,產(chǎn)生基于頁面興趣度動(dòng)態(tài)閥值,彌補(bǔ)了傳統(tǒng)時(shí)間閥值會(huì)話識(shí)別方法不能根據(jù)不同用戶、不同網(wǎng)站動(dòng)態(tài)調(diào)整閥值的不足。實(shí)驗(yàn)結(jié)果表明,相對(duì)于目前會(huì)話識(shí)別使用的單一固定閥值進(jìn)行會(huì)話識(shí)別,本文提出的方法能更好地利用用戶和頁面的特點(diǎn),更為合理有效。
【學(xué)位授予單位】:上海師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP393.09
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 范純龍;姜宏飛;李華;;利用圖片類日志信息改進(jìn)會(huì)話識(shí)別質(zhì)量[J];計(jì)算機(jī)應(yīng)用;2010年04期
2 鄭立山;滕少華;;改進(jìn)的頁面與時(shí)間閾值的會(huì)話識(shí)別法[J];計(jì)算機(jī)應(yīng)用與軟件;2012年10期
3 張曉偉;;一種動(dòng)態(tài)時(shí)間閾值的會(huì)話識(shí)別算法[J];山東電力高等專科學(xué)校學(xué)報(bào);2012年04期
4 鄭立山;滕少華;;改進(jìn)的頁面與時(shí)間閾值的會(huì)話識(shí)別法[J];江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年04期
5 李文駿;黃金晶;;TRDFA:一種用于事務(wù)識(shí)別的DFA[J];計(jì)算機(jī)工程與應(yīng)用;2011年34期
6 張海強(qiáng);胡學(xué)龍;;一種基于引用日志文件的啟發(fā)式會(huì)話識(shí)別算法[J];揚(yáng)州大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期
7 汪成龍,賀亞茹;基于Web服務(wù)器的ASP會(huì)話管理機(jī)制[J];航空計(jì)算技術(shù);2004年02期
8 姜宏飛;范純龍;徐蕾;;非頁面日志信息在改進(jìn)會(huì)話識(shí)別中的應(yīng)用研究[J];沈陽航空工業(yè)學(xué)院學(xué)報(bào);2010年01期
9 田野;王文東;饒京海;王冠;郭亮;陳燦峰;馬建;;短信息的會(huì)話檢測及組織[J];軟件學(xué)報(bào);2012年10期
10 黃金晶;趙雷;楊季文;;使用DFA的Web會(huì)話構(gòu)造方法[J];計(jì)算機(jī)工程與應(yīng)用;2009年08期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 袁藝;Web日志中會(huì)話識(shí)別方法研究與改進(jìn)[D];上海師范大學(xué);2016年
2 婁新燕;基于統(tǒng)計(jì)語言模型的交通會(huì)話識(shí)別[D];山東大學(xué);2014年
3 張建光;Web會(huì)話識(shí)別的優(yōu)化方法研究[D];合肥工業(yè)大學(xué);2013年
4 黃金晶;Web使用挖掘方法的研究與改進(jìn)[D];蘇州大學(xué);2009年
5 焦亞麗;Web日志會(huì)話中識(shí)別方法的改進(jìn)[D];山西財(cái)經(jīng)大學(xué);2009年
,本文編號(hào):1147207
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1147207.html