基于網(wǎng)絡(luò)訪問項(xiàng)序的移動用戶重入網(wǎng)識別方法
發(fā)布時間:2017-03-31 04:07
本文關(guān)鍵詞:基于網(wǎng)絡(luò)訪問項(xiàng)序的移動用戶重入網(wǎng)識別方法,由筆耕文化傳播整理發(fā)布。
【摘要】:在任何的移動商務(wù)營銷活動中,對于用戶身份的唯一性標(biāo)識都是不可或缺的基礎(chǔ)工作。因?yàn)楦鞣N交叉因素的諸多影響,部分移動用戶頻繁的出入移動運(yùn)營商網(wǎng)絡(luò)已經(jīng)成為普遍現(xiàn)象。伴隨著用戶的重新入網(wǎng),那么針對該用戶的舊號碼的行為特征記錄分析將完全失效,同時又需要重新對新號碼的用戶行為特征記錄進(jìn)行分析刻畫,這樣勢必將耗費(fèi)很長的時間才能重新獲得該用戶的完整行為刻畫,對于運(yùn)營商來說會造成極大的資源浪費(fèi)和重復(fù)工作的不必要。所以對于重入網(wǎng)用戶的身份識別有著很重要的意義和價值。目前對于移動用戶重入網(wǎng)身份識別的研究主要是基于用戶資料,IMEI碼,呼叫指紋等進(jìn)行識別。但是基于前兩者的識別由于資料缺失、移動設(shè)備更換頻繁等原因?qū)е伦R別準(zhǔn)確率較為低下,而基于呼叫指紋的識別方法的局限性較強(qiáng),導(dǎo)致這些方法在實(shí)際生產(chǎn)操作中的可行性不大。在本文中,對于移動用戶的重入網(wǎng)身份識別問題,從用戶的上網(wǎng)行為特征出發(fā),提出基于用戶網(wǎng)絡(luò)訪問項(xiàng)序的用戶相似性計算方法,根據(jù)“數(shù)據(jù)預(yù)處理→相似用戶集挑選→基于個性化網(wǎng)站的相似用戶集裁剪→基于時間特征的相似用戶集裁剪→基于網(wǎng)站訪問項(xiàng)序的相似用戶集裁剪→基于網(wǎng)站訪問頻次的相似用戶集裁剪→相同身份用戶的識別”7個步驟對重入網(wǎng)用戶身份進(jìn)行精確的識別定位。最后,基于某通信運(yùn)營商提供的某地區(qū)25809個用戶60天網(wǎng)絡(luò)訪問日志數(shù)據(jù)集上,對本文所提方法的可行性與有效性進(jìn)行了實(shí)驗(yàn)驗(yàn)證,結(jié)果顯示總體準(zhǔn)確率為96.64%,在可行性和有效性方面均有著很好的表現(xiàn)。
【關(guān)鍵詞】:網(wǎng)絡(luò)訪問項(xiàng)序 重入網(wǎng) 身份識別 用戶相似性計算
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP393.08
【目錄】:
- 摘要4-5
- Abstract5-8
- 1 緒論8-18
- 1.1 課題背景及研究意義8-10
- 1.2 國內(nèi)外研究現(xiàn)狀10-15
- 1.2.1 基于用戶資料的識別11-12
- 1.2.2 基于IMEI碼的識別技術(shù)12-13
- 1.2.3 基于數(shù)據(jù)源的用戶特征挖掘識別技術(shù)13-15
- 1.3 論文主要工作15-16
- 1.4 論文組織結(jié)構(gòu)16-18
- 2 基于網(wǎng)絡(luò)訪問的重入網(wǎng)識別問題定義及解決思路18-29
- 2.1 問題模型定義18-19
- 2.2 解決思路19-28
- 2.2.1 上網(wǎng)日志數(shù)據(jù)源的分析19-21
- 2.2.2 基于數(shù)據(jù)挖掘啟發(fā)式規(guī)則21
- 2.2.3 基于啟發(fā)式規(guī)則設(shè)計算法21-28
- 2.3 本章小結(jié)28-29
- 3 基于用戶網(wǎng)絡(luò)訪問項(xiàng)序的重入網(wǎng)用戶身份識別算法29-41
- 3.1 數(shù)據(jù)預(yù)處理29-31
- 3.1.1 數(shù)據(jù)清理29-30
- 3.1.2 數(shù)據(jù)整理30-31
- 3.2 相似用戶集挑選31-32
- 3.3 基于個性化網(wǎng)站的相似用戶集裁剪32-33
- 3.4 基于時間特征的相似用戶集裁剪33-35
- 3.4.1 基于用戶整體上網(wǎng)時間的相似度比較33-34
- 3.4.2 基于用戶針對具體網(wǎng)站的訪問時間相似度比較34-35
- 3.5 基于網(wǎng)站訪問項(xiàng)序的相似用戶集裁剪35-37
- 3.5.1 利用PrefixSpan算法挖掘用戶的習(xí)慣性網(wǎng)站訪問序列36
- 3.5.2 利用LD算法計算習(xí)慣性網(wǎng)站訪問序列相似度36-37
- 3.5.3 基于相似度進(jìn)行裁剪37
- 3.6 基于網(wǎng)站訪問頻次的相似用戶集裁剪37-38
- 3.7 相同身份用戶的識別38-40
- 3.8 本章小結(jié)40-41
- 4 實(shí)驗(yàn)例證和結(jié)果分析41-53
- 4.1 實(shí)驗(yàn)環(huán)境41
- 4.2 實(shí)驗(yàn)思路41-50
- 4.2.1 數(shù)據(jù)集劃分41-43
- 4.2.2 各階段閾值的確定43-50
- 4.3 實(shí)驗(yàn)結(jié)果50-52
- 4.4 本章小結(jié)52-53
- 結(jié)論53-54
- 參考文獻(xiàn)54-57
- 攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況57-58
- 致謝58-59
【參考文獻(xiàn)】
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 章昱梓;移動用戶重入網(wǎng)分析系統(tǒng)的分析與設(shè)計[D];北京郵電大學(xué);2011年
本文關(guān)鍵詞:基于網(wǎng)絡(luò)訪問項(xiàng)序的移動用戶重入網(wǎng)識別方法,由筆耕文化傳播整理發(fā)布。
,本文編號:278834
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/278834.html
最近更新
教材專著