基于簽到數(shù)據(jù)的用戶行為軌跡相似度分析
發(fā)布時間:2017-08-09 16:04
本文關(guān)鍵詞:基于簽到數(shù)據(jù)的用戶行為軌跡相似度分析
更多相關(guān)文章: 用戶行為軌跡 簽到數(shù)據(jù) 相似度度量 興趣區(qū)域
【摘要】:時空軌跡是移動對象的位置和時間的記錄序列,作為一種重要的時空對象數(shù)據(jù)類型和信息源,時空軌跡的應(yīng)用范圍涵蓋了用戶行為、智能交通和精準營銷等諸多方面。隨著衛(wèi)星定位技術(shù)、無線通信、智能終端以及移動互聯(lián)網(wǎng)的快速發(fā)展,人們能夠更方便地獲取時空軌跡數(shù)據(jù)。通過對各種時空軌跡數(shù)據(jù)的分析,我們可以提取時空軌跡數(shù)據(jù)中的相似性特征,在沒有先驗知識的情況下,將具有相似行為的時空對象劃分到一起,而將具有相異行為的時空對象劃分開來,其關(guān)鍵是根據(jù)時空軌跡數(shù)據(jù)的特點,設(shè)計與定義不同時空軌跡間的相似度度量方法。本論文主要研究內(nèi)容包括:由于在位置服務(wù)的社交網(wǎng)絡(luò)中,用戶僅在到達某位置后才簽到,沒有對用戶的行為軌跡進行持續(xù)的跟蹤,用戶簽到行為具有一定的隨意性和重復(fù)性,造成在不同位置上簽到次數(shù)差異較大,少數(shù)用戶完成了大多數(shù)簽到,一些位置很少被簽到,時間維的不等長使得用戶簽到數(shù)據(jù)呈現(xiàn)出稀疏性。本文通過把簽到時間劃分成幾個時間段,采用Optics算法對用戶簽到興趣點進行基于密度的分層聚類,得到不同時間段、不同空間劃分尺度下的用戶興趣區(qū)域,比采用網(wǎng)格或者單一空間劃分尺度建立用戶軌跡更合理,更能反映用戶時空數(shù)據(jù)的分布情況。同時,采用類似包圍盒的思想來比較各個興趣區(qū)域的相似性,更加符合簽到數(shù)據(jù)的特點,大大降低了計算的復(fù)雜度,計算效率也得到提高。除此之外,從時間維度對時空軌跡進行的劃分,可以根據(jù)具體應(yīng)用,調(diào)整各個時間段的權(quán)值,從而體現(xiàn)簽到數(shù)據(jù)在各個時間段上的重要程度的不同。最后,本文采用了大型位置社交網(wǎng)絡(luò)Gowalla中的用戶簽到數(shù)據(jù),通過準確率、召回率等指標對實驗結(jié)果進行了評價。
【關(guān)鍵詞】:用戶行為軌跡 簽到數(shù)據(jù) 相似度度量 興趣區(qū)域
【學(xué)位授予單位】:西華大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP393.09;TP311.13
【目錄】:
- 摘要4-5
- Abstract5-8
- 1 緒論8-13
- 1.1 研究背景及意義8-9
- 1.2 國內(nèi)外研究現(xiàn)狀及問題9-11
- 1.3 論文主要內(nèi)容11-12
- 1.4 論文結(jié)構(gòu)安排12-13
- 2 相關(guān)基礎(chǔ)介紹13-19
- 2.1 基于位置的社交網(wǎng)絡(luò)相關(guān)介紹13-15
- 2.1.1 基于位置的社交網(wǎng)絡(luò)的特征13-15
- 2.1.2 用戶簽到數(shù)據(jù)的行為分析15
- 2.2 聚類方法簡介15-16
- 2.3 相似度度量方法介紹16-18
- 2.3.1 余弦相似度16-17
- 2.3.2 歐式距離相似度17
- 2.3.3 Jaccard相似系數(shù)17
- 2.3.4 調(diào)整的余弦的相似度17-18
- 2.4 本章小結(jié)18-19
- 3 基于簽到數(shù)據(jù)的用戶行為軌跡相似度分析19-32
- 3.1 有關(guān)的用戶行為軌跡相似度方法介紹19-21
- 3.2 獲取用戶簽到數(shù)據(jù)21
- 3.3 用戶簽到數(shù)據(jù)預(yù)處理21
- 3.4 用戶興趣區(qū)域的劃分21-27
- 3.4.1 基本術(shù)語21-22
- 3.4.2 Optics聚類算法22-26
- 3.4.3 劃分ROI26-27
- 3.5 相似區(qū)域數(shù)SimNumOfROI的計算27-29
- 3.6 用戶相似度的計算29-31
- 3.6.1 單層相似度計算29-30
- 3.6.2 跨層相似度計算30-31
- 3.7 本章小結(jié)31-32
- 4 分布式計算平臺Hadoop32-38
- 4.1 Hadoop介紹32-33
- 4.2 HDFS分布式文件系統(tǒng)介紹33-34
- 4.3 MapReduce思想34-35
- 4.4 用戶行為軌跡相似度分析的MapReduce的實現(xiàn)方案35-38
- 5 實驗分析38-51
- 5.1 實驗數(shù)據(jù)介紹38
- 5.2 實驗過程38-42
- 5.2.1 T個時間段的劃分38-41
- 5.2.2 Optics算法分層41-42
- 5.3 方法評價42-50
- 5.3.1 評價指標的介紹42-43
- 5.3.2 相似度分析評價結(jié)果43-50
- 5.4 本章小結(jié)50-51
- 總結(jié)與展望51-52
- 參考文獻52-56
- 攻讀碩士學(xué)位期間發(fā)表論文及科研成果56-57
- 致謝57-58
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 陶闖;;LBS市場發(fā)展趨勢和挑戰(zhàn)[J];衛(wèi)星與網(wǎng)絡(luò);2012年10期
2 ;[J];;年期
中國重要報紙全文數(shù)據(jù)庫 前2條
1 趙朕(中國解放區(qū)文學(xué)研究會副會長);單純的綠色 復(fù)雜的折光[N];中國紀檢監(jiān)察報;2001年
2 任正虎;抓好團以上黨委書記隊伍建設(shè)[N];解放軍報;2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 馮琳耀;基于室內(nèi)傳感網(wǎng)數(shù)據(jù)的行為軌跡幾何代數(shù)建模與特征分析方法[D];南京師范大學(xué);2015年
2 趙方旭;不同水力條件下魚類個體行為軌跡特性研究[D];廣西大學(xué);2016年
3 周永;基于簽到數(shù)據(jù)的用戶行為軌跡相似度分析[D];西華大學(xué);2016年
4 王彬;用戶行為軌跡聚類及其應(yīng)用研究[D];西華大學(xué);2016年
5 韓金娥;基于化簡行為軌跡的軟件可信性評價模型[D];河北大學(xué);2011年
,本文編號:646106
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/646106.html
最近更新
教材專著