基于簽到數(shù)據(jù)的用戶行為軌跡相似度分析
本文關(guān)鍵詞:基于簽到數(shù)據(jù)的用戶行為軌跡相似度分析
更多相關(guān)文章: 用戶行為軌跡 簽到數(shù)據(jù) 相似度度量 興趣區(qū)域
【摘要】:時(shí)空軌跡是移動(dòng)對(duì)象的位置和時(shí)間的記錄序列,作為一種重要的時(shí)空對(duì)象數(shù)據(jù)類型和信息源,時(shí)空軌跡的應(yīng)用范圍涵蓋了用戶行為、智能交通和精準(zhǔn)營銷等諸多方面。隨著衛(wèi)星定位技術(shù)、無線通信、智能終端以及移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,人們能夠更方便地獲取時(shí)空軌跡數(shù)據(jù)。通過對(duì)各種時(shí)空軌跡數(shù)據(jù)的分析,我們可以提取時(shí)空軌跡數(shù)據(jù)中的相似性特征,在沒有先驗(yàn)知識(shí)的情況下,將具有相似行為的時(shí)空對(duì)象劃分到一起,而將具有相異行為的時(shí)空對(duì)象劃分開來,其關(guān)鍵是根據(jù)時(shí)空軌跡數(shù)據(jù)的特點(diǎn),設(shè)計(jì)與定義不同時(shí)空軌跡間的相似度度量方法。本論文主要研究內(nèi)容包括:由于在位置服務(wù)的社交網(wǎng)絡(luò)中,用戶僅在到達(dá)某位置后才簽到,沒有對(duì)用戶的行為軌跡進(jìn)行持續(xù)的跟蹤,用戶簽到行為具有一定的隨意性和重復(fù)性,造成在不同位置上簽到次數(shù)差異較大,少數(shù)用戶完成了大多數(shù)簽到,一些位置很少被簽到,時(shí)間維的不等長使得用戶簽到數(shù)據(jù)呈現(xiàn)出稀疏性。本文通過把簽到時(shí)間劃分成幾個(gè)時(shí)間段,采用Optics算法對(duì)用戶簽到興趣點(diǎn)進(jìn)行基于密度的分層聚類,得到不同時(shí)間段、不同空間劃分尺度下的用戶興趣區(qū)域,比采用網(wǎng)格或者單一空間劃分尺度建立用戶軌跡更合理,更能反映用戶時(shí)空數(shù)據(jù)的分布情況。同時(shí),采用類似包圍盒的思想來比較各個(gè)興趣區(qū)域的相似性,更加符合簽到數(shù)據(jù)的特點(diǎn),大大降低了計(jì)算的復(fù)雜度,計(jì)算效率也得到提高。除此之外,從時(shí)間維度對(duì)時(shí)空軌跡進(jìn)行的劃分,可以根據(jù)具體應(yīng)用,調(diào)整各個(gè)時(shí)間段的權(quán)值,從而體現(xiàn)簽到數(shù)據(jù)在各個(gè)時(shí)間段上的重要程度的不同。最后,本文采用了大型位置社交網(wǎng)絡(luò)Gowalla中的用戶簽到數(shù)據(jù),通過準(zhǔn)確率、召回率等指標(biāo)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了評(píng)價(jià)。
【關(guān)鍵詞】:用戶行為軌跡 簽到數(shù)據(jù) 相似度度量 興趣區(qū)域
【學(xué)位授予單位】:西華大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP393.09;TP311.13
【目錄】:
- 摘要4-5
- Abstract5-8
- 1 緒論8-13
- 1.1 研究背景及意義8-9
- 1.2 國內(nèi)外研究現(xiàn)狀及問題9-11
- 1.3 論文主要內(nèi)容11-12
- 1.4 論文結(jié)構(gòu)安排12-13
- 2 相關(guān)基礎(chǔ)介紹13-19
- 2.1 基于位置的社交網(wǎng)絡(luò)相關(guān)介紹13-15
- 2.1.1 基于位置的社交網(wǎng)絡(luò)的特征13-15
- 2.1.2 用戶簽到數(shù)據(jù)的行為分析15
- 2.2 聚類方法簡介15-16
- 2.3 相似度度量方法介紹16-18
- 2.3.1 余弦相似度16-17
- 2.3.2 歐式距離相似度17
- 2.3.3 Jaccard相似系數(shù)17
- 2.3.4 調(diào)整的余弦的相似度17-18
- 2.4 本章小結(jié)18-19
- 3 基于簽到數(shù)據(jù)的用戶行為軌跡相似度分析19-32
- 3.1 有關(guān)的用戶行為軌跡相似度方法介紹19-21
- 3.2 獲取用戶簽到數(shù)據(jù)21
- 3.3 用戶簽到數(shù)據(jù)預(yù)處理21
- 3.4 用戶興趣區(qū)域的劃分21-27
- 3.4.1 基本術(shù)語21-22
- 3.4.2 Optics聚類算法22-26
- 3.4.3 劃分ROI26-27
- 3.5 相似區(qū)域數(shù)SimNumOfROI的計(jì)算27-29
- 3.6 用戶相似度的計(jì)算29-31
- 3.6.1 單層相似度計(jì)算29-30
- 3.6.2 跨層相似度計(jì)算30-31
- 3.7 本章小結(jié)31-32
- 4 分布式計(jì)算平臺(tái)Hadoop32-38
- 4.1 Hadoop介紹32-33
- 4.2 HDFS分布式文件系統(tǒng)介紹33-34
- 4.3 MapReduce思想34-35
- 4.4 用戶行為軌跡相似度分析的MapReduce的實(shí)現(xiàn)方案35-38
- 5 實(shí)驗(yàn)分析38-51
- 5.1 實(shí)驗(yàn)數(shù)據(jù)介紹38
- 5.2 實(shí)驗(yàn)過程38-42
- 5.2.1 T個(gè)時(shí)間段的劃分38-41
- 5.2.2 Optics算法分層41-42
- 5.3 方法評(píng)價(jià)42-50
- 5.3.1 評(píng)價(jià)指標(biāo)的介紹42-43
- 5.3.2 相似度分析評(píng)價(jià)結(jié)果43-50
- 5.4 本章小結(jié)50-51
- 總結(jié)與展望51-52
- 參考文獻(xiàn)52-56
- 攻讀碩士學(xué)位期間發(fā)表論文及科研成果56-57
- 致謝57-58
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 陶闖;;LBS市場發(fā)展趨勢(shì)和挑戰(zhàn)[J];衛(wèi)星與網(wǎng)絡(luò);2012年10期
2 ;[J];;年期
中國重要報(bào)紙全文數(shù)據(jù)庫 前2條
1 趙朕(中國解放區(qū)文學(xué)研究會(huì)副會(huì)長);單純的綠色 復(fù)雜的折光[N];中國紀(jì)檢監(jiān)察報(bào);2001年
2 任正虎;抓好團(tuán)以上黨委書記隊(duì)伍建設(shè)[N];解放軍報(bào);2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 馮琳耀;基于室內(nèi)傳感網(wǎng)數(shù)據(jù)的行為軌跡幾何代數(shù)建模與特征分析方法[D];南京師范大學(xué);2015年
2 趙方旭;不同水力條件下魚類個(gè)體行為軌跡特性研究[D];廣西大學(xué);2016年
3 周永;基于簽到數(shù)據(jù)的用戶行為軌跡相似度分析[D];西華大學(xué);2016年
4 王彬;用戶行為軌跡聚類及其應(yīng)用研究[D];西華大學(xué);2016年
5 韓金娥;基于化簡行為軌跡的軟件可信性評(píng)價(jià)模型[D];河北大學(xué);2011年
,本文編號(hào):646106
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/646106.html