基于軌跡數(shù)據(jù)的用戶行為分析方法研究
發(fā)布時間:2021-04-22 14:57
隨著互聯(lián)網(wǎng)行業(yè)的高速發(fā)展,數(shù)據(jù)量變得越來越大,進入了大數(shù)據(jù)時代。龐大的數(shù)據(jù)集中蘊含著大量的信息,這些信息可以通過數(shù)據(jù)挖掘與數(shù)據(jù)處理來發(fā)現(xiàn)。軌跡數(shù)據(jù)作為大數(shù)據(jù)的一個組成部分,其主要組成部分如下:經(jīng)緯度信息、時間、以及其他的一些基本信息。本文以電動自行車軌跡數(shù)據(jù)為實驗對象來對軌跡數(shù)據(jù)進行分析與研究,由于該數(shù)據(jù)中隱藏著大量的用戶行為特征,如:用戶生活規(guī)律、出行習慣、以及頻繁路徑等,故本文對電動自行車軌跡數(shù)據(jù)進行深入研究從而挖掘用戶的行為特征。具體貢獻如下:本文利用軌跡點間的相關(guān)性對傳統(tǒng)停留點挖掘算法進行改進,通過該算法提取軌跡中的停留點,從而挖掘出用戶住居住地信息。由于停留點處軌跡具有方向變化多樣的特性,所以本文選用皮爾遜相關(guān)系數(shù)來計算軌跡數(shù)據(jù)間的相關(guān)性。首先根據(jù)軌跡坐標間的相關(guān)系數(shù)來提取候選停留點;接著通過設(shè)置距離與時間的閾值來對候選停留點進行篩選,來提取停留點區(qū)域,同時利用最小包圍矩形對停留點附近區(qū)域進行判斷識別,提高識別區(qū)域的準確度。本文利用kd-tree對快速搜索與查找的密度聚類算法進行改進(簡稱KDFDP算法)。并利用該算法挖掘出用戶的居住地信息,得出結(jié)果利用百度API進行可視化;...
【文章來源】:沈陽理工大學遼寧省
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題研究的背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 軌跡數(shù)據(jù)的研究現(xiàn)狀
1.2.2 聚類分析的研究現(xiàn)狀
1.2.3 基于軌跡數(shù)據(jù)的用戶行為分析研究現(xiàn)狀
1.3 本文工作和章節(jié)安排
1.4 本章小結(jié)
第2章 軌跡數(shù)據(jù)相關(guān)理論與技術(shù)
2.1 軌跡數(shù)據(jù)概述
2.2 常用公式
2.2.1 距離度量公式
2.2.2 相關(guān)性公式
2.3 軌跡數(shù)據(jù)分析常用聚類算法
2.3.1 DBSCAN聚類算法
2.3.2 基于密度的快速搜索與查找聚類算法
2.3.3 聚類算法評價方法
2.4 本章小結(jié)
第3章 電動自行車軌跡數(shù)據(jù)處理
3.1 數(shù)據(jù)特征分析
3.1.1 軌跡數(shù)據(jù)信息
3.1.2 軌跡數(shù)據(jù)特征
3.2 數(shù)據(jù)處理
3.2.1 數(shù)據(jù)清洗
3.2.2 停留點挖掘
3.2.3 軌跡數(shù)據(jù)切割
3.2.4 數(shù)據(jù)處理算法復雜度
3.3 本章小結(jié)
第4章 基于軌跡數(shù)據(jù)點的用戶行為分析
4.1 kd-tree
4.1.1 kd-tree的數(shù)據(jù)結(jié)構(gòu)
4.1.2 kd-tree建樹算法分析
4.1.3 建樹算法描述
4.1.4 選擇分割維度
4.1.5 選擇分割點
4.2 KDFDP聚類算法
4.3 用戶居住地挖掘
4.3.1 基于聚類算法的居住地挖掘
4.3.2 實驗與結(jié)果分析
4.4 用戶行駛速度分析
4.4.1 日程速度行為建模
4.4.2 基于日程速度行為的用戶聚類分析
4.4.3 實驗與結(jié)果分析
4.5 本章小結(jié)
第5章 基于軌跡數(shù)據(jù)軌跡的用戶行為分析
5.1 軌跡分段
5.2 軌跡聚類
5.2.1 距離度量公式
5.2.2 子軌跡的DBSCAN聚類算法
5.3 特征軌跡提取
5.4 實驗結(jié)果與分析
5.5 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文和獲得的科研結(jié)果
致謝
【參考文獻】:
期刊論文
[1]Hadoop平臺下粒子濾波結(jié)合改進ABC算法的IoT大數(shù)據(jù)特征選擇方法[J]. 吳穎,李曉玲,唐晶磊. 計算機應(yīng)用研究. 2019(11)
[2]出租車軌跡數(shù)據(jù)挖掘進展[J]. 吳華意,黃蕊,游蘭,向隆剛. 測繪學報. 2019(11)
[3]融合多尺度邊緣檢測的小波貝葉斯SAR圖像濾波[J]. 余祥偉,薛東劍,陳鳳嬌. 遙感信息. 2019(05)
[4]多特征融合的句子語義相似度計算方法[J]. 翟社平,李兆兆,段宏宇,李婧,董迪迪. 計算機工程與設(shè)計. 2019(10)
[5]基于改進HMM模型的3D景區(qū)地圖匹配算法[J]. 黃娟娟,徐圓,朱群雄. 計算機工程. 2019(06)
[6]瞳孔中心點自動定位與對準裝置[J]. 王晶,高峰,李婉越,史國華. 光學精密工程. 2019(06)
[7]基于軌跡聚類的天光光譜特征分析[J]. 蔡江輝,楊雨晴,楊海峰,羅阿理,孔嘯,張繼福. 光譜學與光譜分析. 2019(04)
[8]基于語義軌跡停留點的位置服務(wù)匹配與應(yīng)用研究[J]. 齊凌艷,陳榮國,溫馨. 地球信息科學學報. 2014(05)
[9]基于二分K-均值的SVM決策樹自適應(yīng)分類方法[J]. 裘國永,張嬌. 計算機應(yīng)用研究. 2012(10)
[10]基于速度約束的分段軌跡聚類算法[J]. 韓陳壽,夏士雄,張磊,朱長成. 計算機工程. 2011(07)
博士論文
[1]電動自行車風險駕駛行為及事故機理研究[D]. 王濤.東南大學 2017
[2]鴿子位置細胞功能網(wǎng)絡(luò)對目標導向行為的信息編碼機制[D]. 劉新玉.鄭州大學 2017
[3]基于運動特征的軌跡相似性度量研究[D]. 朱進.南京師范大學 2015
碩士論文
[1]基于車輛軌跡數(shù)據(jù)的用戶行為分析研究[D]. 劉睿晗.中國科學院大學(中國科學院深圳先進技術(shù)研究院) 2019
[2]基于近鄰相似圖的譜聚類算法研究與應(yīng)用[D]. 劉友超.江南大學 2019
[3]出租車GPS數(shù)據(jù)的信息挖掘研究[D]. 陳玲燕.北京交通大學 2018
[4]液壓元件制造數(shù)字化車間生產(chǎn)調(diào)度信息系統(tǒng)研究[D]. 陳太湖.合肥工業(yè)大學 2018
[5]面向特定目標的行人軌跡分析系統(tǒng)設(shè)計與實現(xiàn)[D]. 李艷.電子科技大學 2018
[6]基于移動通信數(shù)據(jù)信息挖掘技術(shù)的研究與應(yīng)用[D]. 王陸.北京郵電大學 2018
[7]基于出租車GPS數(shù)據(jù)的居民出行時空規(guī)律和出行熱點區(qū)域研究[D]. 陳紅麗.云南大學 2016
[8]電動自行車交通現(xiàn)狀問題及對策研究[D]. 陳喆罕.云南大學 2012
本文編號:3153974
【文章來源】:沈陽理工大學遼寧省
【文章頁數(shù)】:67 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題研究的背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 軌跡數(shù)據(jù)的研究現(xiàn)狀
1.2.2 聚類分析的研究現(xiàn)狀
1.2.3 基于軌跡數(shù)據(jù)的用戶行為分析研究現(xiàn)狀
1.3 本文工作和章節(jié)安排
1.4 本章小結(jié)
第2章 軌跡數(shù)據(jù)相關(guān)理論與技術(shù)
2.1 軌跡數(shù)據(jù)概述
2.2 常用公式
2.2.1 距離度量公式
2.2.2 相關(guān)性公式
2.3 軌跡數(shù)據(jù)分析常用聚類算法
2.3.1 DBSCAN聚類算法
2.3.2 基于密度的快速搜索與查找聚類算法
2.3.3 聚類算法評價方法
2.4 本章小結(jié)
第3章 電動自行車軌跡數(shù)據(jù)處理
3.1 數(shù)據(jù)特征分析
3.1.1 軌跡數(shù)據(jù)信息
3.1.2 軌跡數(shù)據(jù)特征
3.2 數(shù)據(jù)處理
3.2.1 數(shù)據(jù)清洗
3.2.2 停留點挖掘
3.2.3 軌跡數(shù)據(jù)切割
3.2.4 數(shù)據(jù)處理算法復雜度
3.3 本章小結(jié)
第4章 基于軌跡數(shù)據(jù)點的用戶行為分析
4.1 kd-tree
4.1.1 kd-tree的數(shù)據(jù)結(jié)構(gòu)
4.1.2 kd-tree建樹算法分析
4.1.3 建樹算法描述
4.1.4 選擇分割維度
4.1.5 選擇分割點
4.2 KDFDP聚類算法
4.3 用戶居住地挖掘
4.3.1 基于聚類算法的居住地挖掘
4.3.2 實驗與結(jié)果分析
4.4 用戶行駛速度分析
4.4.1 日程速度行為建模
4.4.2 基于日程速度行為的用戶聚類分析
4.4.3 實驗與結(jié)果分析
4.5 本章小結(jié)
第5章 基于軌跡數(shù)據(jù)軌跡的用戶行為分析
5.1 軌跡分段
5.2 軌跡聚類
5.2.1 距離度量公式
5.2.2 子軌跡的DBSCAN聚類算法
5.3 特征軌跡提取
5.4 實驗結(jié)果與分析
5.5 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文和獲得的科研結(jié)果
致謝
【參考文獻】:
期刊論文
[1]Hadoop平臺下粒子濾波結(jié)合改進ABC算法的IoT大數(shù)據(jù)特征選擇方法[J]. 吳穎,李曉玲,唐晶磊. 計算機應(yīng)用研究. 2019(11)
[2]出租車軌跡數(shù)據(jù)挖掘進展[J]. 吳華意,黃蕊,游蘭,向隆剛. 測繪學報. 2019(11)
[3]融合多尺度邊緣檢測的小波貝葉斯SAR圖像濾波[J]. 余祥偉,薛東劍,陳鳳嬌. 遙感信息. 2019(05)
[4]多特征融合的句子語義相似度計算方法[J]. 翟社平,李兆兆,段宏宇,李婧,董迪迪. 計算機工程與設(shè)計. 2019(10)
[5]基于改進HMM模型的3D景區(qū)地圖匹配算法[J]. 黃娟娟,徐圓,朱群雄. 計算機工程. 2019(06)
[6]瞳孔中心點自動定位與對準裝置[J]. 王晶,高峰,李婉越,史國華. 光學精密工程. 2019(06)
[7]基于軌跡聚類的天光光譜特征分析[J]. 蔡江輝,楊雨晴,楊海峰,羅阿理,孔嘯,張繼福. 光譜學與光譜分析. 2019(04)
[8]基于語義軌跡停留點的位置服務(wù)匹配與應(yīng)用研究[J]. 齊凌艷,陳榮國,溫馨. 地球信息科學學報. 2014(05)
[9]基于二分K-均值的SVM決策樹自適應(yīng)分類方法[J]. 裘國永,張嬌. 計算機應(yīng)用研究. 2012(10)
[10]基于速度約束的分段軌跡聚類算法[J]. 韓陳壽,夏士雄,張磊,朱長成. 計算機工程. 2011(07)
博士論文
[1]電動自行車風險駕駛行為及事故機理研究[D]. 王濤.東南大學 2017
[2]鴿子位置細胞功能網(wǎng)絡(luò)對目標導向行為的信息編碼機制[D]. 劉新玉.鄭州大學 2017
[3]基于運動特征的軌跡相似性度量研究[D]. 朱進.南京師范大學 2015
碩士論文
[1]基于車輛軌跡數(shù)據(jù)的用戶行為分析研究[D]. 劉睿晗.中國科學院大學(中國科學院深圳先進技術(shù)研究院) 2019
[2]基于近鄰相似圖的譜聚類算法研究與應(yīng)用[D]. 劉友超.江南大學 2019
[3]出租車GPS數(shù)據(jù)的信息挖掘研究[D]. 陳玲燕.北京交通大學 2018
[4]液壓元件制造數(shù)字化車間生產(chǎn)調(diào)度信息系統(tǒng)研究[D]. 陳太湖.合肥工業(yè)大學 2018
[5]面向特定目標的行人軌跡分析系統(tǒng)設(shè)計與實現(xiàn)[D]. 李艷.電子科技大學 2018
[6]基于移動通信數(shù)據(jù)信息挖掘技術(shù)的研究與應(yīng)用[D]. 王陸.北京郵電大學 2018
[7]基于出租車GPS數(shù)據(jù)的居民出行時空規(guī)律和出行熱點區(qū)域研究[D]. 陳紅麗.云南大學 2016
[8]電動自行車交通現(xiàn)狀問題及對策研究[D]. 陳喆罕.云南大學 2012
本文編號:3153974
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3153974.html
最近更新
教材專著