室內(nèi)移動對象的行為模式挖掘及個性化推薦研究
發(fā)布時間:2021-04-12 04:43
據(jù)統(tǒng)計,人類在日常生活中有超過80%的時間處在住宅、辦公室、商場等室內(nèi)空間。了解和掌握人群的室內(nèi)行為模式有助于公共災害防護、公共設(shè)施優(yōu)化以及室內(nèi)個性化推薦服務等。近年來,隨著室內(nèi)定位技術(shù)與移動智能終端設(shè)備的不斷發(fā)展,采集到的室內(nèi)移動對象的定位數(shù)據(jù)和軌跡信息更加精確,為分析室內(nèi)個體及群體的空間分布、行為模式及偏好信息奠定了數(shù)據(jù)基礎(chǔ)。同時也讓基于室內(nèi)位置的人類行為模式挖掘與應用成為當前GIS研究的熱點。本文基于某大型商場的室內(nèi)客流定位數(shù)據(jù),結(jié)合商場室內(nèi)空間的實體特征研究室內(nèi)WIFI定位數(shù)據(jù)的預處理方法及軌跡重構(gòu)方法;結(jié)合商場內(nèi)空間實體的屬性信息,研究顧客群體的軌跡聚類,挖掘商場客流的行為模式;針對用戶的個性化需求,構(gòu)建基于軌跡相似度的個性化推薦框架。本文的主要工作與貢獻有以下三點:(1)針對室內(nèi)WIFI定位數(shù)據(jù)特點與室內(nèi)復雜的空間結(jié)構(gòu)特征,提出了一種顧及語義的室內(nèi)數(shù)據(jù)預處理方法。首先使用啟發(fā)式濾波方法與滑動窗口算法對WIFI定位數(shù)據(jù)進行分層與分段濾波處理,用以解決定位點的異常值問題;其次在數(shù)據(jù)預處理過程中引入位置語義與語義軌跡的概念,將室內(nèi)定位點轉(zhuǎn)換成語義軌跡序列,便于進一步挖掘室內(nèi)軌跡信...
【文章來源】:中國礦業(yè)大學江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學位級別】:碩士
【部分圖文】:
HDFS結(jié)構(gòu)模型
2 顧及室內(nèi)語義信息的軌跡數(shù)據(jù)預處理方法研究2.5.1 實驗環(huán)境本實驗所使用的機器為華碩 GL552VW 筆記本電腦,運行內(nèi)存為 8G,處理器為主頻為 2.6GHz 的 Intel Core i7,操作系統(tǒng)為 64 位的 Windows10 操作系統(tǒng),Hadoop 平臺的集群由 8 個普通計算機組成,操作系統(tǒng)為 64 位的 CentOS-6.9 操作系統(tǒng),內(nèi)存大小共 128G,存儲空間為 72T,使用的 hadoop 版本號為 2.7.3,使用的 spark 版本號為 2.1.1。本實驗使用的開發(fā)工具為 IntelliJ IDEA,開發(fā)語言包括 Java 與 Scala,使用的商鋪平面圖及定位點解析工具為 ArcGis 10.2。實驗所需數(shù)據(jù)存儲在 Hadoop 平臺中的 HDFS 上,使用 Hive 對其進行索引查詢。2.5.2 實驗數(shù)據(jù)本實驗所使用的數(shù)據(jù)是某大型商場內(nèi)的真實室內(nèi)移動對象軌跡數(shù)據(jù),選取了2018 年 1 月 1 日全天的 WIFI 定位數(shù)據(jù),原始數(shù)據(jù)量為 720 萬余條。商鋪底圖數(shù)據(jù)包含 11 個樓層,共 306 家商鋪。
拆分為多段獨立軌跡,拆分后得到的 MacId 為新的獨立 MacId。在進行濾波處理之前,需要對移動對象的室內(nèi)軌跡進行分層處理,由于樓層間存在跳躍點,因此引入了滑動窗口算法,其處理流程如圖 2-3 所示,本實驗使用 Spark 計算框架進行運算,采用相同的處理邏輯,將單機處理時所需的 1 小時處理時間縮短到 2 分鐘內(nèi)。圖 2-3 基于滑動窗口算法的樓層處理流程Figure 2-3 Sliding window algorithm floor processing flow經(jīng)過該處理方法處理后,原始定位數(shù)據(jù)的樓層時序變得更符合客觀生活規(guī)律,大量樓層間的異常定位坐標被重新劃分到了合理的樓層內(nèi),如圖 2-4 與圖 2-5 中所示,MacId 為 EC852F56039B 的移動對象的原始樓層時序軌跡與處理后的樓層時序軌跡圖可以體現(xiàn)出滑動窗口算法對原始數(shù)據(jù)的修正有很好的效果。
本文編號:3132642
【文章來源】:中國礦業(yè)大學江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:82 頁
【學位級別】:碩士
【部分圖文】:
HDFS結(jié)構(gòu)模型
2 顧及室內(nèi)語義信息的軌跡數(shù)據(jù)預處理方法研究2.5.1 實驗環(huán)境本實驗所使用的機器為華碩 GL552VW 筆記本電腦,運行內(nèi)存為 8G,處理器為主頻為 2.6GHz 的 Intel Core i7,操作系統(tǒng)為 64 位的 Windows10 操作系統(tǒng),Hadoop 平臺的集群由 8 個普通計算機組成,操作系統(tǒng)為 64 位的 CentOS-6.9 操作系統(tǒng),內(nèi)存大小共 128G,存儲空間為 72T,使用的 hadoop 版本號為 2.7.3,使用的 spark 版本號為 2.1.1。本實驗使用的開發(fā)工具為 IntelliJ IDEA,開發(fā)語言包括 Java 與 Scala,使用的商鋪平面圖及定位點解析工具為 ArcGis 10.2。實驗所需數(shù)據(jù)存儲在 Hadoop 平臺中的 HDFS 上,使用 Hive 對其進行索引查詢。2.5.2 實驗數(shù)據(jù)本實驗所使用的數(shù)據(jù)是某大型商場內(nèi)的真實室內(nèi)移動對象軌跡數(shù)據(jù),選取了2018 年 1 月 1 日全天的 WIFI 定位數(shù)據(jù),原始數(shù)據(jù)量為 720 萬余條。商鋪底圖數(shù)據(jù)包含 11 個樓層,共 306 家商鋪。
拆分為多段獨立軌跡,拆分后得到的 MacId 為新的獨立 MacId。在進行濾波處理之前,需要對移動對象的室內(nèi)軌跡進行分層處理,由于樓層間存在跳躍點,因此引入了滑動窗口算法,其處理流程如圖 2-3 所示,本實驗使用 Spark 計算框架進行運算,采用相同的處理邏輯,將單機處理時所需的 1 小時處理時間縮短到 2 分鐘內(nèi)。圖 2-3 基于滑動窗口算法的樓層處理流程Figure 2-3 Sliding window algorithm floor processing flow經(jīng)過該處理方法處理后,原始定位數(shù)據(jù)的樓層時序變得更符合客觀生活規(guī)律,大量樓層間的異常定位坐標被重新劃分到了合理的樓層內(nèi),如圖 2-4 與圖 2-5 中所示,MacId 為 EC852F56039B 的移動對象的原始樓層時序軌跡與處理后的樓層時序軌跡圖可以體現(xiàn)出滑動窗口算法對原始數(shù)據(jù)的修正有很好的效果。
本文編號:3132642
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3132642.html
最近更新
教材專著