基于大數(shù)據(jù)的用戶精準(zhǔn)定位與行為分析
發(fā)布時(shí)間:2021-07-29 19:45
隨著移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,人類已然進(jìn)入了“大數(shù)據(jù)”的時(shí)代。大數(shù)據(jù)時(shí)代的到來,既帶來了巨大的價(jià)值也帶來了嚴(yán)峻的挑戰(zhàn)。用戶對(duì)定位服務(wù)需求的增加令用戶定位技術(shù)受到了越來越多的關(guān)注,雖然目前存在GPS定位、基站定位等方式,但這些方式存在著或受環(huán)境影響較大、或需要消耗大量的資源等問題。移動(dòng)網(wǎng)絡(luò)快速崛起的同時(shí),面向用戶的各種服務(wù)也層出不窮。如何在激烈的市場(chǎng)競(jìng)爭中脫穎而出,為用戶提供更加優(yōu)質(zhì)的服務(wù),成為各家服務(wù)提供商的當(dāng)務(wù)之急,其中的一個(gè)熱點(diǎn)方向就是分析移動(dòng)用戶的行為,挖掘用戶的習(xí)慣,了解用戶的偏好,從而更好的為用戶提供個(gè)性化的服務(wù)。因此,在數(shù)據(jù)量龐大、服務(wù)需求急劇增長的今天,研究基于大數(shù)據(jù)的用戶精準(zhǔn)定位和行為分析變得十分迫切和必要了。論文的主要工作包括:首先,在基于大數(shù)據(jù)的用戶精準(zhǔn)定位方面,研究了位置指紋庫的自動(dòng)構(gòu)建,包括MR(Measurement Report,測(cè)量報(bào)告)數(shù)據(jù)特征的自動(dòng)提取;數(shù)據(jù)業(yè)務(wù)中GPS位置信息的自動(dòng)挖掘;MR特征數(shù)據(jù)和GPS位置信息的自動(dòng)關(guān)聯(lián)入庫。通過研究位置匹配算法挖掘匹配相似人群的數(shù)據(jù)特征得到待定位用戶的近似位置,并且利用道路匹配算法將用戶位置匹配到距離其近似位置最近...
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-2?2014-2020年中國大數(shù)據(jù)產(chǎn)業(yè)規(guī)模市場(chǎng)及預(yù)測(cè)??大數(shù)據(jù)不僅將成為未來科技浪潮中的一股中堅(jiān)力量,勢(shì)必也會(huì)影響人們生活??,
CED??圖3-1算法邏輯流程圖??基于大數(shù)據(jù)的用戶精準(zhǔn)定位算法完整的邏輯流程如圖3-1所示。在實(shí)際情況??中,待定位的用戶A使用的終端在使用移動(dòng)網(wǎng)絡(luò)時(shí)生成的流量上網(wǎng)日志記錄數(shù)??據(jù)為Traffic_Data,同時(shí)基站采集到的用戶測(cè)量報(bào)告數(shù)據(jù)為MR_Data,此時(shí)對(duì)用??戶A進(jìn)行精準(zhǔn)定位時(shí)會(huì)出現(xiàn)如下三種情況:第一種,如果用戶A的Traffic_Data??中的URL信息中包含精確的GPS位置信息,那么就可以通過解析用戶A的??17??
3.4.3驗(yàn)證結(jié)果??為了評(píng)估上面提出算法的定位效果,我們依靠Hive平臺(tái)對(duì)原始數(shù)據(jù)進(jìn)行處??理,同時(shí)利用Python和Java語言對(duì)算法進(jìn)行了實(shí)現(xiàn)。圖3-5是所使用數(shù)據(jù)中某??個(gè)基站下的歷史用戶的所有精確位置點(diǎn)在空間中的分布情況,通過位置點(diǎn)的經(jīng)緯??度查詢得知,該處為中國某大型城市的一個(gè)醫(yī)院附近,分布符合預(yù)期。??Distribution?of?original?points??29?700?_?original?position????base?station??29.675?■??29.650-??29.625?-?”?1??29.600?-??#?X??29.575?-??X?X?X?X?X??29.550-??X?K?X?XX??29.525?-??106.46?106.48?106.50?106.52?106.54?106.56?106.58?106.60??圖3-5歷史用戶精確位置空間分布圖??圖3-6是所使用數(shù)據(jù)中某個(gè)基站下的歷史用戶的所有精確位置點(diǎn)在時(shí)間上??的分布情況,可以看到位置點(diǎn)主要集中在早上8點(diǎn)到晚上10點(diǎn)之間,并且可以??知道這個(gè)時(shí)間段是人們主要的出行時(shí)間段,符合人們的出行規(guī)律。??25??
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)序列GPS數(shù)據(jù)集的用戶位置挖掘方法研究[J]. 王鐵軍,趙禮劍,朱熙. 地理信息世界. 2018(02)
[2]用戶定位及室內(nèi)用戶識(shí)別方法研究[J]. 馬穎,馬杰. 中國新通信. 2018(06)
[3]基于作者主題模型和輻射模型的用戶位置預(yù)測(cè)模型[J]. 李琰,劉嘉勇. 計(jì)算機(jī)應(yīng)用. 2018(04)
[4]醫(yī)院考勤管理系統(tǒng)中利用微信進(jìn)行身份及位置識(shí)別的實(shí)現(xiàn)方法[J]. 馬尚寅,高關(guān)心,劉嘉吉. 中國數(shù)字醫(yī)學(xué). 2017(02)
[5]C4.5算法在移動(dòng)通信行業(yè)客戶流失分析中的應(yīng)用[J]. 鄒競(jìng),謝鯤. 計(jì)算技術(shù)與自動(dòng)化. 2009(03)
[6]基于雙Kohonen神經(jīng)網(wǎng)絡(luò)的Web用戶訪問模式挖掘算法[J]. 段隆振,朱敏,王靚明. 計(jì)算機(jī)工程與科學(xué). 2009(09)
[7]一種考慮非視線傳播影響的TOA定位算法[J]. 王昕,王宗欣,劉石. 通信學(xué)報(bào). 2001(03)
碩士論文
[1]基于用戶大數(shù)據(jù)的特征分析及可視化[D]. 李林旭.北京郵電大學(xué) 2018
[2]基于核心網(wǎng)數(shù)據(jù)挖掘的移動(dòng)通信用戶行為分析及應(yīng)用[D]. 熊偉.北京郵電大學(xué) 2014
[3]移動(dòng)互聯(lián)網(wǎng)的用戶行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 鄭桂鳳.北京郵電大學(xué) 2010
本文編號(hào):3309938
【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-2?2014-2020年中國大數(shù)據(jù)產(chǎn)業(yè)規(guī)模市場(chǎng)及預(yù)測(cè)??大數(shù)據(jù)不僅將成為未來科技浪潮中的一股中堅(jiān)力量,勢(shì)必也會(huì)影響人們生活??,
CED??圖3-1算法邏輯流程圖??基于大數(shù)據(jù)的用戶精準(zhǔn)定位算法完整的邏輯流程如圖3-1所示。在實(shí)際情況??中,待定位的用戶A使用的終端在使用移動(dòng)網(wǎng)絡(luò)時(shí)生成的流量上網(wǎng)日志記錄數(shù)??據(jù)為Traffic_Data,同時(shí)基站采集到的用戶測(cè)量報(bào)告數(shù)據(jù)為MR_Data,此時(shí)對(duì)用??戶A進(jìn)行精準(zhǔn)定位時(shí)會(huì)出現(xiàn)如下三種情況:第一種,如果用戶A的Traffic_Data??中的URL信息中包含精確的GPS位置信息,那么就可以通過解析用戶A的??17??
3.4.3驗(yàn)證結(jié)果??為了評(píng)估上面提出算法的定位效果,我們依靠Hive平臺(tái)對(duì)原始數(shù)據(jù)進(jìn)行處??理,同時(shí)利用Python和Java語言對(duì)算法進(jìn)行了實(shí)現(xiàn)。圖3-5是所使用數(shù)據(jù)中某??個(gè)基站下的歷史用戶的所有精確位置點(diǎn)在空間中的分布情況,通過位置點(diǎn)的經(jīng)緯??度查詢得知,該處為中國某大型城市的一個(gè)醫(yī)院附近,分布符合預(yù)期。??Distribution?of?original?points??29?700?_?original?position????base?station??29.675?■??29.650-??29.625?-?”?1??29.600?-??#?X??29.575?-??X?X?X?X?X??29.550-??X?K?X?XX??29.525?-??106.46?106.48?106.50?106.52?106.54?106.56?106.58?106.60??圖3-5歷史用戶精確位置空間分布圖??圖3-6是所使用數(shù)據(jù)中某個(gè)基站下的歷史用戶的所有精確位置點(diǎn)在時(shí)間上??的分布情況,可以看到位置點(diǎn)主要集中在早上8點(diǎn)到晚上10點(diǎn)之間,并且可以??知道這個(gè)時(shí)間段是人們主要的出行時(shí)間段,符合人們的出行規(guī)律。??25??
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)序列GPS數(shù)據(jù)集的用戶位置挖掘方法研究[J]. 王鐵軍,趙禮劍,朱熙. 地理信息世界. 2018(02)
[2]用戶定位及室內(nèi)用戶識(shí)別方法研究[J]. 馬穎,馬杰. 中國新通信. 2018(06)
[3]基于作者主題模型和輻射模型的用戶位置預(yù)測(cè)模型[J]. 李琰,劉嘉勇. 計(jì)算機(jī)應(yīng)用. 2018(04)
[4]醫(yī)院考勤管理系統(tǒng)中利用微信進(jìn)行身份及位置識(shí)別的實(shí)現(xiàn)方法[J]. 馬尚寅,高關(guān)心,劉嘉吉. 中國數(shù)字醫(yī)學(xué). 2017(02)
[5]C4.5算法在移動(dòng)通信行業(yè)客戶流失分析中的應(yīng)用[J]. 鄒競(jìng),謝鯤. 計(jì)算技術(shù)與自動(dòng)化. 2009(03)
[6]基于雙Kohonen神經(jīng)網(wǎng)絡(luò)的Web用戶訪問模式挖掘算法[J]. 段隆振,朱敏,王靚明. 計(jì)算機(jī)工程與科學(xué). 2009(09)
[7]一種考慮非視線傳播影響的TOA定位算法[J]. 王昕,王宗欣,劉石. 通信學(xué)報(bào). 2001(03)
碩士論文
[1]基于用戶大數(shù)據(jù)的特征分析及可視化[D]. 李林旭.北京郵電大學(xué) 2018
[2]基于核心網(wǎng)數(shù)據(jù)挖掘的移動(dòng)通信用戶行為分析及應(yīng)用[D]. 熊偉.北京郵電大學(xué) 2014
[3]移動(dòng)互聯(lián)網(wǎng)的用戶行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 鄭桂鳳.北京郵電大學(xué) 2010
本文編號(hào):3309938
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3309938.html
最近更新
教材專著