天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

基于Spark的城市熱點基站流量分析系統(tǒng)的研究與應(yīng)用

發(fā)布時間:2020-05-16 12:15
【摘要】:近年來,移動互聯(lián)網(wǎng)迅猛發(fā)展,已經(jīng)成為人們生活中不可或缺的一部分。基站作為用戶和互聯(lián)網(wǎng)連接的樞紐,基站提供的網(wǎng)絡(luò)服務(wù)質(zhì)量的好壞直接影響了用戶的使用體驗。如何評估城市范圍內(nèi)不同區(qū)域不同時間的網(wǎng)絡(luò)服務(wù)質(zhì)量,識別出城市范圍內(nèi)的熱點基站是運營商需要關(guān)注的問題。對城市范圍內(nèi)基站流量、連接人數(shù)、網(wǎng)址訪問類別等特征的時空規(guī)律分析為運營商在改善網(wǎng)絡(luò)服務(wù)質(zhì)量、提高網(wǎng)絡(luò)資源利用率、未來網(wǎng)絡(luò)設(shè)施規(guī)劃等方面提供了指導(dǎo)作用。本文從移動基站流量數(shù)據(jù)出發(fā),提出了一種基于熵權(quán)法的熱點基站定義方法,在此基礎(chǔ)上,對熱點基站的時間分布、空間分布等做了研究。本文使用了樸素貝葉斯算法對移動互聯(lián)網(wǎng)中網(wǎng)址進(jìn)行分類,使用了 TF-IDF算法探究不同類型的網(wǎng)址訪問對熱點基站的重要性。對人群移動、人群分布的研究在城市規(guī)劃、交通建設(shè)等方面有著重要的意義。本文首先使用了三種基于時間序列的模型對基站的連接人數(shù)進(jìn)行了預(yù)測,并比較了三種模型的性能優(yōu)劣。然后提出了一種基于基站時空特征的連接人數(shù)預(yù)測方法,實驗表明,本文提出的算法在大部分的基站數(shù)據(jù)集中的表現(xiàn)優(yōu)于僅使用時間序列的算法。大數(shù)據(jù)環(huán)境下,傳統(tǒng)的數(shù)據(jù)處理工具已經(jīng)不再適用,本文借助開源大數(shù)據(jù)框架Hadoop來完成數(shù)據(jù)處理工作,然而開源大數(shù)據(jù)處理工具在安全性、權(quán)限控制、結(jié)果展示等方面存在著不足;谶@一問題,本文開發(fā)了基于Spark的流量分析系統(tǒng),在web端集成了Spark Shell、Spark SQL、Spark作業(yè)提交三個功能,為包括但不限于流量分析的大數(shù)據(jù)分析提供了便利。
【圖文】:

架構(gòu)圖,架構(gòu),單點故障


邐Rack邋n逡逑圖2-2邋HDFS邋HA架構(gòu)圖逡逑由圖2-2我們可以看到,HDFS的HA是基于Zookeepei?集群實現(xiàn)的。active逡逑節(jié)點的元數(shù)據(jù)分為兩部分,一部分是合并后的fcimage,一部分是剛寫入的edits。逡逑HA機制將edits的數(shù)據(jù)放到Zookeeper集群中,standby節(jié)點通過Zookeepei?不斷逡逑的將edits文件同步到自己的fsimage中。在NameNode節(jié)點上存在著一個監(jiān)控逡逑進(jìn)程來監(jiān)控NameNode的狀態(tài),,一旦發(fā)現(xiàn)NameNode故障,即進(jìn)行主備切換,避逡逑免了邋NameNode的單點故障。逡逑>邋DataNode逡逑7逡逑

互聯(lián)網(wǎng),流量,報文,數(shù)據(jù)采集系統(tǒng)


逡逑Spark邋SQL的架構(gòu)如圖2-4所示,Spark邋SQL基于多種執(zhí)行引擎(雖然目前逡逑僅支持Spark執(zhí)行引擎,但設(shè)計上,Catalyst是支持多種執(zhí)行引擎的,比如逡逑MapReduce引擎等)、多種SQL解析器,面向用戶提供了類似Hive的CLI以及逡逑SQL服務(wù)接口,向上提供JDBC服務(wù)等。面向開發(fā)人員提供了邋SQL邋DSL邋API。逡逑2.3數(shù)據(jù)采集系統(tǒng)逡逑本文所使用的數(shù)據(jù)集是由筆者實驗室參與研發(fā)的流量監(jiān)控與采集系統(tǒng)逡逑(Traffic邋Monitor邋System,邋TMS)在中國北方某省骨干網(wǎng)采集得到,采集系統(tǒng)的逡逑架構(gòu)如圖2-5所示,所采集的流量分為兩種:一種是手機、平板等通過基站連接逡逑互聯(lián)網(wǎng)產(chǎn)生的流量,一種是個人電腦等固定設(shè)備通過核心交換機連接到互聯(lián)網(wǎng)產(chǎn)逡逑生的流量。對于通過基站產(chǎn)生的流量,會先傳遞給SGSN邋(ServingGPRS邋Support逡逑Node
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TN929.5

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 孫建順;;基于SPARK課程理念優(yōu)化足球教學(xué)的實踐探索——以小學(xué)足球正腳背運球為例[J];教學(xué)月刊小學(xué)版(綜合);2017年09期

2 陳虹君;謝彩云;;基于Spark的大數(shù)據(jù)實驗室建設(shè)的研究與實施[J];教育現(xiàn)代化;2016年37期

3 余濤;劉澤q

本文編號:2666722


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2666722.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ffedc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com