公共交通運(yùn)營(yíng)大數(shù)據(jù)聚類分析方法及應(yīng)用研究
【學(xué)位單位】:武漢輕工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:U491.17;TP311.13
【部分圖文】:
DataNodes上執(zhí)行此工作任務(wù)。如是,NameNode和JobTracker是為管理者,??DataNodes和TaskTrackers是為工作者,共同配合完成任務(wù)的執(zhí)行操作[27〗。??Hadoop集群的整體部署架構(gòu)如圖2-2所示:??Master??NameNode?JobTracker??U=q==#=zczd_??、、、】?、、■'、??Slave?Slave?Slave??■?????,??私’?^?、冷?\??DataNode?TaskTracker?DataNode?TaskTracker?DataNode?TaskTracker??圖2-2?Hadoop集群的整體部署架構(gòu)??12??
(分布式文件系統(tǒng))?I??圖2-1?Hadoop生態(tài)系統(tǒng)圖??2_?3.?3?Hadoop工作架構(gòu)??Hadoop是一個(gè)Map?/?Reduce框架,運(yùn)作在HDFS或HBase?(列式存儲(chǔ)數(shù)據(jù)??庫)上。其本質(zhì)是將一個(gè)整體較為復(fù)雜的工作分割成為若干單獨(dú)的任務(wù),分割的??小任務(wù)能夠同時(shí)在不同的數(shù)據(jù)節(jié)點(diǎn)上運(yùn)行。每個(gè)被分割的小任務(wù)在Map階段執(zhí)??行并行運(yùn)算,最后在Reduce階段合并運(yùn)行的結(jié)果。??Hadoop集群采用了?Master/Slaves?(主從結(jié)構(gòu))的架構(gòu)設(shè)計(jì),NameNode?(名??稱節(jié)點(diǎn))是Master(主服務(wù)器),DataNode?(數(shù)據(jù)節(jié)點(diǎn))是Slave(從服務(wù)器)。??NameNode和DataNodes負(fù)責(zé)處理HDFS的工作,其中,NameNode負(fù)責(zé)管理文??件系統(tǒng)的名稱空間及外部用戶訪問的控制,DataNodes則響應(yīng)來自HDFS和??NameNode的命令。??JobTracker?和?TaskTrackers?共同完成?MapReduce?的工作
DataNode響應(yīng)來自文件系統(tǒng)用戶的請(qǐng)求并且提供數(shù)據(jù)讀寫服務(wù)。同時(shí),DataNode??基于NameNode執(zhí)行數(shù)據(jù)塊創(chuàng)建,刪除和冗余備份等工作。??客戶端、DataNode以及NameNode三者之間的交互關(guān)系如圖2-3所示:??NameNode?Metadata?(Name.?Replicas...)??元數(shù)據(jù)操^名稱節(jié)點(diǎn)?—存儲(chǔ)元數(shù)描??---??、客戶端j?\??:廣??讀/?\??.....1???????\?_丨.丨丨..i?丨丨丨_??DataNode?DataNode??數(shù)據(jù)鋸節(jié)點(diǎn)?)?數(shù)據(jù)據(jù)節(jié)點(diǎn)??\m?\?\mm\?????????……????機(jī)架1?\?/?機(jī)架2??寫\?,?一、、、/寫??圖2-3?HDFS架構(gòu)圖??2.?5?MapReduce??2.?5.?1?MapReduce?概述??Hadoop另一個(gè)重要組成部分MapReduce是一個(gè)并行編程模型,它可以并行??的處理上TB級(jí)海量的大數(shù)據(jù)集,并且具有非常好的可靠性及容錯(cuò)性。MapReduce??數(shù)據(jù)集的整體處理過程可以分成為兩個(gè)部分,即任務(wù)的分解和結(jié)果的匯總。在任??務(wù)處理過程中,MapReduce將海量數(shù)據(jù)集的操作分發(fā)給主節(jié)點(diǎn)下的各個(gè)子節(jié)點(diǎn),??然后整合各子節(jié)點(diǎn)的處理結(jié)果分而治之共同完成數(shù)據(jù)
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吳騰奇;;智能交通系統(tǒng)構(gòu)成及發(fā)展研究[J];汽車工業(yè)研究;2015年12期
2 陸化普;孫智源;屈聞聰;;大數(shù)據(jù)及其在城市智能交通系統(tǒng)中的應(yīng)用綜述[J];交通運(yùn)輸系統(tǒng)工程與信息;2015年05期
3 李正熙;;中國(guó)城市智能交通系統(tǒng)產(chǎn)業(yè)化發(fā)展趨勢(shì)[J];自動(dòng)化博覽;2015年07期
4 段桂芹;;基于均值與最大距離乘積的初始聚類中心優(yōu)化K-means算法[J];計(jì)算機(jī)與數(shù)字工程;2015年03期
5 董春濤;李文婷;沈晴霓;吳中海;;Hadoop YARN大數(shù)據(jù)計(jì)算框架及其資源調(diào)度機(jī)制研究[J];信息通信技術(shù);2015年01期
6 謝然;;大數(shù)據(jù)社會(huì)的具體場(chǎng)景[J];互聯(lián)網(wǎng)周刊;2014年22期
7 楊銘;;數(shù)據(jù)挖掘中聚類算法的分析與研究[J];網(wǎng)友世界;2014年15期
8 劉智慧;張泉靈;;大數(shù)據(jù)技術(shù)研究綜述[J];浙江大學(xué)學(xué)報(bào)(工學(xué)版);2014年06期
9 趙清;唐菁;;電信業(yè)數(shù)據(jù)倉(cāng)庫體系結(jié)構(gòu)及關(guān)鍵技術(shù)研究[J];信息通信技術(shù);2013年06期
10 王德青;朱建平;謝邦昌;;主成分聚類分析有效性的思考[J];統(tǒng)計(jì)研究;2012年11期
相關(guān)博士學(xué)位論文 前1條
1 高聯(lián)雄;智能公交系統(tǒng)數(shù)據(jù)挖掘研究與應(yīng)用[D];北京郵電大學(xué);2011年
相關(guān)碩士學(xué)位論文 前9條
1 蘇金;基于Hadoop的物流歷史數(shù)據(jù)聚類挖掘研究[D];西安工業(yè)大學(xué);2017年
2 何晴;基于聚類的多層關(guān)聯(lián)規(guī)則挖掘算法研究與改進(jìn)[D];上海師范大學(xué);2017年
3 黃亞萍;基于聚類分析的電子商務(wù)客戶細(xì)分系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];江蘇科技大學(xué);2016年
4 劉越;K-means聚類算法的改進(jìn)[D];廣西師范大學(xué);2016年
5 萬旭;基于Hadoop平臺(tái)的聚類算法研究[D];西安電子科技大學(xué);2016年
6 宋媛;聚類分析中確定最佳聚類數(shù)的若干問題研究[D];延邊大學(xué);2013年
7 李存琛;海量數(shù)據(jù)分布式存儲(chǔ)技術(shù)的研究與應(yīng)用[D];北京郵電大學(xué);2013年
8 袁勇;公交IC卡數(shù)據(jù)挖掘技術(shù)及應(yīng)用研究[D];吉林大學(xué);2009年
9 張滌;基于文化算法的聚類分析研究[D];西南交通大學(xué);2008年
本文編號(hào):2856572
本文鏈接:http://sikaile.net/kejilunwen/daoluqiaoliang/2856572.html