公共交通運營大數(shù)據(jù)聚類分析方法及應用研究
【學位單位】:武漢輕工大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:U491.17;TP311.13
【部分圖文】:
DataNodes上執(zhí)行此工作任務。如是,NameNode和JobTracker是為管理者,??DataNodes和TaskTrackers是為工作者,共同配合完成任務的執(zhí)行操作[27〗。??Hadoop集群的整體部署架構如圖2-2所示:??Master??NameNode?JobTracker??U=q==#=zczd_??、、、】?、、■'、??Slave?Slave?Slave??■?????,??私’?^?、冷?\??DataNode?TaskTracker?DataNode?TaskTracker?DataNode?TaskTracker??圖2-2?Hadoop集群的整體部署架構??12??
(分布式文件系統(tǒng))?I??圖2-1?Hadoop生態(tài)系統(tǒng)圖??2_?3.?3?Hadoop工作架構??Hadoop是一個Map?/?Reduce框架,運作在HDFS或HBase?(列式存儲數(shù)據(jù)??庫)上。其本質(zhì)是將一個整體較為復雜的工作分割成為若干單獨的任務,分割的??小任務能夠同時在不同的數(shù)據(jù)節(jié)點上運行。每個被分割的小任務在Map階段執(zhí)??行并行運算,最后在Reduce階段合并運行的結果。??Hadoop集群采用了?Master/Slaves?(主從結構)的架構設計,NameNode?(名??稱節(jié)點)是Master(主服務器),DataNode?(數(shù)據(jù)節(jié)點)是Slave(從服務器)。??NameNode和DataNodes負責處理HDFS的工作,其中,NameNode負責管理文??件系統(tǒng)的名稱空間及外部用戶訪問的控制,DataNodes則響應來自HDFS和??NameNode的命令。??JobTracker?和?TaskTrackers?共同完成?MapReduce?的工作
DataNode響應來自文件系統(tǒng)用戶的請求并且提供數(shù)據(jù)讀寫服務。同時,DataNode??基于NameNode執(zhí)行數(shù)據(jù)塊創(chuàng)建,刪除和冗余備份等工作。??客戶端、DataNode以及NameNode三者之間的交互關系如圖2-3所示:??NameNode?Metadata?(Name.?Replicas...)??元數(shù)據(jù)操^名稱節(jié)點?—存儲元數(shù)描??---??、客戶端j?\??:廣??讀/?\??.....1???????\?_丨.丨丨..i?丨丨丨_??DataNode?DataNode??數(shù)據(jù)鋸節(jié)點?)?數(shù)據(jù)據(jù)節(jié)點??\m?\?\mm\?????????……????機架1?\?/?機架2??寫\?,?一、、、/寫??圖2-3?HDFS架構圖??2.?5?MapReduce??2.?5.?1?MapReduce?概述??Hadoop另一個重要組成部分MapReduce是一個并行編程模型,它可以并行??的處理上TB級海量的大數(shù)據(jù)集,并且具有非常好的可靠性及容錯性。MapReduce??數(shù)據(jù)集的整體處理過程可以分成為兩個部分,即任務的分解和結果的匯總。在任??務處理過程中,MapReduce將海量數(shù)據(jù)集的操作分發(fā)給主節(jié)點下的各個子節(jié)點,??然后整合各子節(jié)點的處理結果分而治之共同完成數(shù)據(jù)
【參考文獻】
相關期刊論文 前10條
1 吳騰奇;;智能交通系統(tǒng)構成及發(fā)展研究[J];汽車工業(yè)研究;2015年12期
2 陸化普;孫智源;屈聞聰;;大數(shù)據(jù)及其在城市智能交通系統(tǒng)中的應用綜述[J];交通運輸系統(tǒng)工程與信息;2015年05期
3 李正熙;;中國城市智能交通系統(tǒng)產(chǎn)業(yè)化發(fā)展趨勢[J];自動化博覽;2015年07期
4 段桂芹;;基于均值與最大距離乘積的初始聚類中心優(yōu)化K-means算法[J];計算機與數(shù)字工程;2015年03期
5 董春濤;李文婷;沈晴霓;吳中海;;Hadoop YARN大數(shù)據(jù)計算框架及其資源調(diào)度機制研究[J];信息通信技術;2015年01期
6 謝然;;大數(shù)據(jù)社會的具體場景[J];互聯(lián)網(wǎng)周刊;2014年22期
7 楊銘;;數(shù)據(jù)挖掘中聚類算法的分析與研究[J];網(wǎng)友世界;2014年15期
8 劉智慧;張泉靈;;大數(shù)據(jù)技術研究綜述[J];浙江大學學報(工學版);2014年06期
9 趙清;唐菁;;電信業(yè)數(shù)據(jù)倉庫體系結構及關鍵技術研究[J];信息通信技術;2013年06期
10 王德青;朱建平;謝邦昌;;主成分聚類分析有效性的思考[J];統(tǒng)計研究;2012年11期
相關博士學位論文 前1條
1 高聯(lián)雄;智能公交系統(tǒng)數(shù)據(jù)挖掘研究與應用[D];北京郵電大學;2011年
相關碩士學位論文 前9條
1 蘇金;基于Hadoop的物流歷史數(shù)據(jù)聚類挖掘研究[D];西安工業(yè)大學;2017年
2 何晴;基于聚類的多層關聯(lián)規(guī)則挖掘算法研究與改進[D];上海師范大學;2017年
3 黃亞萍;基于聚類分析的電子商務客戶細分系統(tǒng)的設計與實現(xiàn)[D];江蘇科技大學;2016年
4 劉越;K-means聚類算法的改進[D];廣西師范大學;2016年
5 萬旭;基于Hadoop平臺的聚類算法研究[D];西安電子科技大學;2016年
6 宋媛;聚類分析中確定最佳聚類數(shù)的若干問題研究[D];延邊大學;2013年
7 李存琛;海量數(shù)據(jù)分布式存儲技術的研究與應用[D];北京郵電大學;2013年
8 袁勇;公交IC卡數(shù)據(jù)挖掘技術及應用研究[D];吉林大學;2009年
9 張滌;基于文化算法的聚類分析研究[D];西南交通大學;2008年
本文編號:2856572
本文鏈接:http://sikaile.net/kejilunwen/daoluqiaoliang/2856572.html