基于Spark的Canopy-FCM在氣象中的應(yīng)用
【文章頁數(shù)】:5 頁
【部分圖文】:
圖1Spark架構(gòu)
Spark在分布式環(huán)境下采用主從結(jié)構(gòu)模型,包括Driver和Worker節(jié)點(diǎn),程序運(yùn)行之前將數(shù)據(jù)存儲(chǔ)在HadoopDistributedFileSystem(HDFS)中,接著Driver會(huì)運(yùn)行應(yīng)用中的方法創(chuàng)建SparkContext以及RDD,DAGScheduler對(duì)象....
圖2基于Spark的Canopy-FCM算法流程
基于Spark的Canopy-FCM算法流程如圖2所示。(1)配置好Spark運(yùn)行環(huán)境并初始化各參數(shù)。通過hadoopfs-put命令將數(shù)據(jù)上傳到HDFS上,調(diào)用SparkContext的sc.textFile()方法將數(shù)據(jù)轉(zhuǎn)換為Spark-RDD,通過map操作轉(zhuǎn)換為向量緩....
圖3天津降水區(qū)劃圖
實(shí)驗(yàn)結(jié)果如圖3所示,由圖3可以看出天津208個(gè)區(qū)域自動(dòng)氣象站降水分布可分為4個(gè)區(qū)域,1區(qū)主要集中在中部和北部區(qū)域,共有96個(gè)站;2區(qū)集中在東部區(qū)域,共有29個(gè)站;3區(qū)集中在東南部,共有31個(gè)站;4區(qū)主要集中在西南部,共有52個(gè)站。圖4是實(shí)驗(yàn)得到的天津市4個(gè)分區(qū)降水量年平均分布圖,....
圖4天津市4個(gè)分區(qū)降水量年平均分布
圖4是實(shí)驗(yàn)得到的天津市4個(gè)分區(qū)降水量年平均分布圖,由圖4可以看出,4個(gè)分區(qū)的降水主要集中在6~9月,7月降水量最為顯著,其次是8月、6月、9月,這一趨勢與中國氣象局氣象數(shù)據(jù)中心發(fā)布的天津氣候類型圖(1981-2010)一致。4個(gè)分區(qū)的具體分析如下:1區(qū)主要位于天津中部和北部區(qū)域,....
本文編號(hào):3949883
本文鏈接:http://sikaile.net/projectlw/qxxlw/3949883.html