基于Spark的高光譜圖像分布式并行分類
發(fā)布時間:2021-08-26 23:51
高光譜遙感圖像有光譜波段多、光譜分辨率高、成像范圍大的特點,包含豐富的空間信息和光譜信息,在地理地貌分析方面有著明顯的優(yōu)勢。高光譜遙感圖像分類技術是遙感信息解釋的重要手段之一,在資源勘探和環(huán)境監(jiān)測等領域有著廣泛應用。隨著高光譜遙感儀的探測技術的不斷提升,高光譜遙感圖像的數據量越來越大,如何高效地對海量高光譜圖像進行分類處理成為遙感處理領域的一個重要課題。傳統的單機計算平臺不足以支撐海量高光譜數據的處理要求。而云計算技術具備分布式存儲和并行計算的特點,能夠有效地解決海量高光譜遙感圖像在單機運行環(huán)境中的計算瓶頸問題。Spark是一個基于內存的分布式的數據處理框架,是最重要的云計算處理平臺之一。Spark的彈性分布式數據集(RDD)擁有豐富的運算算子,并且支持中間任務結果緩存到內存,因此適合于解決海量數據的復雜迭代計算問題。本文基于Spark平臺研究了高光譜圖像分類算法的分布式并行計算原理,提出了兩種高光譜圖像分布式并行分類方法。主要工作如下:(一)研究了基于空間相關性約束稀疏表示的高光譜圖像分類方法(SCSRC),并在此基礎了提出了 Spark平臺上的基于空間相關性約束稀疏表示的高光譜圖像...
【文章來源】:南京理工大學江蘇省 211工程院校
【文章頁數】:65 頁
【學位級別】:碩士
【部分圖文】:
圖1.1高光譜成像原理[28】??高光譜圖像分類是近年來遙感領域頗受歡迎的應用之一,地物分類結果清晰地反??映地物的空間分布,在遙感地物識別方面有重要的意義
圖2.1?Spark核心體系??布式數據集(RDD)??用的分布式數據結構是彈性分布式數據集(Resilient?Distributed?DD是對分布于Spark集群中各個計算節(jié)點,存儲于內存中的數
文件?RDD?行動算子?結果??圖2.2?RDD的操作算子??子RDD既可以由一個父RDD轉換而來,又可以由多個RDD轉換。子RDD與父??RDD之間的分區(qū)依賴關系分為兩類:(1)窄依賴,同一個父RDD的一個分區(qū)只負責轉??換子RDD的一個分區(qū);(2)寬依賴,同一個父RDD的一個分區(qū)負責同時轉換成多個子??RDD分區(qū)。觸發(fā)計算時會將父RDD?(s)的某個分區(qū)數據傳輸到子RDD的分區(qū)中,如??果是窄依賴,父RDD的某個分區(qū)會就近在本地節(jié)點創(chuàng)建子RDD的一個分區(qū);而如果??是寬依賴,父RDD的某個分區(qū)數據會傳輸到子RDD的多個分區(qū),這些分區(qū)不太可能??都在本地節(jié)點創(chuàng)建,相反可能跨節(jié)點創(chuàng)建并觸發(fā)數據shuffle,即跨界點數據傳輸。因??此
本文編號:3365211
【文章來源】:南京理工大學江蘇省 211工程院校
【文章頁數】:65 頁
【學位級別】:碩士
【部分圖文】:
圖1.1高光譜成像原理[28】??高光譜圖像分類是近年來遙感領域頗受歡迎的應用之一,地物分類結果清晰地反??映地物的空間分布,在遙感地物識別方面有重要的意義
圖2.1?Spark核心體系??布式數據集(RDD)??用的分布式數據結構是彈性分布式數據集(Resilient?Distributed?DD是對分布于Spark集群中各個計算節(jié)點,存儲于內存中的數
文件?RDD?行動算子?結果??圖2.2?RDD的操作算子??子RDD既可以由一個父RDD轉換而來,又可以由多個RDD轉換。子RDD與父??RDD之間的分區(qū)依賴關系分為兩類:(1)窄依賴,同一個父RDD的一個分區(qū)只負責轉??換子RDD的一個分區(qū);(2)寬依賴,同一個父RDD的一個分區(qū)負責同時轉換成多個子??RDD分區(qū)。觸發(fā)計算時會將父RDD?(s)的某個分區(qū)數據傳輸到子RDD的分區(qū)中,如??果是窄依賴,父RDD的某個分區(qū)會就近在本地節(jié)點創(chuàng)建子RDD的一個分區(qū);而如果??是寬依賴,父RDD的某個分區(qū)數據會傳輸到子RDD的多個分區(qū),這些分區(qū)不太可能??都在本地節(jié)點創(chuàng)建,相反可能跨節(jié)點創(chuàng)建并觸發(fā)數據shuffle,即跨界點數據傳輸。因??此
本文編號:3365211
本文鏈接:http://sikaile.net/guanlilunwen/gongchengguanli/3365211.html