基于Spark的海量少數(shù)民族文化資源數(shù)據(jù)挖掘研究
【圖文】:
Spark 運(yùn)行框架rk 相對于 MapReduce 的優(yōu)勢不僅體現(xiàn)在基于內(nèi)存的性能上,更架集成了更多的子項(xiàng)目[56],包括Spark SQL(交互式操作)、Spark )、MachineLearning lib(機(jī)器學(xué)習(xí)庫)、Graphx(并行圖計(jì)算庫)。S圖 2.2 所示:rk 的核心是其計(jì)算邏輯,提供了多種組件,運(yùn)行在通用平臺上SparkSQL 可實(shí)現(xiàn)對數(shù)據(jù)庫的操作,主要分 3 步處理;第一步 DataFrame 中提供的方法存儲在內(nèi)存中,它支持多種格式的數(shù)用 SQLContext 類;第二步數(shù)據(jù)處理可以實(shí)現(xiàn)各種算法,主ntext 類,完成 hive 數(shù)據(jù)庫的操作;第三步結(jié)果輸入是把計(jì)算的部存儲文件。Machine Learnig lib 是常用機(jī)器學(xué)習(xí)庫的算法實(shí)現(xiàn)ng 會不斷接收從接收器發(fā)送來的數(shù)據(jù)流,把時(shí)間片內(nèi)的數(shù)據(jù)打包
圖 2.3 Spark運(yùn)行模式riverProgram 是 Spark 的一個(gè)應(yīng)用程序,負(fù)責(zé)對整個(gè)集群的監(jiān)控,節(jié)點(diǎn);它通過 SparkContext 來連接整個(gè)集群,包含 main 函數(shù),是操作的接口。ClusterManager 負(fù)責(zé)分配程序運(yùn)行所需要的資源和保正常運(yùn)行;Worker 是集群的計(jì)算節(jié)點(diǎn),存在于每個(gè) Slave 中,rManager 的命令,并以周期性的心跳機(jī)制向 ClusterManager 匯報(bào)集。每個(gè) Worker 可以單獨(dú)的運(yùn)行,,接收到一個(gè)作業(yè),將其劃分為多個(gè)Executor 進(jìn)程進(jìn)行計(jì)算或者數(shù)據(jù)的存儲。DriverProgram 創(chuàng)建進(jìn)程時(shí) DAGScheduler 和 TaskScheduler;DAGScheduler 屬于高層調(diào)度模ffle 將作業(yè)劃分為不同的 Stage,同時(shí)會根據(jù) Partition 構(gòu)造每個(gè) Sta任務(wù),然后以任務(wù)組的形式交由 TaskScheduler 具體執(zhí)行。2.5 YARN 資源管理器
【學(xué)位授予單位】:云南師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:G122;TP311.13
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 董春濤;李文婷;沈晴霓;吳中海;;Hadoop YARN大數(shù)據(jù)計(jì)算框架及其資源調(diào)度機(jī)制研究[J];信息通信技術(shù);2015年01期
2 黃永林;;數(shù)字化背景下非物質(zhì)文化遺產(chǎn)的保護(hù)與利用[J];文化遺產(chǎn);2015年01期
3 林樂波;陳魯峰;;網(wǎng)絡(luò)教研:引領(lǐng)教研的“新引擎”[J];基礎(chǔ)教育參考;2013年24期
4 劉鵬;孟炎;吳艷艷;宋丹娃;;聚類分析和孤立點(diǎn)技術(shù)在網(wǎng)絡(luò)安全態(tài)勢中的應(yīng)用[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2013年03期
5 饒君;吳斌;東昱曉;;MapReduce環(huán)境下的并行復(fù)雜網(wǎng)絡(luò)鏈路預(yù)測[J];軟件學(xué)報(bào);2012年12期
6 李宗天;;淺談如何保護(hù)和傳承朝鮮族傳統(tǒng)音樂文化[J];品牌(理論月刊);2010年11期
7 華銓平;;面向數(shù)據(jù)特征的分布式數(shù)據(jù)挖掘研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2010年06期
8 王沁;李磊;陸成勇;孫富明;;平均計(jì)算時(shí)間復(fù)雜度優(yōu)化的動態(tài)粒子群優(yōu)化算法[J];計(jì)算機(jī)科學(xué);2010年03期
9 王月;柴瑞敏;;減聚類的模糊C-均值算法在文本分類中的應(yīng)用[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2010年03期
10 吳建平;王耀希;代紅兵;;文化遺產(chǎn)數(shù)字化應(yīng)用平臺的技術(shù)構(gòu)建[J];計(jì)算機(jī)應(yīng)用研究;2006年08期
相關(guān)博士學(xué)位論文 前4條
1 衛(wèi)守林;分布式天文海量數(shù)據(jù)處理與控制研究[D];中國科學(xué)院大學(xué)(中國科學(xué)院云南天文臺);2017年
2 黃家周;文化建設(shè)視域下民族地區(qū)馬克思主義大眾化的路徑研究[D];西南交通大學(xué);2015年
3 王銳;數(shù)字博物館資源虛擬化與數(shù)據(jù)集成方法研究[D];山東大學(xué);2010年
4 李明;智能優(yōu)化排樣技術(shù)研究[D];浙江大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 趙海燕;基于卷積神經(jīng)網(wǎng)絡(luò)的民族服飾圖像教育資源檢索研究[D];云南師范大學(xué);2018年
2 韓浩;基于云計(jì)算的釣魚網(wǎng)站檢測研究[D];中國礦業(yè)大學(xué);2018年
3 鄧家璧;模擬移動床分離過程的控制與優(yōu)化方法研究[D];沈陽化工大學(xué);2018年
4 錢雅倫;基于智能算法的配電網(wǎng)故障自愈方法研究[D];華北電力大學(xué);2018年
5 馮亮亮;基于Hadoop的MapReduce性能優(yōu)化研究[D];南京郵電大學(xué);2017年
6 陳萌;分布式視頻快速識別分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2017年
7 何亞南;基于時(shí)序動態(tài)描述邏輯的民族文化資源知識表示形式化模型研究[D];云南師范大學(xué);2017年
8 吳稀鈺;基于Spark的譜聚類算法及其在QAR數(shù)據(jù)中的應(yīng)用[D];中國民航大學(xué);2017年
9 劉四平;多源數(shù)據(jù)融合的協(xié)同過濾算法研究[D];湖南大學(xué);2017年
10 陳慧麗;云計(jì)算環(huán)境下靜態(tài)任務(wù)調(diào)度機(jī)制研究[D];武漢理工大學(xué);2017年
本文編號:2697501
本文鏈接:http://sikaile.net/shekelunwen/wenhuayichanlunwen/2697501.html