大數(shù)據(jù)處理技術(shù)在用電行為分析中的應(yīng)用研究

發(fā)布時間：2020-08-25 19:45

【摘要】：隨著大數(shù)據(jù)概念的提出,大數(shù)據(jù)迅速成為國內(nèi)外學(xué)者研究的熱點,大數(shù)據(jù)技術(shù)也被廣泛應(yīng)用在各行各業(yè)。電力行業(yè)是大數(shù)據(jù)技術(shù)應(yīng)用的重要領(lǐng)域之一,近年來,隨著智能小區(qū)的試點建設(shè),積累了大量的居民用電數(shù)據(jù)。高頻、海量、分散等是用戶用電數(shù)據(jù)的重要特點,不僅如此,數(shù)據(jù)之間存在著一定的相似性與關(guān)聯(lián)性,海量的用電數(shù)據(jù)中潛藏著用電用戶的用電習(xí)慣,運用數(shù)據(jù)挖掘算法對用電數(shù)據(jù)進行挖掘分析,有助于電網(wǎng)對用戶進行個性化劃分,從而提供更好的服務(wù),為未來的電力需求側(cè)響應(yīng)政策的制定提供數(shù)據(jù)支撐。本文針對大數(shù)據(jù)處理技術(shù)和用電行為分析方面展開研究。首先對大數(shù)據(jù)處理的相關(guān)技術(shù)進行了研究和分析,主要研究大數(shù)據(jù)的定義、特點和計算特征,并研究了目前處理大數(shù)據(jù)的相關(guān)技術(shù),例如Hadoop平臺、Spark分布式計算框架、Hive和HBase數(shù)據(jù)庫。然后分析了聚類算法中的K-means算法的基本思想,并針對K-means算法中初始聚類中心的選擇不穩(wěn)定這一缺陷,給出了一種基于密度的最大權(quán)值法改進算法。并采用UCI數(shù)據(jù)集進行了對比試驗,驗證了改進算法聚類結(jié)果的準確率和穩(wěn)定性。此外為了使改進的K-means算法能夠用于電力大數(shù)據(jù)場景,完成了基于Spark的改進K-means算法并行化設(shè)計,并通過實驗驗證了改進算法的正確性。然后將改進后的算法應(yīng)用在用戶用電行為分析中,通過對來自愛爾蘭的CER數(shù)據(jù)集分析,分析了各類用戶的負荷特性,完成了對用戶的分類,并給出了各類用戶的具體用電優(yōu)化方案。最后本文基于大數(shù)據(jù)處理技術(shù)設(shè)計完成了基于Spark平臺用電行為分析系統(tǒng),該系統(tǒng)實現(xiàn)了細分用電用戶、提供用電優(yōu)化建議、管理用電數(shù)據(jù)等功能。該系統(tǒng)更好地實現(xiàn)了將大數(shù)據(jù)處理技術(shù)應(yīng)用到電力行業(yè)的信息化建設(shè)方案。
【學(xué)位授予單位】：華北電力大學(xué)
【學(xué)位級別】：碩士
【學(xué)位授予年份】：2019
【分類號】：TM73;TP311.13
【圖文】：

基本架構(gòu)

與簇心的距離），進行對比，將該數(shù)據(jù)點分至距離該數(shù)據(jù)點最近上計算重心的方法調(diào)整聚類中心(將聚類中心移動至中心位置)，是否收斂，如果沒有收斂，反復(fù)迭代執(zhí)行，迭代后需要比較兩次置，如果移動位置小于某個值或者未移動表明算法收斂。當所有示算法已經(jīng)結(jié)束。doop 分布式系統(tǒng)oop 是一個基于分布式的基本系統(tǒng)框架，該框架由 Apache 基金會。該框架的實現(xiàn)需要大量的計算機做支撐，采用數(shù)量上的優(yōu)勢去儲和高效的數(shù)據(jù)計算。因此在設(shè)計上 Hadoop 分布式系統(tǒng)主要由MapReduce[7]計算框架和 HDFS[36]存儲框架。FS 采用 master/slave 架構(gòu)，在整個 HDFS 集群中不僅包括許多存e 節(jié)點，并且有且僅有一個單獨的負責文件系統(tǒng)的命名空間和文件NameNode 節(jié)點。DataNode 節(jié)點向 NameNode 節(jié)點報告所其實際據(jù)。具體框架如圖 2-1 所示。

編程模型

圖 2- 2 Spark RDD 編程模型.1 分布式文件系統(tǒng)Hadoop 分布式文件系統(tǒng)（HDFS）可以在普通的硬件上進行部署，它可以布式的存儲在計算機存儲硬件群中。此外 HDFS 容錯性高，可以在廉價的進行部署。在數(shù)據(jù)訪問方面，HDFS 可以滿足流式數(shù)據(jù)訪問功能，并且吞滿足大規(guī)模數(shù)據(jù)的訪問。HDFS 具有以下明顯優(yōu)勢:（1）硬件錯誤檢測：每一份數(shù)據(jù)默認存儲 3 份。此外每當服務(wù)器硬件發(fā)HDFS 能夠進行快速檢測，并且根據(jù)備份數(shù)據(jù)快速自動恢復(fù)損失的數(shù)據(jù)塊（2）流式數(shù)據(jù)訪問：HDFS 采用流式數(shù)據(jù)訪問，并且修改了部分可移植操口的語義，操作兼容性更強，同時也提高了數(shù)據(jù)訪問吞吐量。（3）大規(guī)模數(shù)據(jù)集：在存儲大規(guī)模數(shù)據(jù)方面，HDFS 采用數(shù)據(jù)塊的方式。的文件快，僅靠一個單獨的 HDFS 實例便可以進行支撐。（4）簡單的一致性模型：HDFS 采取最簡單的“一次寫入多次讀取”策略文件一旦經(jīng)過創(chuàng)建、寫入和關(guān)閉，那么這個文件就會被“鎖定”，也就是禁

視圖,運行框架

圖 2-3 Spark 運行框架 Spark 應(yīng)用框架park 在 SparkCore 引用引擎的基礎(chǔ)上，目前已經(jīng)形成了比較完善的生態(tài)括 Spark SQL，Spark String，Spark MLib，Spark GraphX 和 Spark R 等1） Spark SQL[38]：sql 查詢工具，實現(xiàn)本地和 HDFS 中相關(guān)文件的讀向 RDD 的文件轉(zhuǎn)化，通過 Sparkcore 的計算，在數(shù)據(jù)倉庫中進行注冊現(xiàn)通過 sql 語句對分布式存儲的數(shù)據(jù)的查詢操作。2） Spark Streaming：此為流式計算框架。把數(shù)據(jù)流轉(zhuǎn)化為 RDD，然處理，減少了計算量。3） Spark MLlib：機器學(xué)習(xí)的處理方案。該解決方案采用 Spark 的 R模型，效率高，并且支持決策樹、樸素貝葉斯、奇異值分解等機器學(xué)習(xí)4） Spark GraphX[39]：圖并行計算框架。GraphX 對 RDD 的抽象進的擴展，最核心的部分是有向多重圖：RDPG（Resilient Distributed P）。GraphX 在提供具有獨立操作符的 Table 和 Graph 兩種視圖，靈活5） SparkR：Spark R 提供 RDD 的程序接口，實現(xiàn)了在多臺機器內(nèi)存

【參考文獻】

相關(guān)期刊論文前10條

1 郭曉利;于陽;;基于云計算的家庭智能用電策略[J];電力系統(tǒng)自動化;2015年17期

2 張斌;莊池杰;胡軍;陳水明;張明明;王科;曾嶸;;結(jié)合降維技術(shù)的電力負荷曲線集成聚類算法[J];中國電機工程學(xué)報;2015年15期

3 盧小賓;王濤;;Google三大云計算技術(shù)對海量數(shù)據(jù)分析流程的技術(shù)改進優(yōu)化研究[J];圖書情報工作;2015年03期

4 胡長華;;基于大用戶用電行為分析的錯峰管理系統(tǒng)研究與設(shè)計[J];現(xiàn)代計算機(專業(yè)版);2014年21期

5 張素香;劉建明;趙丙鎮(zhèn);曹津平;;基于云計算的居民用電行為分析模型研究[J];電網(wǎng)技術(shù);2013年06期

6 宋亞奇;周國亮;朱永利;;智能電網(wǎng)大數(shù)據(jù)處理技術(shù)現(xiàn)狀與挑戰(zhàn)[J];電網(wǎng)技術(shù);2013年04期

7 何永秀;王冰;熊威;張婷;劉洋洋;;基于模糊綜合評價的居民智能用電行為分析與互動機制設(shè)計[J];電網(wǎng)技術(shù);2012年10期

8 劉正偉;文中領(lǐng);張海濤;;云計算和云數(shù)據(jù)管理技術(shù)[J];計算機研究與發(fā)展;2012年S1期

9 李培強;李欣然;陳輝華;唐外文;;基于模糊聚類的電力負荷特性的分類與綜合[J];中國電機工程學(xué)報;2005年24期

10 王熙照,王亞東,湛燕,袁方;學(xué)習(xí)特征權(quán)值對K-均值聚類算法的優(yōu)化[J];計算機研究與發(fā)展;2003年06期

本文編號：2804120

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/dianlilw/2804120.html

上一篇：電力電子變壓器前級MMC變流器的自適應(yīng)反步法控制
下一篇：考慮分布式電源接入的鏈式網(wǎng)絡(luò)區(qū)域備自投控制方法研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

大數(shù)據(jù)處理技術(shù)在用電行為分析中的應(yīng)用研究