基于K-means算法的高維用電數(shù)據(jù)聚類分析與可視化研究
發(fā)布時間:2021-09-29 22:48
隨著智能電網(wǎng)技術(shù)的飛速發(fā)展,國家全面實施可再生資源政策,社會各個領(lǐng)域?qū)﹄娏Φ男枨蟛粩嘣鲩L,電力能源系統(tǒng)正逐步轉(zhuǎn)變得更加智能、更加靈活、更具有互動性。智能電網(wǎng)運行的各個環(huán)節(jié)中都會產(chǎn)生體積量巨大、結(jié)構(gòu)性復(fù)雜且彼此間存在著復(fù)雜關(guān)聯(lián)性的高維數(shù)據(jù)。挖掘出在高維用電數(shù)據(jù)中有價值的信息并進行可視化分析具有重要意義。本文在國內(nèi)外學(xué)者的研究基礎(chǔ)上,針對高維用電數(shù)據(jù)的K-means聚類算法和可視化展開了研究,本文的主要研究工作闡述如下:1.關(guān)于改進K-means算法中如何確定K值和如何選擇初始聚類中心這兩個問題,針對現(xiàn)有的高維用電數(shù)據(jù)集的特征,提出了一種改進的K-means算法。這種改進的算法是利用降維算法在3D視覺空間中降低高維特征空間中的數(shù)據(jù)集維度,結(jié)合Canopy算法來確定改進K-means算法的K值。在Canopy算法中引入樣本密度參數(shù),以此選取初始聚類中心。最終以智慧校園中智能電表采集到的學(xué)生用戶高維用電數(shù)據(jù)集為基礎(chǔ)進行實驗。實驗結(jié)果表明改進的K-means算法具有較高的聚類準確率,較強的抗噪聲干擾能力以及較優(yōu)的聚類效果。2.因維度過高影響傳統(tǒng)Radviz可視化展示的問題,提出一種改進的可視化技...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
Tableau支持的數(shù)據(jù)庫
重慶郵電大學(xué)碩士學(xué)位論文第2章相關(guān)理論基礎(chǔ)18數(shù)據(jù)領(lǐng)域中的像Hive、SparkSQL等分布式數(shù)據(jù)庫。Tableau支持的數(shù)據(jù)庫如圖2.6所示。圖2.6Tableau支持的數(shù)據(jù)庫圖2.7TableauDesktop首頁各功能注釋本文制作可視化平臺使用的是Tableau下的TableauDesktop產(chǎn)品,在TableauDesktop上進行視圖制作,圖2.7為TableauDesktop的首頁各功能注釋。鑒于智能電網(wǎng)數(shù)據(jù)在智能電力系統(tǒng)的具體應(yīng)用場景越來越多,有必要將Tableau應(yīng)用在高維用電數(shù)據(jù)的綜合分析中,為智能電網(wǎng)持續(xù)發(fā)展提供有效支撐。
重慶郵電大學(xué)碩士學(xué)位論文第3章基于降維的密度Canopy-K-means改進算法324.對比分析實驗將本章提出的基于降維的密度Canopy-K-means算法對學(xué)校宿舍的用電信息進行仿真實驗,分別選取該學(xué)校5600間宿舍在2017年的月用電高維數(shù)據(jù)作為數(shù)據(jù)源。①抗噪聲性能驗證改進聚類算法的抗噪聲性能采用的是加入人工噪聲的仿真實驗,在數(shù)據(jù)特征集中分別加入噪聲,噪聲比例分別為0%、10%、20%、30%,噪聲數(shù)據(jù)集服從X~N(,2)的正態(tài)分布,2,0.5。圖3.7為宿舍用戶的用電特征集降維效果圖。從實驗結(jié)果圖中可以看出,加入不同比例噪聲并沒有降低PCA算法的降維效果。由圖3.7可知,隨著噪聲比例加大,宿舍用電數(shù)據(jù)特征集中的簇內(nèi)樣本點漸漸分散。當噪聲比例為30%時,從圖3.7(d)三維圖可以看到,靠近左邊的兩個簇內(nèi)樣本點分布在簇周圍,成散落的狀態(tài),而靠近右邊的兩個簇有逐漸合攏的趨勢,但是還能分明簇與簇之間的分界線,所以,實驗表明,不管噪聲為多少,用電數(shù)據(jù)特征集在三維特征空間中的樣本點都被分為四簇,所以該算法的最佳聚類數(shù)K為4,宿舍也被分為四種類型。(a)0%(b)10%(c)20%(d)30%圖3.7加入噪聲的用電特征集降維效果圖
本文編號:3414614
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁數(shù)】:77 頁
【學(xué)位級別】:碩士
【部分圖文】:
Tableau支持的數(shù)據(jù)庫
重慶郵電大學(xué)碩士學(xué)位論文第2章相關(guān)理論基礎(chǔ)18數(shù)據(jù)領(lǐng)域中的像Hive、SparkSQL等分布式數(shù)據(jù)庫。Tableau支持的數(shù)據(jù)庫如圖2.6所示。圖2.6Tableau支持的數(shù)據(jù)庫圖2.7TableauDesktop首頁各功能注釋本文制作可視化平臺使用的是Tableau下的TableauDesktop產(chǎn)品,在TableauDesktop上進行視圖制作,圖2.7為TableauDesktop的首頁各功能注釋。鑒于智能電網(wǎng)數(shù)據(jù)在智能電力系統(tǒng)的具體應(yīng)用場景越來越多,有必要將Tableau應(yīng)用在高維用電數(shù)據(jù)的綜合分析中,為智能電網(wǎng)持續(xù)發(fā)展提供有效支撐。
重慶郵電大學(xué)碩士學(xué)位論文第3章基于降維的密度Canopy-K-means改進算法324.對比分析實驗將本章提出的基于降維的密度Canopy-K-means算法對學(xué)校宿舍的用電信息進行仿真實驗,分別選取該學(xué)校5600間宿舍在2017年的月用電高維數(shù)據(jù)作為數(shù)據(jù)源。①抗噪聲性能驗證改進聚類算法的抗噪聲性能采用的是加入人工噪聲的仿真實驗,在數(shù)據(jù)特征集中分別加入噪聲,噪聲比例分別為0%、10%、20%、30%,噪聲數(shù)據(jù)集服從X~N(,2)的正態(tài)分布,2,0.5。圖3.7為宿舍用戶的用電特征集降維效果圖。從實驗結(jié)果圖中可以看出,加入不同比例噪聲并沒有降低PCA算法的降維效果。由圖3.7可知,隨著噪聲比例加大,宿舍用電數(shù)據(jù)特征集中的簇內(nèi)樣本點漸漸分散。當噪聲比例為30%時,從圖3.7(d)三維圖可以看到,靠近左邊的兩個簇內(nèi)樣本點分布在簇周圍,成散落的狀態(tài),而靠近右邊的兩個簇有逐漸合攏的趨勢,但是還能分明簇與簇之間的分界線,所以,實驗表明,不管噪聲為多少,用電數(shù)據(jù)特征集在三維特征空間中的樣本點都被分為四簇,所以該算法的最佳聚類數(shù)K為4,宿舍也被分為四種類型。(a)0%(b)10%(c)20%(d)30%圖3.7加入噪聲的用電特征集降維效果圖
本文編號:3414614
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3414614.html
最近更新
教材專著