基于改進(jìn)布谷鳥算法的K中心點(diǎn)聚類分析及并行實(shí)現(xiàn)
【學(xué)位單位】:西北師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP18
【部分圖文】:
經(jīng)過 Map 和 Reduce 兩個(gè)過程來完成。首先 Map 過程并行處理和計(jì)算分割后的相互獨(dú)立的數(shù)據(jù)塊文件,計(jì)算處理后的結(jié)果再經(jīng)過 Reduce 過程進(jìn)行一定的匯總整合,最后返回輸出。MapReduce工作過程:(1) 分割數(shù)據(jù)源:根據(jù) MapReduce 所供給的庫將源文件數(shù)據(jù)分為 M 份數(shù)據(jù)塊文件。(2) 進(jìn)行Map 過程:Master服務(wù)器給不同的Worker 服務(wù)器分配不同的數(shù)據(jù)塊文件,之后執(zhí)行Map 過程分別對(duì)數(shù)據(jù)塊文件進(jìn)行處理。不同的Map 之間互相獨(dú)立、高度并行,它讀入數(shù)據(jù)以〈Key, V alue〉的形式進(jìn)行,把運(yùn)算后的中間結(jié)果輸入本地硬盤也采用〈Key, V alue〉的形式。(3) 進(jìn)行 Reduce 過程:Master服務(wù)器分配不同的Worker 服務(wù)器進(jìn)行 Reduce任務(wù),將〈Key, V alue〉形式的中間結(jié)果進(jìn)行合并整理并輸出。MapReduce 的工作過程如圖 2.1 所示。
16圖 3.1 Rosenbrock 函數(shù)三維圖利用 CS 算法對(duì)上述標(biāo)準(zhǔn)測(cè)試函數(shù)進(jìn)行實(shí)驗(yàn)。參數(shù)設(shè)置如下:在 CS 算法群規(guī)模為 25,Pa1=0.55,Pa2=0.25,Pa3=0.05,最大迭代次數(shù)為 50。對(duì)測(cè)數(shù)在不同發(fā)現(xiàn)概率設(shè)置下分別進(jìn)行實(shí)驗(yàn),結(jié)果如圖 3.2 所示。由圖 3.2 可知,發(fā)現(xiàn)概率為 0.55 時(shí),算法在第 13 代就達(dá)到了收斂。收斂極快,但是目標(biāo)函數(shù)在 300 左右,距離最優(yōu)值 0 有很大距離;發(fā)現(xiàn)概率為 ,算法在第 25 代收斂,目標(biāo)函數(shù)為 200 左右;發(fā)現(xiàn)概率為 0.05 時(shí),算法雖 37 代才收斂,但是目標(biāo)函數(shù)接近于理論最優(yōu)值 0。
圖 3.2 不同發(fā)現(xiàn)概率 CS 算法分析圖因此,在解決全局尋優(yōu)問題的算法中,在算法前期的時(shí)候應(yīng)保持一定的收度,以加快算法的運(yùn)行為目的,進(jìn)而使迭代的次數(shù)減少;當(dāng)算法運(yùn)行到后期候,應(yīng)該減小收斂的速度,著重搜尋算法的全局最優(yōu)解,加強(qiáng)尋優(yōu)效果,最到最好的解。所以在算法整體運(yùn)行過程中設(shè)定固定不變的參數(shù),不能滿足算行時(shí)自適應(yīng)的需求。為了讓算法能夠滿足在不過分增加迭代次數(shù)的前提下最找到更好的解,應(yīng)該根據(jù)迭代的次數(shù)來設(shè)置自適應(yīng)變化的參數(shù)。1.2 ECS 算法思想本章提出的改進(jìn)布谷鳥算法(Evolutionary Cuckoo Search,ECS),將傳谷鳥算法中的固定發(fā)現(xiàn)概率改進(jìn)為自適應(yīng)發(fā)現(xiàn)概率。ECS 算法的主要思想為:在對(duì)所求問題求解的過程中,將種群中的每一個(gè)位置視為所求問題解空間中的一個(gè)解,并用所要求解問題的目標(biāo)函數(shù)值來衡巢位置的優(yōu)劣。傳統(tǒng)布谷鳥算法中,根據(jù)式(2-5)進(jìn)行位置更新后,會(huì)產(chǎn)nd(0 h)隨機(jī)數(shù) r 與發(fā)現(xiàn)概率比較,若 r > P,此時(shí)需要隨機(jī)變化鳥巢位置
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李濤;曾春秋;周武柏;周綺鳳;鄭理;;大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘——從應(yīng)用的角度看大數(shù)據(jù)挖掘[J];大數(shù)據(jù);2015年04期
2 潘楚;張?zhí)煳?羅可;;兩種新搜索策略對(duì)K-medoids聚類算法建模[J];小型微型計(jì)算機(jī)系統(tǒng);2015年07期
3 徐煥良;翟璐;薛衛(wèi);任守綱;;Hadoop平臺(tái)中MapReduce調(diào)度算法研究[J];計(jì)算機(jī)應(yīng)用與軟件;2015年05期
4 顏宏文;周雅梅;潘楚;;基于寬度優(yōu)先搜索的K-medoids聚類算法[J];計(jì)算機(jī)應(yīng)用;2015年05期
5 程學(xué)旗;靳小龍;王元卓;郭嘉豐;張鐵贏;李國杰;;大數(shù)據(jù)系統(tǒng)和分析技術(shù)綜述[J];軟件學(xué)報(bào);2014年09期
6 蘇芙華;劉云連;伍鐵斌;;求解無約束優(yōu)化問題的改進(jìn)布谷鳥搜索算法[J];計(jì)算機(jī)工程;2014年05期
7 胡欣欣;;求解函數(shù)優(yōu)化問題的改進(jìn)布谷鳥搜索算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年10期
8 邵鵬;吳志健;;基于改進(jìn)PSO算法的Rosenbrock函數(shù)優(yōu)化問題的研究[J];計(jì)算機(jī)科學(xué);2013年09期
9 柳新妮;馬苗;;布谷鳥搜索算法在多閾值圖像分割中的應(yīng)用[J];計(jì)算機(jī)工程;2013年07期
10 馮登科;阮奇;杜利敏;;二進(jìn)制布谷鳥搜索算法[J];計(jì)算機(jī)應(yīng)用;2013年06期
相關(guān)碩士學(xué)位論文 前4條
1 丁斌;基于布谷鳥算法的K-means聚類挖掘算法研究[D];合肥工業(yè)大學(xué);2015年
2 韓曉慧;基于改進(jìn)混合蛙跳算法的K-means聚類算法研究[D];甘肅農(nóng)業(yè)大學(xué);2012年
3 鄧現(xiàn)倫;基于模糊商空間理論的模糊聚類研究[D];中南大學(xué);2011年
4 雷達(dá);數(shù)據(jù)聚類方法研究及其在軟測(cè)量中的應(yīng)用[D];青島科技大學(xué);2011年
本文編號(hào):2865241
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2865241.html