基于群體智能優(yōu)化的聚類算法研究
發(fā)布時間:2021-11-07 11:45
伴隨計算機(jī)計算能力、存儲能力的大幅提升和移動互聯(lián)網(wǎng)規(guī)模的飛速發(fā)展,電子商務(wù)、社交媒體、信息科技等領(lǐng)域每時每刻都會產(chǎn)生大量的海量數(shù)據(jù)。如何從復(fù)雜、稀疏的海量數(shù)據(jù)中高效的挖掘有用的隱含信息成為“人工智能”背景下社會發(fā)展進(jìn)步的迫切需求。聚類分析作為數(shù)據(jù)挖掘領(lǐng)域中一類經(jīng)典的無監(jiān)督學(xué)習(xí)方法,可以在缺乏訓(xùn)練樣本的情況下,找出數(shù)據(jù)間潛在的結(jié)構(gòu)關(guān)系,在現(xiàn)有實際數(shù)據(jù)大多缺乏標(biāo)記的背景下,具有無監(jiān)督學(xué)習(xí)能力的聚類分析技術(shù)已然成為人工智能領(lǐng)域的研究熱點之一。由于無監(jiān)督學(xué)習(xí)的特性,現(xiàn)階段多數(shù)聚類算法都需要人工設(shè)置關(guān)鍵參數(shù),在面對高維、復(fù)雜數(shù)據(jù),人工難以尋找合適的全局參數(shù),因此在大數(shù)據(jù)環(huán)境下找到合適的全局參數(shù)就成為提高聚類分析算法性能的關(guān)鍵問題。本文以此類問題為出發(fā)點,利用群體智能算法效率高、收斂快的尋優(yōu)特點,對果蠅優(yōu)化算法和布谷鳥搜索算法進(jìn)行改進(jìn),提升算法尋優(yōu)能力和效率,并將其應(yīng)用于解決近鄰傳播算法參數(shù)優(yōu)化問題,從而形成新的聚類分析模型。本文的主要內(nèi)容和創(chuàng)新如下:(1)針對傳統(tǒng)果蠅優(yōu)化算法全局搜索能力不足、易于早熟的問題,提出基于知識記憶的果蠅優(yōu)化算法(KM-FOA),算法加入個體知識記憶機(jī)制。知識記憶機(jī)制中...
【文章來源】:長春工業(yè)大學(xué)吉林省
【文章頁數(shù)】:91 頁
【學(xué)位級別】:碩士
【部分圖文】:
群體智能算法分類圖
圖 2.4AP 算法消息傳遞示意圖2.2.3 聚類有效性評價指標(biāo)與一些有監(jiān)督的機(jī)器學(xué)習(xí)方法不同,聚類分析由于缺乏標(biāo)記數(shù)據(jù),無法衡量劃分的合理性,因此合理構(gòu)建一種評價聚類質(zhì)量的準(zhǔn)則函數(shù)(聚類評價指標(biāo))成為聚類算法研究的另一研究方向[29]。根據(jù)評價原理和方式的區(qū)別,現(xiàn)階段常用的聚類評價指標(biāo)大致分為兩類,分別是內(nèi)部評價指標(biāo)和外部評價指標(biāo)。內(nèi)部評價主要對類簇間分離程度和緊湊度進(jìn)行評價[30];外部評價指標(biāo)適用于數(shù)據(jù)類別標(biāo)簽已知的情況,通過一些統(tǒng)計學(xué)方法衡量算法聚類準(zhǔn)確率[31]。根據(jù)以上分析和本文所用數(shù)據(jù)類型,選取 Silhouette指標(biāo)(內(nèi)部評價指標(biāo))和 F-measure 指標(biāo)(外部評價指標(biāo))作為全文聚類評價指標(biāo)。(1)Silhouette 指標(biāo)假設(shè)具有 N 個樣本點的數(shù)據(jù)集 D 可以被分成 k 個類簇 Ci(i = 1,2,k)。對于每個類簇,Silhouette 指標(biāo)計算如公式 2-15 所示。 11max ,inmib m a mSil in b m a m (2-15)
.1.3 算法流程KM-FOA 算法的具體流程如表 3-1 所示。表 3-1 KM-FOA 算法流程入:目標(biāo)函數(shù) f(x) ,最大迭代次數(shù) maxgen ,果蠅種群規(guī)模 sizepop ,目標(biāo)函數(shù)維度 n。出:最優(yōu)目標(biāo)函數(shù)值 Smelli驟 1:算法初始化。初始化算法參數(shù)(sizepop, maxgen, n)和個體初始位置。1 2 3'( , , , )( )j jnj jLB UB LB randX L驟 2:嗅覺搜索階段。 通過公式 3-1、3-2 和 3-3 計算方向向量,并計算個體食物味道濃度。( y ) , then ( y )( y ) , then ( y )ij ij j ij j ij jij ij j ij j ij jIf x or UB x UB or UBIf x or LB x LB or LB 驟 3:視覺覓食階段。通過公式 3-4 進(jìn)行全局視覺搜索。(X , Y ) arg(min (S ))best best if 圖 3.2 KM-FOA 和 FOA 的搜索路線圖(左邊為 KM-FOA,右邊為 FOA)
【參考文獻(xiàn)】:
期刊論文
[1]基于奇異值分解的自適應(yīng)近鄰傳播聚類算法[J]. 王麗敏,姬強(qiáng),韓旭明,黃娜. 吉林大學(xué)學(xué)報(理學(xué)版). 2014(04)
[2]逐維改進(jìn)的布谷鳥搜索算法[J]. 王李進(jìn),尹義龍,鐘一文. 軟件學(xué)報. 2013(11)
[3]隨機(jī)變異差分進(jìn)化算法[J]. 歐陽海濱,高立群,孔祥勇. 東北大學(xué)學(xué)報(自然科學(xué)版). 2013(03)
[4]一種分層組合的半監(jiān)督近鄰傳播聚類算法[J]. 張震,汪斌強(qiáng),伊鵬,蘭巨龍. 電子與信息學(xué)報. 2013(03)
[5]基于免疫粒子群算法的PID參數(shù)整定與自適應(yīng)[J]. 鄧麗,蔣婧,費敏銳. 自動化儀表. 2013(02)
[6]AP算法在圖像聚類中的應(yīng)用研究[J]. 楊傳慧,吉根林,章志剛. 計算機(jī)與數(shù)字工程. 2012(10)
[7]應(yīng)用果蠅優(yōu)化算法優(yōu)化廣義回歸神經(jīng)網(wǎng)絡(luò)進(jìn)行企業(yè)經(jīng)營績效評估[J]. 潘文超. 太原理工大學(xué)學(xué)報(社會科學(xué)版). 2011(04)
[8]一種結(jié)合半監(jiān)督的改進(jìn)自適應(yīng)親和傳播聚類[J]. 王磊,汪西莉,劉高霞,趙琳. 計算機(jī)應(yīng)用研究. 2010(12)
[9]聚類趨勢問題的研究綜述[J]. 褚娜,馬利莊,王彥. 計算機(jī)應(yīng)用研究. 2009(03)
[10]進(jìn)化多目標(biāo)優(yōu)化算法研究[J]. 公茂果,焦李成,楊咚咚,馬文萍. 軟件學(xué)報. 2009(02)
博士論文
[1]基于群智能優(yōu)化理論的聚類改進(jìn)方法及應(yīng)用研究[D]. 周瑞紅.吉林大學(xué) 2017
碩士論文
[1]基于群體智能聚類研究及其在股市板塊分析中的應(yīng)用[D]. 邱兵.長春工業(yè)大學(xué) 2017
[2]面向復(fù)雜結(jié)構(gòu)數(shù)據(jù)的近鄰傳播聚類算法研究[D]. 姬強(qiáng).吉林財經(jīng)大學(xué) 2016
[3]遺傳算法的研究與應(yīng)用[D]. 王銀年.江南大學(xué) 2009
本文編號:3481801
【文章來源】:長春工業(yè)大學(xué)吉林省
【文章頁數(shù)】:91 頁
【學(xué)位級別】:碩士
【部分圖文】:
群體智能算法分類圖
圖 2.4AP 算法消息傳遞示意圖2.2.3 聚類有效性評價指標(biāo)與一些有監(jiān)督的機(jī)器學(xué)習(xí)方法不同,聚類分析由于缺乏標(biāo)記數(shù)據(jù),無法衡量劃分的合理性,因此合理構(gòu)建一種評價聚類質(zhì)量的準(zhǔn)則函數(shù)(聚類評價指標(biāo))成為聚類算法研究的另一研究方向[29]。根據(jù)評價原理和方式的區(qū)別,現(xiàn)階段常用的聚類評價指標(biāo)大致分為兩類,分別是內(nèi)部評價指標(biāo)和外部評價指標(biāo)。內(nèi)部評價主要對類簇間分離程度和緊湊度進(jìn)行評價[30];外部評價指標(biāo)適用于數(shù)據(jù)類別標(biāo)簽已知的情況,通過一些統(tǒng)計學(xué)方法衡量算法聚類準(zhǔn)確率[31]。根據(jù)以上分析和本文所用數(shù)據(jù)類型,選取 Silhouette指標(biāo)(內(nèi)部評價指標(biāo))和 F-measure 指標(biāo)(外部評價指標(biāo))作為全文聚類評價指標(biāo)。(1)Silhouette 指標(biāo)假設(shè)具有 N 個樣本點的數(shù)據(jù)集 D 可以被分成 k 個類簇 Ci(i = 1,2,k)。對于每個類簇,Silhouette 指標(biāo)計算如公式 2-15 所示。 11max ,inmib m a mSil in b m a m (2-15)
.1.3 算法流程KM-FOA 算法的具體流程如表 3-1 所示。表 3-1 KM-FOA 算法流程入:目標(biāo)函數(shù) f(x) ,最大迭代次數(shù) maxgen ,果蠅種群規(guī)模 sizepop ,目標(biāo)函數(shù)維度 n。出:最優(yōu)目標(biāo)函數(shù)值 Smelli驟 1:算法初始化。初始化算法參數(shù)(sizepop, maxgen, n)和個體初始位置。1 2 3'( , , , )( )j jnj jLB UB LB randX L驟 2:嗅覺搜索階段。 通過公式 3-1、3-2 和 3-3 計算方向向量,并計算個體食物味道濃度。( y ) , then ( y )( y ) , then ( y )ij ij j ij j ij jij ij j ij j ij jIf x or UB x UB or UBIf x or LB x LB or LB 驟 3:視覺覓食階段。通過公式 3-4 進(jìn)行全局視覺搜索。(X , Y ) arg(min (S ))best best if 圖 3.2 KM-FOA 和 FOA 的搜索路線圖(左邊為 KM-FOA,右邊為 FOA)
【參考文獻(xiàn)】:
期刊論文
[1]基于奇異值分解的自適應(yīng)近鄰傳播聚類算法[J]. 王麗敏,姬強(qiáng),韓旭明,黃娜. 吉林大學(xué)學(xué)報(理學(xué)版). 2014(04)
[2]逐維改進(jìn)的布谷鳥搜索算法[J]. 王李進(jìn),尹義龍,鐘一文. 軟件學(xué)報. 2013(11)
[3]隨機(jī)變異差分進(jìn)化算法[J]. 歐陽海濱,高立群,孔祥勇. 東北大學(xué)學(xué)報(自然科學(xué)版). 2013(03)
[4]一種分層組合的半監(jiān)督近鄰傳播聚類算法[J]. 張震,汪斌強(qiáng),伊鵬,蘭巨龍. 電子與信息學(xué)報. 2013(03)
[5]基于免疫粒子群算法的PID參數(shù)整定與自適應(yīng)[J]. 鄧麗,蔣婧,費敏銳. 自動化儀表. 2013(02)
[6]AP算法在圖像聚類中的應(yīng)用研究[J]. 楊傳慧,吉根林,章志剛. 計算機(jī)與數(shù)字工程. 2012(10)
[7]應(yīng)用果蠅優(yōu)化算法優(yōu)化廣義回歸神經(jīng)網(wǎng)絡(luò)進(jìn)行企業(yè)經(jīng)營績效評估[J]. 潘文超. 太原理工大學(xué)學(xué)報(社會科學(xué)版). 2011(04)
[8]一種結(jié)合半監(jiān)督的改進(jìn)自適應(yīng)親和傳播聚類[J]. 王磊,汪西莉,劉高霞,趙琳. 計算機(jī)應(yīng)用研究. 2010(12)
[9]聚類趨勢問題的研究綜述[J]. 褚娜,馬利莊,王彥. 計算機(jī)應(yīng)用研究. 2009(03)
[10]進(jìn)化多目標(biāo)優(yōu)化算法研究[J]. 公茂果,焦李成,楊咚咚,馬文萍. 軟件學(xué)報. 2009(02)
博士論文
[1]基于群智能優(yōu)化理論的聚類改進(jìn)方法及應(yīng)用研究[D]. 周瑞紅.吉林大學(xué) 2017
碩士論文
[1]基于群體智能聚類研究及其在股市板塊分析中的應(yīng)用[D]. 邱兵.長春工業(yè)大學(xué) 2017
[2]面向復(fù)雜結(jié)構(gòu)數(shù)據(jù)的近鄰傳播聚類算法研究[D]. 姬強(qiáng).吉林財經(jīng)大學(xué) 2016
[3]遺傳算法的研究與應(yīng)用[D]. 王銀年.江南大學(xué) 2009
本文編號:3481801
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3481801.html
最近更新
教材專著