基于自適應(yīng)蜂群優(yōu)化的DBSCAN聚類算法
發(fā)布時(shí)間:2021-04-16 15:16
針對(duì)傳統(tǒng)的DBSCAN(Density-Based Spatial Clustering of Application with Noise,DBSCAN)聚類算法全局參數(shù)設(shè)置不合理、參數(shù)選取困難、無(wú)法識(shí)別重疊模塊的問(wèn)題,以及人工蜂群優(yōu)化算法(Artificial Bees Colony,ABC)后期收斂速度慢、易陷入局部最優(yōu)等缺陷進(jìn)行了研究,提出一種基于自適應(yīng)人工蜂群優(yōu)化DBSCAN的聚類算法IABC-DBSCAN。該算法將截?cái)噙x擇機(jī)制與錦標(biāo)賽選擇機(jī)制相結(jié)合,提出一種截?cái)?錦標(biāo)賽選擇機(jī)制(TruncationChampionship Selection Mechanism,TCSM),以增強(qiáng)種群多樣性、避免跟隨蜂選擇蜜源陷入局部最優(yōu)的缺陷;提出一種自適應(yīng)步長(zhǎng)策略(Adaptive Step Strategy,ASS)動(dòng)態(tài)調(diào)整跟隨蜂的搜索方式,以提高算法局部搜索能力和聚類速度;根據(jù)改進(jìn)的IABC算法動(dòng)態(tài)調(diào)節(jié)DBSCAN算法中的最優(yōu)參數(shù),將蜜源位置對(duì)應(yīng)ε鄰域,蜜源的適應(yīng)度大小對(duì)應(yīng)DBSCAN的聚類效果,并在多種測(cè)試函數(shù)和數(shù)據(jù)集上進(jìn)行驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,該算法不僅有效克服ABC和DBSCA...
【文章來(lái)源】:計(jì)算機(jī)工程與應(yīng)用. 2019,55(14)北大核心CSCD
【文章頁(yè)數(shù)】:10 頁(yè)
【部分圖文】:
不同Minpts取值的f-measure對(duì)比
面改進(jìn)后的IABC算法具有較強(qiáng)的全局和局部的尋優(yōu)能力,從而進(jìn)一步提高聚類效果。而P-DBSCAN算法雖然也是采用群智能算法來(lái)優(yōu)化DBSCAN算法的參數(shù)選取,但忽略了群智能優(yōu)化算法普遍存在的缺陷,即易陷入局部最優(yōu),由于沒(méi)針對(duì)這一問(wèn)題進(jìn)行優(yōu)化,因此聚類效果不佳。為進(jìn)一步分析IABC-DBSCAN的聚類性能,分別從各類算法識(shí)別功能模塊的數(shù)目、簇平均大小和覆蓋蛋白0.20.30.40.50.60.70.80.91.0匹配率閾值706050403020100被識(shí)別的已知功能模塊的比例/%IABC-DBSCANABC-DBSCAN圖2基于不同優(yōu)化算法檢測(cè)功能模塊的對(duì)比結(jié)果偈聚類數(shù)目18001600140012001000800600400200時(shí)間開(kāi)銷/sIABC-DBSCANABC-DBSCAN501001502002503003504004505005506006500圖3各算法時(shí)間開(kāi)銷對(duì)比圖時(shí)間點(diǎn)123456789101112ε0.5780.6250.6970.5240.6630.5860.5750.4870.6530.5590.5140.601Minpts333333333333precision0.67950.77350.86750.68590.56440.71390.80120.67150.75230.72670.62180.7428recall0.47550.58870.48910.70230.50910.73540.67450.58410.67540.60210.61790.6453f-measure0.55950.66850.62550.69400.53530.72440.73240.62470.71170.65850.61980.7428表812個(gè)動(dòng)態(tài)子網(wǎng)的最優(yōu)參數(shù)及其聚類性能precision1.00.90.80.70.60.50.40.30.20.10Valuerecallf-measureDBSCANOPTICSP-DBSCANACC-DBSCANIABC-DBSCAN圖4各
2019,55(14)ComputerEngineeringandApplications計(jì)算機(jī)工程與應(yīng)用斷-錦標(biāo)賽選擇機(jī)制和自適應(yīng)步長(zhǎng)策略分別優(yōu)化了跟隨蜂的蜜源選擇機(jī)制和局部搜索策略,避免算法后期早熟、陷入局部最優(yōu)的缺陷,提高算法的搜索和開(kāi)發(fā)能力,進(jìn)而提高DBSCAN的聚類效果。為進(jìn)一步驗(yàn)證IABC算法在收斂速度上的優(yōu)越性,比較在相同聚類數(shù)目下,采用兩種算法所花費(fèi)的時(shí)間開(kāi)銷。圖3為兩種算法的時(shí)間開(kāi)銷對(duì)比圖。從圖中可以明顯看出,IABC-DBSCAN算法的時(shí)間開(kāi)銷始終比ABC-DBSCAN算法低,并且隨著聚類數(shù)目的增加,兩種算法的時(shí)間花費(fèi)差值也逐漸增大。由于原始蜂群算法后期,種群多樣性下降,搜索無(wú)目的性,因此無(wú)用的搜索次數(shù)增加,從而導(dǎo)致后期收斂速度變慢且很難跳出局部最優(yōu),因此ABC-DBSCAN算法后期花費(fèi)時(shí)間更長(zhǎng)。而IABC-DBSCAN因?yàn)椴扇×俗赃m應(yīng)的截?cái)?錦標(biāo)賽選擇機(jī)制TCSM和步長(zhǎng)搜索策略ASS,能夠自適應(yīng)地根據(jù)全局最優(yōu)解信息,加快尋優(yōu)速度和提高尋優(yōu)精度,因此相比于ABC-DBSCAN,IABC-DASCAN算法時(shí)間性能大大降低。4.2.5性能分析為評(píng)估IABC-DBSCAN算法聚類性能,分別將IABC-DBSCAN算法應(yīng)用于各個(gè)動(dòng)態(tài)子網(wǎng)中獨(dú)立運(yùn)行10次,取10次結(jié)果的平均值分析。表8為IABC-DBSCAN算法在12個(gè)動(dòng)態(tài)子網(wǎng)的最優(yōu)參數(shù)和聚類結(jié)果,在不同瞬態(tài)子網(wǎng)上該算法的最優(yōu)參數(shù)和聚類性能都有所不同。這12個(gè)動(dòng)態(tài)動(dòng)態(tài)子網(wǎng)上分別設(shè)置ε和MinPts的不同取值,能夠在一定程度上避免全局參數(shù)設(shè)置不合理的缺陷,從而更進(jìn)一步提高聚類性能。為驗(yàn)證IABC-DBSCAN算法在動(dòng)態(tài)加權(quán)網(wǎng)絡(luò)的有效性,分別與聚類算法DBSCAN[2]、OPTICS[3],ACC-DBSCAN[6]和P-DBSCAN[7]進(jìn)行對(duì)比實(shí)驗(yàn)。所有算法都是基于相同的動(dòng)態(tài)加權(quán)PPI網(wǎng)絡(luò),以CYC2008作為標(biāo)準(zhǔn)復(fù)合物。圖4為各算法在準(zhǔn)確率、召
【參考文獻(xiàn)】:
期刊論文
[1]基于動(dòng)態(tài)加權(quán)PPI網(wǎng)絡(luò)的關(guān)鍵蛋白質(zhì)識(shí)別算法[J]. 楊書(shū)新,魯紀(jì)華,湯達(dá)榮. 計(jì)算機(jī)應(yīng)用研究. 2019(02)
[2]基于knee points的改進(jìn)多目標(biāo)人工蜂群算法[J]. 劉明輝,李煒. 計(jì)算機(jī)工程與應(yīng)用. 2018(02)
[3]基于人工蜂群智能技術(shù)的屬性異常點(diǎn)檢測(cè)[J]. 朱煥雄,劉波. 計(jì)算機(jī)科學(xué)與探索. 2017(12)
[4]具有學(xué)習(xí)及十字交叉搜索的人工蜂群算法[J]. 黃珊,高興寶. 計(jì)算機(jī)科學(xué)與探索. 2017(12)
[5]動(dòng)態(tài)分配聚類中心的改進(jìn)K均值聚類算法[J]. 程艷云,周鵬. 計(jì)算機(jī)技術(shù)與發(fā)展. 2017(02)
[6]一種基于k-均值的DBSCAN算法參數(shù)動(dòng)態(tài)選擇方法[J]. 王兆豐,單甘霖. 計(jì)算機(jī)工程與應(yīng)用. 2017(03)
[7]一種結(jié)合蟻群聚類算法的DBSCAN算法[J]. 許芳芳. 池州學(xué)院學(xué)報(bào). 2014(06)
[8]基于數(shù)據(jù)場(chǎng)的改進(jìn)DBSCAN聚類算法[J]. 楊靜,高嘉偉,梁吉業(yè),劉楊磊. 計(jì)算機(jī)科學(xué)與探索. 2012(10)
[9]基于蜂群和廣度優(yōu)先遍歷的PPI網(wǎng)絡(luò)聚類[J]. 田建芳,雷秀娟. 模式識(shí)別與人工智能. 2012(03)
[10]蛋白質(zhì)相互作用網(wǎng)絡(luò)的蜂群信息流聚類模型與算法[J]. 雷秀娟,田建芳. 計(jì)算機(jī)學(xué)報(bào). 2012(01)
碩士論文
[1]不同選擇策略的人工植物算法[D]. 李鵬.太原科技大學(xué) 2014
本文編號(hào):3141671
【文章來(lái)源】:計(jì)算機(jī)工程與應(yīng)用. 2019,55(14)北大核心CSCD
【文章頁(yè)數(shù)】:10 頁(yè)
【部分圖文】:
不同Minpts取值的f-measure對(duì)比
面改進(jìn)后的IABC算法具有較強(qiáng)的全局和局部的尋優(yōu)能力,從而進(jìn)一步提高聚類效果。而P-DBSCAN算法雖然也是采用群智能算法來(lái)優(yōu)化DBSCAN算法的參數(shù)選取,但忽略了群智能優(yōu)化算法普遍存在的缺陷,即易陷入局部最優(yōu),由于沒(méi)針對(duì)這一問(wèn)題進(jìn)行優(yōu)化,因此聚類效果不佳。為進(jìn)一步分析IABC-DBSCAN的聚類性能,分別從各類算法識(shí)別功能模塊的數(shù)目、簇平均大小和覆蓋蛋白0.20.30.40.50.60.70.80.91.0匹配率閾值706050403020100被識(shí)別的已知功能模塊的比例/%IABC-DBSCANABC-DBSCAN圖2基于不同優(yōu)化算法檢測(cè)功能模塊的對(duì)比結(jié)果偈聚類數(shù)目18001600140012001000800600400200時(shí)間開(kāi)銷/sIABC-DBSCANABC-DBSCAN501001502002503003504004505005506006500圖3各算法時(shí)間開(kāi)銷對(duì)比圖時(shí)間點(diǎn)123456789101112ε0.5780.6250.6970.5240.6630.5860.5750.4870.6530.5590.5140.601Minpts333333333333precision0.67950.77350.86750.68590.56440.71390.80120.67150.75230.72670.62180.7428recall0.47550.58870.48910.70230.50910.73540.67450.58410.67540.60210.61790.6453f-measure0.55950.66850.62550.69400.53530.72440.73240.62470.71170.65850.61980.7428表812個(gè)動(dòng)態(tài)子網(wǎng)的最優(yōu)參數(shù)及其聚類性能precision1.00.90.80.70.60.50.40.30.20.10Valuerecallf-measureDBSCANOPTICSP-DBSCANACC-DBSCANIABC-DBSCAN圖4各
2019,55(14)ComputerEngineeringandApplications計(jì)算機(jī)工程與應(yīng)用斷-錦標(biāo)賽選擇機(jī)制和自適應(yīng)步長(zhǎng)策略分別優(yōu)化了跟隨蜂的蜜源選擇機(jī)制和局部搜索策略,避免算法后期早熟、陷入局部最優(yōu)的缺陷,提高算法的搜索和開(kāi)發(fā)能力,進(jìn)而提高DBSCAN的聚類效果。為進(jìn)一步驗(yàn)證IABC算法在收斂速度上的優(yōu)越性,比較在相同聚類數(shù)目下,采用兩種算法所花費(fèi)的時(shí)間開(kāi)銷。圖3為兩種算法的時(shí)間開(kāi)銷對(duì)比圖。從圖中可以明顯看出,IABC-DBSCAN算法的時(shí)間開(kāi)銷始終比ABC-DBSCAN算法低,并且隨著聚類數(shù)目的增加,兩種算法的時(shí)間花費(fèi)差值也逐漸增大。由于原始蜂群算法后期,種群多樣性下降,搜索無(wú)目的性,因此無(wú)用的搜索次數(shù)增加,從而導(dǎo)致后期收斂速度變慢且很難跳出局部最優(yōu),因此ABC-DBSCAN算法后期花費(fèi)時(shí)間更長(zhǎng)。而IABC-DBSCAN因?yàn)椴扇×俗赃m應(yīng)的截?cái)?錦標(biāo)賽選擇機(jī)制TCSM和步長(zhǎng)搜索策略ASS,能夠自適應(yīng)地根據(jù)全局最優(yōu)解信息,加快尋優(yōu)速度和提高尋優(yōu)精度,因此相比于ABC-DBSCAN,IABC-DASCAN算法時(shí)間性能大大降低。4.2.5性能分析為評(píng)估IABC-DBSCAN算法聚類性能,分別將IABC-DBSCAN算法應(yīng)用于各個(gè)動(dòng)態(tài)子網(wǎng)中獨(dú)立運(yùn)行10次,取10次結(jié)果的平均值分析。表8為IABC-DBSCAN算法在12個(gè)動(dòng)態(tài)子網(wǎng)的最優(yōu)參數(shù)和聚類結(jié)果,在不同瞬態(tài)子網(wǎng)上該算法的最優(yōu)參數(shù)和聚類性能都有所不同。這12個(gè)動(dòng)態(tài)動(dòng)態(tài)子網(wǎng)上分別設(shè)置ε和MinPts的不同取值,能夠在一定程度上避免全局參數(shù)設(shè)置不合理的缺陷,從而更進(jìn)一步提高聚類性能。為驗(yàn)證IABC-DBSCAN算法在動(dòng)態(tài)加權(quán)網(wǎng)絡(luò)的有效性,分別與聚類算法DBSCAN[2]、OPTICS[3],ACC-DBSCAN[6]和P-DBSCAN[7]進(jìn)行對(duì)比實(shí)驗(yàn)。所有算法都是基于相同的動(dòng)態(tài)加權(quán)PPI網(wǎng)絡(luò),以CYC2008作為標(biāo)準(zhǔn)復(fù)合物。圖4為各算法在準(zhǔn)確率、召
【參考文獻(xiàn)】:
期刊論文
[1]基于動(dòng)態(tài)加權(quán)PPI網(wǎng)絡(luò)的關(guān)鍵蛋白質(zhì)識(shí)別算法[J]. 楊書(shū)新,魯紀(jì)華,湯達(dá)榮. 計(jì)算機(jī)應(yīng)用研究. 2019(02)
[2]基于knee points的改進(jìn)多目標(biāo)人工蜂群算法[J]. 劉明輝,李煒. 計(jì)算機(jī)工程與應(yīng)用. 2018(02)
[3]基于人工蜂群智能技術(shù)的屬性異常點(diǎn)檢測(cè)[J]. 朱煥雄,劉波. 計(jì)算機(jī)科學(xué)與探索. 2017(12)
[4]具有學(xué)習(xí)及十字交叉搜索的人工蜂群算法[J]. 黃珊,高興寶. 計(jì)算機(jī)科學(xué)與探索. 2017(12)
[5]動(dòng)態(tài)分配聚類中心的改進(jìn)K均值聚類算法[J]. 程艷云,周鵬. 計(jì)算機(jī)技術(shù)與發(fā)展. 2017(02)
[6]一種基于k-均值的DBSCAN算法參數(shù)動(dòng)態(tài)選擇方法[J]. 王兆豐,單甘霖. 計(jì)算機(jī)工程與應(yīng)用. 2017(03)
[7]一種結(jié)合蟻群聚類算法的DBSCAN算法[J]. 許芳芳. 池州學(xué)院學(xué)報(bào). 2014(06)
[8]基于數(shù)據(jù)場(chǎng)的改進(jìn)DBSCAN聚類算法[J]. 楊靜,高嘉偉,梁吉業(yè),劉楊磊. 計(jì)算機(jī)科學(xué)與探索. 2012(10)
[9]基于蜂群和廣度優(yōu)先遍歷的PPI網(wǎng)絡(luò)聚類[J]. 田建芳,雷秀娟. 模式識(shí)別與人工智能. 2012(03)
[10]蛋白質(zhì)相互作用網(wǎng)絡(luò)的蜂群信息流聚類模型與算法[J]. 雷秀娟,田建芳. 計(jì)算機(jī)學(xué)報(bào). 2012(01)
碩士論文
[1]不同選擇策略的人工植物算法[D]. 李鵬.太原科技大學(xué) 2014
本文編號(hào):3141671
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3141671.html
最近更新
教材專著