混合數(shù)據(jù)最佳聚類數(shù)的確定方法與應(yīng)用
發(fā)布時(shí)間:2021-08-18 10:00
隨著“大數(shù)據(jù)”一詞的頻繁出現(xiàn),數(shù)據(jù)挖掘也成了一個(gè)熱點(diǎn)名詞,它代表著將大而雜的數(shù)據(jù)轉(zhuǎn)換成信息的一個(gè)綜合過程,聚類分析是它的重要研究方向之一。聚類算法是聚類分析的重要工具,而聚類數(shù)目往往是決定聚類算法性能的關(guān)鍵,鑒于大部分聚類算法需要預(yù)先給定類別數(shù)的現(xiàn)狀,因此確定最佳聚類數(shù)是我們更好地進(jìn)行數(shù)據(jù)挖掘重要一步。由于研究問題的日益復(fù)雜化,越來越多的混合屬性數(shù)據(jù)成為了處理對象,然而針對混合數(shù)據(jù)的聚類研究卻沒有得到很好的發(fā)展,所以針對混合數(shù)據(jù)的聚類有效性研究并以此來確定最佳聚類數(shù)在當(dāng)今時(shí)代具有針對性和適用性。本文在大數(shù)據(jù)背景下,分析了混合屬性數(shù)據(jù)的聚類有效性問題的重要性,進(jìn)而對聚類有效性問題進(jìn)行深入研究;之后針對現(xiàn)有的聚類算法的缺點(diǎn)進(jìn)行改進(jìn)以提高算法的效能,最后結(jié)合D-S證據(jù)理論提出針對混合屬性數(shù)據(jù)提出DSKP算法,并總結(jié)該算法的優(yōu)越性和特點(diǎn),提出聚類有效性未來的可能發(fā)展方向。在改進(jìn)聚類算法方面,做了如下幾個(gè)方面的創(chuàng)新工作:(1)基于數(shù)據(jù)屬性的特征確定初始聚類中心以降低初始聚類中心選擇的隨機(jī)性,同時(shí)針對大型數(shù)據(jù)提出進(jìn)行簡單隨機(jī)抽樣的處理方式,以達(dá)到降低異常值對聚類結(jié)果的影響和提高算法運(yùn)行效率的目的。...
【文章來源】:蘭州財(cái)經(jīng)大學(xué)甘肅省
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
論文組織結(jié)構(gòu)圖
聚類算法分類及特點(diǎn)
最佳聚類數(shù)的一般確定流程
【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)的模糊K-Prototypes聚類算法在研究生培養(yǎng)質(zhì)量評估中的應(yīng)用[J]. 喬秀峰,張德珍,吳迅,張俊. 中國管理信息化. 2018(07)
[2]K-means算法最佳聚類數(shù)評價(jià)指標(biāo)研究[J]. 郭靖,侯蘇. 軟件導(dǎo)刊. 2017(11)
[3]基于均勻抽樣的二階差分聚類數(shù)確定方法[J]. 陳艷,陳光,易葉青,劉強(qiáng). 計(jì)算機(jī)與現(xiàn)代化. 2017(10)
[4]最近最遠(yuǎn)得分的聚類性能評價(jià)指標(biāo)[J]. 馮柳偉,常冬霞,鄧勇,趙耀. 智能系統(tǒng)學(xué)報(bào). 2017(01)
[5]確定最佳聚類數(shù)的二階差分統(tǒng)計(jì)法[J]. 崔建斌,姬安召,張科. 安徽大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(02)
[6]基于聚類中心優(yōu)化的k-means最佳聚類數(shù)確定方法[J]. 賈瑞玉,宋建林. 微電子學(xué)與計(jì)算機(jī). 2016(05)
[7]混合屬性數(shù)據(jù)k-prototypes聚類算法[J]. 余文利,余建軍,方建文. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2015(06)
[8]基于信息熵的粗糙K-prototypes聚類算法[J]. 歐陽浩,戴喜生,王智文,王萌. 計(jì)算機(jī)工程與設(shè)計(jì). 2015(05)
[9]基于信息增益的模糊K-prototypes聚類算法[J]. 歐陽浩,王智文,戴喜生,劉智琦. 計(jì)算機(jī)工程與科學(xué). 2015(05)
[10]模糊C均值算法的聚類有效性評價(jià)[J]. 樸尚哲,超木日力格,于劍. 模式識別與人工智能. 2015(05)
博士論文
[1]聚類分析中的最佳聚類數(shù)確定方法研究及應(yīng)用[D]. 周世兵.江南大學(xué) 2011
[2]模糊聚類新算法與聚類有效性問題研究[D]. 范九倫.西安電子科技大學(xué) 1998
碩士論文
[1]研究生培養(yǎng)質(zhì)量評估的一種改進(jìn)模糊K-Prototypes聚類算法[D]. 喬秀峰.大連海事大學(xué) 2018
[2]基于大數(shù)據(jù)的聚類算法研究及應(yīng)用[D]. 王麗君.山東科技大學(xué) 2017
[3]k-均值聚類算法的改進(jìn)與實(shí)現(xiàn)[D]. 董騏瑞.吉林大學(xué) 2015
[4]k-means聚類算法的改進(jìn)研究及其應(yīng)用[D]. 王康.大連理工大學(xué) 2014
[5]面向混合數(shù)據(jù)的劃分式聚類算法研究[D]. 常茜茜.太原理工大學(xué) 2013
[6]聚類分析中確定最佳聚類數(shù)的若干問題研究[D]. 宋媛.延邊大學(xué) 2013
[7]基于連通性的聚類有效性問題研究[D]. 張尚超.北京交通大學(xué) 2010
本文編號:3349679
【文章來源】:蘭州財(cái)經(jīng)大學(xué)甘肅省
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
論文組織結(jié)構(gòu)圖
聚類算法分類及特點(diǎn)
最佳聚類數(shù)的一般確定流程
【參考文獻(xiàn)】:
期刊論文
[1]改進(jìn)的模糊K-Prototypes聚類算法在研究生培養(yǎng)質(zhì)量評估中的應(yīng)用[J]. 喬秀峰,張德珍,吳迅,張俊. 中國管理信息化. 2018(07)
[2]K-means算法最佳聚類數(shù)評價(jià)指標(biāo)研究[J]. 郭靖,侯蘇. 軟件導(dǎo)刊. 2017(11)
[3]基于均勻抽樣的二階差分聚類數(shù)確定方法[J]. 陳艷,陳光,易葉青,劉強(qiáng). 計(jì)算機(jī)與現(xiàn)代化. 2017(10)
[4]最近最遠(yuǎn)得分的聚類性能評價(jià)指標(biāo)[J]. 馮柳偉,常冬霞,鄧勇,趙耀. 智能系統(tǒng)學(xué)報(bào). 2017(01)
[5]確定最佳聚類數(shù)的二階差分統(tǒng)計(jì)法[J]. 崔建斌,姬安召,張科. 安徽大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(02)
[6]基于聚類中心優(yōu)化的k-means最佳聚類數(shù)確定方法[J]. 賈瑞玉,宋建林. 微電子學(xué)與計(jì)算機(jī). 2016(05)
[7]混合屬性數(shù)據(jù)k-prototypes聚類算法[J]. 余文利,余建軍,方建文. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2015(06)
[8]基于信息熵的粗糙K-prototypes聚類算法[J]. 歐陽浩,戴喜生,王智文,王萌. 計(jì)算機(jī)工程與設(shè)計(jì). 2015(05)
[9]基于信息增益的模糊K-prototypes聚類算法[J]. 歐陽浩,王智文,戴喜生,劉智琦. 計(jì)算機(jī)工程與科學(xué). 2015(05)
[10]模糊C均值算法的聚類有效性評價(jià)[J]. 樸尚哲,超木日力格,于劍. 模式識別與人工智能. 2015(05)
博士論文
[1]聚類分析中的最佳聚類數(shù)確定方法研究及應(yīng)用[D]. 周世兵.江南大學(xué) 2011
[2]模糊聚類新算法與聚類有效性問題研究[D]. 范九倫.西安電子科技大學(xué) 1998
碩士論文
[1]研究生培養(yǎng)質(zhì)量評估的一種改進(jìn)模糊K-Prototypes聚類算法[D]. 喬秀峰.大連海事大學(xué) 2018
[2]基于大數(shù)據(jù)的聚類算法研究及應(yīng)用[D]. 王麗君.山東科技大學(xué) 2017
[3]k-均值聚類算法的改進(jìn)與實(shí)現(xiàn)[D]. 董騏瑞.吉林大學(xué) 2015
[4]k-means聚類算法的改進(jìn)研究及其應(yīng)用[D]. 王康.大連理工大學(xué) 2014
[5]面向混合數(shù)據(jù)的劃分式聚類算法研究[D]. 常茜茜.太原理工大學(xué) 2013
[6]聚類分析中確定最佳聚類數(shù)的若干問題研究[D]. 宋媛.延邊大學(xué) 2013
[7]基于連通性的聚類有效性問題研究[D]. 張尚超.北京交通大學(xué) 2010
本文編號:3349679
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3349679.html
最近更新
教材專著