高維數(shù)據(jù)子空間聚類融合算法研究
發(fā)布時間:2021-01-08 15:20
聚類分析是模式識別、機器學(xué)習(xí)等研究領(lǐng)域中的一個備受關(guān)注的課題,在許多領(lǐng)域發(fā)揮著至關(guān)重要的作用,如信息檢索與分類、市場營銷以及互聯(lián)網(wǎng)等。在面臨高維空間和大數(shù)據(jù)量時,由于距離度量方法的限制,傳統(tǒng)的聚類分析方法在超高維數(shù)據(jù)上往往不能得到很好的效果。近幾年,聚類融合方法開始獲得越來越多的關(guān)注,它的主要思想是將不同角度的聚類分析結(jié)果整合成一個統(tǒng)一的類別結(jié)構(gòu),以得到一個更魯棒、更穩(wěn)定、更準確的最終分類結(jié)果。本文對高維數(shù)據(jù)的聚類融合方法進行深度探討和研究,從融合算法和高維數(shù)據(jù)子空間劃分方法兩個方面開展工作。主要工作如下:1.現(xiàn)有的大部分融合算法沒有考慮基聚類結(jié)果的有效性,將他們平等對待,其精度易受低質(zhì)量基聚類結(jié)果的影響。部分聚類融合算法雖然考慮加權(quán)策略,但仍然忽略了性能糟糕的基聚類結(jié)果對最終結(jié)果的負面影響。針對這個問題,本文提出了一種基于新的加權(quán)策略的聚類融合算法。其中,我們提出了一種新的基聚類結(jié)果有效性的評價方法。該方法基于每一個基聚類結(jié)果與整體結(jié)果的最優(yōu)匹配得分來衡量其有效性,并根據(jù)其有效性賦予相應(yīng)的權(quán)重。最優(yōu)匹配得分的設(shè)計充分考慮基聚類結(jié)果中的集群信息,不僅包含了該基聚類結(jié)果中與整體劃分在同一...
【文章來源】: 孫瑤 深圳大學(xué)
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
聚類融合過程示意圖
聚類融合方法分類融合成員的產(chǎn)生階段主要是得到多個聚類結(jié)果的類別標簽(labelsofmultiple
一致函數(shù)的設(shè)計流程圖
【參考文獻】:
期刊論文
[1]大數(shù)據(jù)的一個重要方面:數(shù)據(jù)可用性[J]. 李建中,劉顯敏. 計算機研究與發(fā)展. 2013(06)
[2]基于隱含變量的聚類集成模型[J]. 王紅軍,李志蜀,成飏,周鵬,周維. 軟件學(xué)報. 2009(04)
[3]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇. 軟件學(xué)報. 2008(01)
[4]基于投票機制的融合聚類算法[J]. 蔣盛益. 小型微型計算機系統(tǒng). 2007(02)
碩士論文
[1]聚類融合算法研究及其應(yīng)用[D]. 翁芳菲.廈門大學(xué) 2008
本文編號:2964829
【文章來源】: 孫瑤 深圳大學(xué)
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
聚類融合過程示意圖
聚類融合方法分類融合成員的產(chǎn)生階段主要是得到多個聚類結(jié)果的類別標簽(labelsofmultiple
一致函數(shù)的設(shè)計流程圖
【參考文獻】:
期刊論文
[1]大數(shù)據(jù)的一個重要方面:數(shù)據(jù)可用性[J]. 李建中,劉顯敏. 計算機研究與發(fā)展. 2013(06)
[2]基于隱含變量的聚類集成模型[J]. 王紅軍,李志蜀,成飏,周鵬,周維. 軟件學(xué)報. 2009(04)
[3]聚類算法研究[J]. 孫吉貴,劉杰,趙連宇. 軟件學(xué)報. 2008(01)
[4]基于投票機制的融合聚類算法[J]. 蔣盛益. 小型微型計算機系統(tǒng). 2007(02)
碩士論文
[1]聚類融合算法研究及其應(yīng)用[D]. 翁芳菲.廈門大學(xué) 2008
本文編號:2964829
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2964829.html
最近更新
教材專著