天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于多源特征的可能模糊共聚類方法研究

發(fā)布時間:2021-05-07 22:35
  隨著數(shù)據(jù)的增長和數(shù)據(jù)處理系統(tǒng)的不斷改進(jìn),我們對開發(fā)強(qiáng)大而有效的數(shù)據(jù)處理和數(shù)據(jù)挖掘算法提出了更多要求,聚類算法作為數(shù)據(jù)挖掘的基本工具被廣泛應(yīng)用.在實(shí)際的聚類問題中,常常會因?yàn)樘卣骷奶崛〔划?dāng)以及異常值的干擾而對聚類結(jié)果產(chǎn)生較大影響.其中特征集提取面臨著以下兩大問題:首先,從樣本中提取出的特征為聚類提供了較少的信息,即特征的虛弱性;其次,特征向量通常具有高維多源的性質(zhì),導(dǎo)致特征空間中的簇有著復(fù)雜的結(jié)構(gòu).異常值的干擾是令很多已提出的聚類算法頭痛的問題,有限的異常值可能造成數(shù)據(jù)點(diǎn)劃分的不精確或者完全錯誤.本文分別基于精確數(shù)據(jù)和不精確數(shù)據(jù)對聚類面臨的這兩大問題進(jìn)行研究.首先,針對精確數(shù)據(jù)集,本文提出了多任務(wù)可能模糊共聚類算法(MPFC).該算法首先考慮到特征空間的結(jié)構(gòu)差異,通過衡量不同特征源對各個簇類的貢獻(xiàn)度對特征源進(jìn)行合理分配.隨后算法利用任務(wù)之間的信息共享,從不同方面挖掘數(shù)據(jù)特征所攜帶的信息,提高有效信息的利用率.最后,為了降低異常值對聚類結(jié)果的干擾,增加算法的魯棒性,該算法利用了典型度的性質(zhì)來識別異常值,并在聚類過程中弱化其影響力.同時,為了避免簇心受典型度的影響而導(dǎo)致重合,本文提出了新的... 

【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校

【文章頁數(shù)】:82 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
符號對照表
縮略語對照表
第一章 緒論
    1.1 本文研究背景
        1.1.1 數(shù)據(jù)挖掘研究背景
        1.1.2 多任務(wù)學(xué)習(xí)研究背景
        1.1.3 特征提取研究背景
        1.1.4 異常值處理研究背景
    1.2 數(shù)據(jù)聚類的研究現(xiàn)狀
        1.2.1 多任務(wù)聚類國內(nèi)外研究現(xiàn)狀
        1.2.2 特征提取的研究現(xiàn)狀
        1.2.3 異常值處理的研究現(xiàn)狀
    1.3 本文的研究方法與意義
        1.3.1 研究方法
        1.3.2 研究意義
    1.4 研究主要內(nèi)容和結(jié)構(gòu)安排
        1.4.1 本文主要內(nèi)容
        1.4.2 本文結(jié)構(gòu)安排
第二章 聚類的基本概念與算法應(yīng)用
    2.1 聚類基本概述
        2.1.1 單任務(wù)聚類概述
        2.1.2 多任務(wù)聚類概述
    2.2 典型的處理特征提取問題的聚類算法
        2.2.1 協(xié)同聚類算法
        2.2.2 共聚類算法
        2.2.3 多任務(wù)聚類算法
    2.3 常用的處理異常值干擾問題的聚類方法
        2.3.1 可能性聚類
        2.3.2 可能模糊聚類
    2.4 本章小結(jié)
第三章 基于多源特征的多任務(wù)可能模糊共聚類算法
    3.1 算法
        3.1.1 算法基礎(chǔ)和符號
        3.1.2 算法框架
        3.1.3 處理優(yōu)化問題
        3.1.4 MPFC的偽代碼
    3.2 構(gòu)建MPFC的參數(shù)選擇指標(biāo)
        3.2.1 構(gòu)建REC_(MPFC)指標(biāo)
        3.2.2 k, a, b, ξ, η 和f的選擇
    3.3 實(shí)驗(yàn)結(jié)果
        3.3.1 基于多源特征的單任務(wù)聚類
        3.3.2 基于多源特征的多任務(wù)聚類
        3.3.3 參數(shù)選擇對MPFC的影響
    3.4 本章小結(jié)
第四章 用于處理非精確數(shù)據(jù)的MFC-F和MPFC-F算法
    4.1 模糊數(shù)據(jù)
        4.1.1 模糊數(shù)據(jù)的定義
        4.1.2 模糊數(shù)的不相似性度量
        4.1.3 模糊數(shù)據(jù)中的異常值
    4.2 用于處理模糊數(shù)據(jù)的具有多源特征的多任務(wù)模糊共聚類算法
        4.2.1 MFC算法
        4.2.2 MFC-F算法框架
        4.2.3 MFC-F算法的優(yōu)化問題
        4.2.4 MFC-F的偽代碼
        4.2.5 MFC-F參數(shù)的選擇
    4.3 用于處理模糊數(shù)據(jù)的具有多源特征的多任務(wù)可能模糊共聚類算法
        4.3.1 MPFC-F算法框架
        4.3.2 MPFC-F算法的優(yōu)化問題
        4.3.3 MPFC-F的偽代碼
        4.3.4 MPFC-F算法的參數(shù)選擇
    4.4 實(shí)驗(yàn)結(jié)果
        4.4.1 模擬數(shù)據(jù)處理
        4.4.2 真實(shí)數(shù)據(jù)處理
        4.4.3 參數(shù)選擇對MFC-F的影響
    4.5 本章小結(jié)
第五章 本文總結(jié)及展望
    5.1 本文總結(jié)
    5.2 本文展望
參考文獻(xiàn)
致謝
作者簡介



本文編號:3174166

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3174166.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶66083***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com