天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

分類型矩陣數(shù)據(jù)的初始類中心算法設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-08-20 12:27
  聚類分析作為大數(shù)據(jù)研究與應(yīng)用的重要技術(shù)工具,為通訊業(yè)、銀行、保險(xiǎn)以及各大電子商務(wù)領(lǐng)域中的應(yīng)用研究提供理論支持。其中基于劃分的聚類算法性能的優(yōu)劣很大程度上取決于初始類中心的選擇,F(xiàn)階段初始類中心選擇算法都是針對普通數(shù)據(jù),即一個(gè)對象對應(yīng)一條記錄,而在實(shí)際應(yīng)用中,一個(gè)對象的描述常常不止一條記錄。本文將由多條記錄描述的對象稱為矩陣型對象,由矩陣型對象構(gòu)成的數(shù)據(jù)集稱為矩陣數(shù)據(jù)集。截止目前,針對矩陣型數(shù)據(jù)還沒有有效的算法來選擇初始聚類中心。若使用已有的算法對其處理,則需要壓縮和轉(zhuǎn)換矩陣型數(shù)據(jù),這樣通常會丟失很多信息且不能夠全面反映用戶的實(shí)際行為。因此本文針對分類型矩陣數(shù)據(jù)的初始類中心選擇進(jìn)行了探索和研究,提出了新的算法,并與現(xiàn)有的經(jīng)典算法進(jìn)行實(shí)驗(yàn)對比與分析,主要工作如下:(1)提出了一種基于密度和距離的初始類中心選擇算法。根據(jù)分類型數(shù)據(jù)屬性值的頻率定義了矩陣對象的密度和矩陣對象間的距離,擴(kuò)展了最大最小距離算法,從而實(shí)現(xiàn)初始類中心的選擇。(2)提出了一種基于密度和成對約束的初始類中心選擇算法。根據(jù)屬性值的頻率和矩陣對象間的平均距離給出新的矩陣對象密度定義,結(jié)合了成對約束信息來對初始類中心的選擇進(jìn)行指... 

【文章來源】:山西大學(xué)山西省

【文章頁數(shù)】:71 頁

【學(xué)位級別】:碩士

【部分圖文】:

分類型矩陣數(shù)據(jù)的初始類中心算法設(shè)計(jì)與實(shí)現(xiàn)


第一個(gè)類中心的生成過程

模型圖,數(shù)據(jù)挖掘,模型,模塊


分類型矩陣數(shù)據(jù)的初始類中心算法設(shè)計(jì)與實(shí)現(xiàn)40(4)可維護(hù)性。系統(tǒng)易修復(fù)(恢復(fù))和易改進(jìn),具有對故障的檢測、診斷、修復(fù)以及每次重啟系統(tǒng)時(shí)本系統(tǒng)會重新進(jìn)行初始化等功能。5.6可視化系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)5.6.1可視化系統(tǒng)的整體架構(gòu)基于MATLAB的初始類中心選擇系統(tǒng)采用三層架構(gòu)模型,分別為數(shù)據(jù)訪問層、業(yè)務(wù)邏輯層和表示層。其中數(shù)據(jù)訪問層的主要功能是負(fù)責(zé)數(shù)據(jù)的訪問,并保存整個(gè)系統(tǒng)運(yùn)行生成的數(shù)據(jù)和原始數(shù)據(jù),原始數(shù)據(jù)以.mat文件形式存儲于目錄下。業(yè)務(wù)邏輯層是三層架構(gòu)的核心部分,即整個(gè)系統(tǒng)的核心成分。數(shù)據(jù)的加載、參數(shù)的設(shè)定和傳遞、各個(gè)初始類中心算法模型的實(shí)現(xiàn)等都是在業(yè)務(wù)邏輯層中完成。與業(yè)務(wù)邏輯層關(guān)聯(lián)比較密切的是表示層,本層是負(fù)責(zé)顯示系統(tǒng)運(yùn)行后回傳的數(shù)據(jù)信息和負(fù)責(zé)實(shí)現(xiàn)用戶與系統(tǒng)的交互。5.6.2可視化系統(tǒng)的設(shè)計(jì)在科研學(xué)術(shù)工作完成的情況下,結(jié)合實(shí)際需求,我們將這些需求轉(zhuǎn)為實(shí)際的物理實(shí)現(xiàn),主要針對不同初始類中心算法在不同數(shù)據(jù)集上實(shí)現(xiàn)類中心的選擇,從而選出相對較優(yōu)的初始類中心。本系統(tǒng)采用數(shù)據(jù)挖掘模型,包括數(shù)據(jù)的選擇、數(shù)據(jù)預(yù)處理、建立與優(yōu)化目標(biāo)模型和解釋與評估算法模型等過程。本系統(tǒng)使用的數(shù)據(jù)挖掘模型如圖5.1所示。圖5.1數(shù)據(jù)挖掘模型本章使用MATLAB語言、GUI技術(shù)、聚類分析和初始類中心算法,實(shí)現(xiàn)了基于MATLAB的初始類中心算法比較平臺。系統(tǒng)界面設(shè)計(jì)美觀、操作簡單。本系統(tǒng)主要包括六個(gè)模塊,分別為DataSet模塊、Parameter模塊、Algorithm模塊、IndexChart模塊、DatasetInformation模塊以及AlgorithmIntroduction模塊,如圖5.2所示。其中,各個(gè)模塊功能的詳細(xì)介紹將在下文進(jìn)行詳細(xì)闡述。

主頁面,算法,平臺,數(shù)據(jù)集


第五章初始類中心選擇系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)41圖5.2初始類中心算法比較平臺主頁面5.6.3DataSet模塊在DataSet模塊,通過下拉框選擇一種數(shù)據(jù)集,選中之后,點(diǎn)擊LoadDataset按鈕,完成數(shù)據(jù)集的加載。同樣可通過下拉框選擇所選數(shù)據(jù)集對應(yīng)的標(biāo)簽集,再點(diǎn)擊LoadLabel按鈕完成標(biāo)簽集的加載。5.6.4Parameter模塊Parameter模塊包括兩個(gè)參數(shù),分別為類的個(gè)數(shù)K和運(yùn)行次數(shù)times。在K所對應(yīng)的位置,輸入類的個(gè)數(shù),其中K的默認(rèn)值為1。在times所對應(yīng)的位置,輸入運(yùn)行次數(shù),默認(rèn)值為1。5.6.5Algorithm模塊Algorithm模塊顯示的是4種初始類中心聚類算法,每次點(diǎn)擊一種算法,則界面右側(cè)以表格形式顯示出運(yùn)行結(jié)果。比如ICAFCMD算法在mutagenesis2數(shù)據(jù)集上的運(yùn)行結(jié)果如圖5.3所示。

【參考文獻(xiàn)】:
期刊論文
[1]一種分類型矩陣數(shù)據(jù)的初始聚類中心選擇算法[J]. 田璐,曹付元,余麗琴.  計(jì)算機(jī)工程. 2020(05)
[2]基于分類型矩陣對象數(shù)據(jù)的MD fuzzy k-modes聚類算法[J]. 李順勇,張苗苗,曹付元.  計(jì)算機(jī)研究與發(fā)展. 2019(06)
[3]面向分類型矩陣數(shù)據(jù)的無監(jiān)督孤立點(diǎn)檢測算法[J]. 吳曉林,曹付元.  深圳大學(xué)學(xué)報(bào)(理工版). 2019(01)
[4]基于凝聚層次的駕駛行為聚類與異常檢測方法[J]. 惠飛,彭娜,景首才,周琪,賈碩.  計(jì)算機(jī)工程. 2018(12)
[5]APT樣本的有效網(wǎng)絡(luò)特征篩選算法[J]. 李翼宏,杜鎮(zhèn)宇,胡勁松.  計(jì)算機(jī)工程與應(yīng)用. 2019(03)
[6]基于一般分布區(qū)間數(shù)的不確定EFCM-ID聚類算法[J]. 毛伊敏,王嘉煒,盧欣榮,毛丁慧.  計(jì)算機(jī)工程. 2018(10)
[7]一種基于詞袋模型的塊數(shù)據(jù)聚類算法[J]. 曹付元,牛文婷.  山西大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(02)
[8]一種基于稀疏度和距離的初始類中心選擇算法[J]. 曹付元,武鵬鵬.  山西大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(01)
[9]基于平均密度優(yōu)化初始聚類中心的k-means算法[J]. 邢長征,谷浩.  計(jì)算機(jī)工程與應(yīng)用. 2014(20)
[10]最小方差優(yōu)化初始聚類中心的K-means算法[J]. 謝娟英,王艷娥.  計(jì)算機(jī)工程. 2014(08)

碩士論文
[1]屬性耦合的類中心選擇算法設(shè)計(jì)與實(shí)現(xiàn)[D]. 溫杰.山西大學(xué) 2018
[2]基于粗糙集的類別數(shù)據(jù)聚類算法研究[D]. 儲璐璐.青島科技大學(xué) 2014
[3]分類屬性數(shù)據(jù)聚類算法研究[D]. 王敏.江蘇大學(xué) 2008



本文編號:3353495

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3353495.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2facd***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com