模糊層次聚類算法及在軟件架構重構中的應用研究
發(fā)布時間:2019-01-21 20:49
【摘要】:大數(shù)據(jù)時代的到來,為我們帶來了更多的知識。作為知識的發(fā)掘工具之一,數(shù)據(jù)挖掘(Data Mining,DM)技術一直是學者們研究的基礎理論依托。層次聚類是DM中重要的研究部分,近些年來,層次聚類已經(jīng)應用在了許多不同的研究領域。計算機技術日新月異,作為軟件系統(tǒng)的主要成員——遺留系統(tǒng),越來越難以適應復雜的軟件功能需求,對遺留系統(tǒng)的取舍成為企業(yè)頭疼的問題。不僅如此,遺留系統(tǒng)開發(fā)時間久遠,開發(fā)文檔丟失,系統(tǒng)內部功能結構紊亂,這些問題成為遺留系統(tǒng)后期維護和再開發(fā)的絆腳石。對遺留系統(tǒng)進行架構重構,成為解決以上問題的主要途徑。目前,對軟件系統(tǒng)進行架構重構的方法主要分為兩類:(1)數(shù)學建模方法。(2)聚類的方法。其中,應用聚類進行軟件架構重構的方法有兩種:基于密度聚類的軟件架構重構和基于層次聚類的架構重構。近些年來,基于層次聚類的軟件架構重構成為遺留系統(tǒng)架構重構的主要方法。但是,該方法仍然存在兩方面的問題:(1)實體與實體特征間的二元關系無法區(qū)分實體特征對實體的影響程度。(2)相似度基于距離計算的層次聚類效果差。針對以上的問題,本文在傳統(tǒng)的層次聚類的基礎上進行了改進,給出了基于信息損失的模糊層次聚類算法(Fuzzy Hierarchical Clustering algorithm Based on Information Loss,FHCBIL),該算法主要在實體特征權值分配和相似度計算方法上進行了改進,分別解決了傳統(tǒng)層次聚類算法中實體與實體特征間的二元關系和實體劃分準確性低的問題。本文進一步將FHCBIL算法應用在軟件架構重構中,生成軟件新架構,實現(xiàn)了軟件架構的重構。本文主要有以下三方面的貢獻:(1)構建基于模糊層次聚類的軟件架構重構系統(tǒng)模型。針對基于層次聚類的軟件架構重構后新架構的實體劃分準確性不高的問題,本文融合了模糊關系與層次聚類,構建了基于模糊層次聚類的軟件架構重構系統(tǒng)模型。該系統(tǒng)模型由軟件系統(tǒng)的數(shù)據(jù)提取、模糊層次聚類、新架構評估三大模塊組成。其中,軟件系統(tǒng)的數(shù)據(jù)提取模塊實現(xiàn)軟件系統(tǒng)源代碼轉換和數(shù)據(jù)提取的功能;模糊層次聚類模塊實現(xiàn)生成軟件新架構的功能;新架構評估模塊實現(xiàn)新架構的層次結構合理性和實體劃分準確性評估的功能。(2)給出改進的模糊層次聚類算法FHCBIL。針對傳統(tǒng)層次聚類在無法區(qū)分實體特征對實體影響程度和實體間劃分準確性較低兩方面的不足,本文給出相應的改進策略:一是擴充了實體特征的權值分配,將實體特征權值分為全局權值和局部權值,這樣使實體特征以不同的隸屬度從屬于實體,實體與實體特征間由傳統(tǒng)的二元關系變?yōu)槟:P系。二是將信息損失作為FHCBIL算法的相似度計算方法;谝陨喜呗,本文進一步給出改進的模糊層次聚類算法FHCBIL,該算法分為三部分:數(shù)據(jù)預處理、FHCBIL算法聚類、生成樹形結構。在數(shù)據(jù)預處理部分,首先采用Z-score方法對數(shù)據(jù)集進行規(guī)范化處理。其次對規(guī)范化后的數(shù)據(jù)集進行實體特征權值的分配,構建實體特征向量。在聚類部分,首先選取每個數(shù)據(jù)對象作為簇中心。然后采用信息損失的方法計算實體間的相似度。最后合并相似度最大的實體,形成新的聚類簇。在生成樹形結構部分,首先更新實體特征向量、聚類簇數(shù)及聚類層數(shù)。其次迭代合并實體直到聚類簇的數(shù)目和聚類層數(shù)達到給定的閾值。最后形成樹形結構。(3)實現(xiàn)基于FHCBIL算法的軟件架構重構系統(tǒng)。本文首先選取了面向對象的遺留系統(tǒng)。其次對選定的遺留系統(tǒng)進行源代碼轉換和數(shù)據(jù)提取。最后利用提取的數(shù)據(jù)集進行FHCBIL算法聚類,生成樹形結構,實現(xiàn)基于FHCBIL算法的遺留系統(tǒng)架構重構。為了驗證改進的模糊層次聚類算法FHCBIL的聚類性能以及基于FHCBIL算法的軟件架構重構后新架構的質量,本文做了相應的評估。在FHCBIL算法聚類性能評價方面,實驗選取JC系數(shù)(Jaccard Coefficient,JC)、FMI(Fowlkes and Mallows Index,FMI)、RI(Rand Index,RI)作為評估指標,使用選定的遺留系統(tǒng)的數(shù)據(jù),與經(jīng)典的聚類效果好的聚類算法進行對比實驗與分析。實驗結果表明:FHCBIL算法聚類性能好。在基于FHCBIL算法的軟件架構重構后新架構質量的評估方面,實驗應用幾種常用的進行軟件架構重構的層次聚類算法和FHCBIL算法實現(xiàn)軟件架構重構,對比分析重構后新架構的層次結構以及實體劃分準確率,實驗結果表明:基于FHCBIL算法的軟件架構重構后的新架構層次結構合理,內聚度高、耦合性低,并且新架構的實體間劃分準確性高。
[Abstract]:......
【學位授予單位】:西南大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP311.5;TP311.13
[Abstract]:......
【學位授予單位】:西南大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP311.5;TP311.13
【參考文獻】
相關期刊論文 前10條
1 伍恒;李文杰;蔣e,
本文編號:2413026
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2413026.html
最近更新
教材專著