軟件缺陷預(yù)測中高維數(shù)據(jù)處理研究
發(fā)布時間:2023-06-01 03:55
當前軟件的規(guī)模和復(fù)雜度日益增長,因此軟件可靠性備受關(guān)注。在軟件工程中,如果可以找出軟件系統(tǒng)中有可能存在缺陷的模塊及其分布,對軟件開發(fā)者合理配置資源及提高軟件質(zhì)量起到重要作用。軟件缺陷預(yù)測(software defect prediction,簡稱SDP)技術(shù)便是對軟件模塊中是否存在缺陷進行預(yù)測,根據(jù)歷史數(shù)據(jù)以及已經(jīng)發(fā)現(xiàn)的缺陷等軟件度量數(shù)據(jù),預(yù)測哪些模塊有出錯傾向。合理的預(yù)測軟件缺陷可以有效地幫助測試者快速定位并彌補軟件缺陷,從而達到顯著減少軟件開發(fā)成本和提高軟件可信度的效果。目前的研究通常將缺陷預(yù)測的實現(xiàn)形式化為一個機器學(xué)習(xí)問題,很多機器學(xué)習(xí)技術(shù)被用于缺陷預(yù)測。然而,現(xiàn)有的缺陷預(yù)測方法在實際應(yīng)用中還存在許多問題。例如,這些方法的性能不夠穩(wěn)定,在高維數(shù)據(jù)情況下(如存在大量冗余、無關(guān)的度量元),預(yù)測精度不高,而在實際應(yīng)用中高維數(shù)據(jù)是很普遍的。另外,由于有缺陷類(又稱“正類”)通常遠少于無缺陷類(又稱“負類”),即缺陷歷史數(shù)據(jù)具有類別不平衡性,容易造成預(yù)測模型更傾向于負類,從而降低了正類的預(yù)測精度。由于單分類器分類能力有限,不能有效處理不平衡數(shù)據(jù),所以,很多學(xué)者利用集成學(xué)習(xí)方法來進行缺陷預(yù)測...
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 選題背景和研究意義
1.2 國內(nèi)外研究現(xiàn)狀及分析
1.2.1 特征選擇方法研究現(xiàn)狀
1.2.2 軟件缺陷預(yù)測中特征選擇研究現(xiàn)狀
1.2.3 軟件缺陷預(yù)測中不平衡數(shù)據(jù)處理研究現(xiàn)狀
1.3 本文主要貢獻
1.4 本文組織結(jié)構(gòu)
2 相關(guān)理論概述
2.1 軟件缺陷預(yù)測概述
2.1.1 問題定義及過程
2.1.1.1 軟件缺陷
2.1.1.2 軟件缺陷預(yù)測
2.1.2 軟件缺陷預(yù)測技術(shù)
2.1.2.1 常用機器學(xué)習(xí)算法
2.1.2.2 基于機器學(xué)習(xí)技術(shù)的缺陷預(yù)測研究進展
2.2 不平衡數(shù)據(jù)處理方法概述
2.2.1 欠采樣方法
2.2.2 過采樣方法
2.2.2.1 隨機過采樣方法(Random Over Sampler)
2.2.2.2 合成少數(shù)類過采樣技術(shù)(SMOTE)
2.2.3 混合采樣方法
2.3 高維數(shù)據(jù)處理方法理論概述
2.3.1 特征選擇的定義及選擇過程
2.3.2 基于粗糙集的特征選擇方法
2.4 本章小結(jié)
3 過采樣與特征選擇方法在軟件缺陷預(yù)測中的對比研究
3.1 引言
3.2 經(jīng)典的過采樣方法
3.2.1 Borderline-SMOTE
3.2.2 自適應(yīng)綜合過采樣(ADASYN)
3.3 經(jīng)典的特征選擇方法
3.3.1 方差閾值(Variance Threshold)
3.3.2 卡方檢驗(Chi-square test)
3.3.3 遞歸式特征消除(recursive feature elimination)
3.3.4 L1正則化(L1 regularization)
3.4 過采樣方法與特征選擇方法在軟件缺陷預(yù)測中的組合應(yīng)用
3.4.1 實驗數(shù)據(jù)
3.4.2 評價指標
3.4.2.1 混淆矩陣
3.4.2.2 F1-measure
3.4.2.3 AUC
3.4.3 實驗結(jié)果與分析
3.4.3.1 實驗設(shè)置
3.4.3.2 實驗結(jié)果
3.5 本章小結(jié)
4 基于調(diào)和粒度決策熵的特征選擇研究
4.1 引言
4.2 調(diào)和粒度決策熵
4.3 基于調(diào)和粒度決策熵的特征選擇算法FSHGE
4.4 本章小結(jié)
5 基于重抽樣與特征選擇的多模態(tài)選擇性集成學(xué)習(xí)算法及其在缺陷預(yù)測中的應(yīng)用
5.1 前言
5.2 基于重抽樣與特征選擇的多模態(tài)選擇性集成算法SERSFS
5.3 SERSFS算法在軟件缺陷預(yù)測中的應(yīng)用
5.4 實驗
5.4.1 實驗準備
5.4.2 實驗結(jié)果與分析
5.4.2.1 實驗設(shè)置
5.4.2.2 實驗結(jié)果
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻
致謝
攻讀碩士期間發(fā)表的學(xué)術(shù)論文
本文編號:3826603
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 選題背景和研究意義
1.2 國內(nèi)外研究現(xiàn)狀及分析
1.2.1 特征選擇方法研究現(xiàn)狀
1.2.2 軟件缺陷預(yù)測中特征選擇研究現(xiàn)狀
1.2.3 軟件缺陷預(yù)測中不平衡數(shù)據(jù)處理研究現(xiàn)狀
1.3 本文主要貢獻
1.4 本文組織結(jié)構(gòu)
2 相關(guān)理論概述
2.1 軟件缺陷預(yù)測概述
2.1.1 問題定義及過程
2.1.1.1 軟件缺陷
2.1.1.2 軟件缺陷預(yù)測
2.1.2 軟件缺陷預(yù)測技術(shù)
2.1.2.1 常用機器學(xué)習(xí)算法
2.1.2.2 基于機器學(xué)習(xí)技術(shù)的缺陷預(yù)測研究進展
2.2 不平衡數(shù)據(jù)處理方法概述
2.2.1 欠采樣方法
2.2.2 過采樣方法
2.2.2.1 隨機過采樣方法(Random Over Sampler)
2.2.2.2 合成少數(shù)類過采樣技術(shù)(SMOTE)
2.2.3 混合采樣方法
2.3 高維數(shù)據(jù)處理方法理論概述
2.3.1 特征選擇的定義及選擇過程
2.3.2 基于粗糙集的特征選擇方法
2.4 本章小結(jié)
3 過采樣與特征選擇方法在軟件缺陷預(yù)測中的對比研究
3.1 引言
3.2 經(jīng)典的過采樣方法
3.2.1 Borderline-SMOTE
3.2.2 自適應(yīng)綜合過采樣(ADASYN)
3.3 經(jīng)典的特征選擇方法
3.3.1 方差閾值(Variance Threshold)
3.3.2 卡方檢驗(Chi-square test)
3.3.3 遞歸式特征消除(recursive feature elimination)
3.3.4 L1正則化(L1 regularization)
3.4 過采樣方法與特征選擇方法在軟件缺陷預(yù)測中的組合應(yīng)用
3.4.1 實驗數(shù)據(jù)
3.4.2 評價指標
3.4.2.1 混淆矩陣
3.4.2.2 F1-measure
3.4.2.3 AUC
3.4.3 實驗結(jié)果與分析
3.4.3.1 實驗設(shè)置
3.4.3.2 實驗結(jié)果
3.5 本章小結(jié)
4 基于調(diào)和粒度決策熵的特征選擇研究
4.1 引言
4.2 調(diào)和粒度決策熵
4.3 基于調(diào)和粒度決策熵的特征選擇算法FSHGE
4.4 本章小結(jié)
5 基于重抽樣與特征選擇的多模態(tài)選擇性集成學(xué)習(xí)算法及其在缺陷預(yù)測中的應(yīng)用
5.1 前言
5.2 基于重抽樣與特征選擇的多模態(tài)選擇性集成算法SERSFS
5.3 SERSFS算法在軟件缺陷預(yù)測中的應(yīng)用
5.4 實驗
5.4.1 實驗準備
5.4.2 實驗結(jié)果與分析
5.4.2.1 實驗設(shè)置
5.4.2.2 實驗結(jié)果
5.5 本章小結(jié)
6 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻
致謝
攻讀碩士期間發(fā)表的學(xué)術(shù)論文
本文編號:3826603
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3826603.html
最近更新
教材專著