一種基于EBIC的軟件故障特征選擇方法
發(fā)布時間:2021-03-09 03:57
軟件故障預測運用軟件度量指標及歷史故障數(shù)據(jù)建立預測模型,以確定待測軟件模塊是否有故障傾向性。故障預測研究中,特征選擇是一個重要步驟,該步驟選取一定維度的部分故障數(shù)據(jù)建立預測模型來提高模型性能,以達到壓縮特征維度,提高模型預測精度,降低預測模型復雜度,節(jié)約計算資源的目的。軟件故障預測中若采用大量度量指標建立預測模型可能因其中含有無關特征使預測模型性能受到不良影響,因此故障預測中的特征選擇具有重要的研究價值,F(xiàn)有特征選擇方法或所選特征子集建立的預測模型有效性較低;或耗費計算資源、所選特征維數(shù)較高,在特征維度較大時易導致維度災難。針對以上問題,本文提出了一種基于拓展貝葉斯信息準則的特征選擇方法EBIC-FS,該方法對數(shù)據(jù)做線性回歸并計算出殘差平方和較小且數(shù)據(jù)維數(shù)較少的特征模型,具體為:在第一輪進行特征排序,計算每個特征的EBIC值,得到特征排名列表;第二輪以最優(yōu)特征——最優(yōu)特征+次優(yōu)特征的次序依次增加特征維數(shù),每一維度的特征集合為一個特征子集,計算每一維度下各個特征子集的EBIC值,從中選出最佳特征子集。確定最佳特征子集后,用邏輯回歸、樸素貝葉斯、決策樹、k近鄰、隨機森林5個分類器分別建立故...
【文章來源】:云南大學云南省 211工程院校
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
羞于分類器的軟件故津預側(cè)過程
第三章基于EBIC的特征選擇方法及其故障預測??章基于EBIC的特征選擇方法及其故障預測??基于拓展貝葉斯信息準則的軟件故障特征選擇方法,在故障預測領域的應用,其完整過程是一個軟件故障預內(nèi)容包括獲取故障數(shù)據(jù)、EBIC-FS特征選擇、建立預測架如圖3.1所示,本章將圍繞以上三個步驟,重點闡述E對故障數(shù)據(jù)及訓練預測模型部分進行簡要介紹。??
回歸適用于二分類問題,可用于判別某一程序模塊是否有故障傾生故障的概率。其預測值范圍在〇到1之間,如圖3.3中y_pred所可判定為有故障傾向性,也可判定為無故障傾向性;若預測概率大判定為有故障傾向性,反之則為無故障傾向性。??2)樸素貝葉斯(Naive?Bayesian,NB)??V??圖3.4:樸素貝葉斯基本結(jié)構??“
本文編號:3072206
【文章來源】:云南大學云南省 211工程院校
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
羞于分類器的軟件故津預側(cè)過程
第三章基于EBIC的特征選擇方法及其故障預測??章基于EBIC的特征選擇方法及其故障預測??基于拓展貝葉斯信息準則的軟件故障特征選擇方法,在故障預測領域的應用,其完整過程是一個軟件故障預內(nèi)容包括獲取故障數(shù)據(jù)、EBIC-FS特征選擇、建立預測架如圖3.1所示,本章將圍繞以上三個步驟,重點闡述E對故障數(shù)據(jù)及訓練預測模型部分進行簡要介紹。??
回歸適用于二分類問題,可用于判別某一程序模塊是否有故障傾生故障的概率。其預測值范圍在〇到1之間,如圖3.3中y_pred所可判定為有故障傾向性,也可判定為無故障傾向性;若預測概率大判定為有故障傾向性,反之則為無故障傾向性。??2)樸素貝葉斯(Naive?Bayesian,NB)??V??圖3.4:樸素貝葉斯基本結(jié)構??“
本文編號:3072206
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3072206.html
最近更新
教材專著