一種基于EBIC的軟件故障特征選擇方法
發(fā)布時間:2021-03-09 03:57
軟件故障預(yù)測運(yùn)用軟件度量指標(biāo)及歷史故障數(shù)據(jù)建立預(yù)測模型,以確定待測軟件模塊是否有故障傾向性。故障預(yù)測研究中,特征選擇是一個重要步驟,該步驟選取一定維度的部分故障數(shù)據(jù)建立預(yù)測模型來提高模型性能,以達(dá)到壓縮特征維度,提高模型預(yù)測精度,降低預(yù)測模型復(fù)雜度,節(jié)約計(jì)算資源的目的。軟件故障預(yù)測中若采用大量度量指標(biāo)建立預(yù)測模型可能因其中含有無關(guān)特征使預(yù)測模型性能受到不良影響,因此故障預(yù)測中的特征選擇具有重要的研究價(jià)值,F(xiàn)有特征選擇方法或所選特征子集建立的預(yù)測模型有效性較低;或耗費(fèi)計(jì)算資源、所選特征維數(shù)較高,在特征維度較大時易導(dǎo)致維度災(zāi)難。針對以上問題,本文提出了一種基于拓展貝葉斯信息準(zhǔn)則的特征選擇方法EBIC-FS,該方法對數(shù)據(jù)做線性回歸并計(jì)算出殘差平方和較小且數(shù)據(jù)維數(shù)較少的特征模型,具體為:在第一輪進(jìn)行特征排序,計(jì)算每個特征的EBIC值,得到特征排名列表;第二輪以最優(yōu)特征——最優(yōu)特征+次優(yōu)特征的次序依次增加特征維數(shù),每一維度的特征集合為一個特征子集,計(jì)算每一維度下各個特征子集的EBIC值,從中選出最佳特征子集。確定最佳特征子集后,用邏輯回歸、樸素貝葉斯、決策樹、k近鄰、隨機(jī)森林5個分類器分別建立故...
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
羞于分類器的軟件故津預(yù)側(cè)過程
第三章基于EBIC的特征選擇方法及其故障預(yù)測??章基于EBIC的特征選擇方法及其故障預(yù)測??基于拓展貝葉斯信息準(zhǔn)則的軟件故障特征選擇方法,在故障預(yù)測領(lǐng)域的應(yīng)用,其完整過程是一個軟件故障預(yù)內(nèi)容包括獲取故障數(shù)據(jù)、EBIC-FS特征選擇、建立預(yù)測架如圖3.1所示,本章將圍繞以上三個步驟,重點(diǎn)闡述E對故障數(shù)據(jù)及訓(xùn)練預(yù)測模型部分進(jìn)行簡要介紹。??
回歸適用于二分類問題,可用于判別某一程序模塊是否有故障傾生故障的概率。其預(yù)測值范圍在〇到1之間,如圖3.3中y_pred所可判定為有故障傾向性,也可判定為無故障傾向性;若預(yù)測概率大判定為有故障傾向性,反之則為無故障傾向性。??2)樸素貝葉斯(Naive?Bayesian,NB)??V??圖3.4:樸素貝葉斯基本結(jié)構(gòu)??“
本文編號:3072206
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【部分圖文】:
羞于分類器的軟件故津預(yù)側(cè)過程
第三章基于EBIC的特征選擇方法及其故障預(yù)測??章基于EBIC的特征選擇方法及其故障預(yù)測??基于拓展貝葉斯信息準(zhǔn)則的軟件故障特征選擇方法,在故障預(yù)測領(lǐng)域的應(yīng)用,其完整過程是一個軟件故障預(yù)內(nèi)容包括獲取故障數(shù)據(jù)、EBIC-FS特征選擇、建立預(yù)測架如圖3.1所示,本章將圍繞以上三個步驟,重點(diǎn)闡述E對故障數(shù)據(jù)及訓(xùn)練預(yù)測模型部分進(jìn)行簡要介紹。??
回歸適用于二分類問題,可用于判別某一程序模塊是否有故障傾生故障的概率。其預(yù)測值范圍在〇到1之間,如圖3.3中y_pred所可判定為有故障傾向性,也可判定為無故障傾向性;若預(yù)測概率大判定為有故障傾向性,反之則為無故障傾向性。??2)樸素貝葉斯(Naive?Bayesian,NB)??V??圖3.4:樸素貝葉斯基本結(jié)構(gòu)??“
本文編號:3072206
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3072206.html
最近更新
教材專著