基于極限學(xué)習(xí)機的軟件缺陷預(yù)測研究
發(fā)布時間:2021-08-29 22:56
當(dāng)前互聯(lián)網(wǎng)行業(yè)下,軟件的規(guī)模愈來愈大,導(dǎo)致其復(fù)雜度也愈來愈高,這意味著軟件中隱藏的缺陷會隨之增多,嚴重時還會給軟件公司造成經(jīng)濟損失,甚至?xí){人們的安全。因此,如何有效地發(fā)現(xiàn)軟件缺陷顯得尤為重要。軟件缺陷預(yù)測是借助于已有項目數(shù)據(jù)構(gòu)建預(yù)測模型,預(yù)測目標(biāo)項目中的缺陷。目前主流方法主要基于機器學(xué)習(xí)構(gòu)建缺陷預(yù)測模型,且大多已取得較好的預(yù)測效果。然而,現(xiàn)有缺陷預(yù)測模型仍存在不足,如:模型性能提高,數(shù)據(jù)集不平衡和部分目標(biāo)項目數(shù)據(jù)稀少等問題。因此,針對現(xiàn)有問題,本文提出基于極限學(xué)習(xí)機(extreme learning machine,ELM)的軟件缺陷預(yù)測模型,具體包括以下工作:1)在缺陷預(yù)測模型的預(yù)測精度和訓(xùn)練速度有待提高的問題上,本文借助于極限學(xué)習(xí)機泛化能力強、訓(xùn)練速度快的特點,在軟件缺陷預(yù)測上構(gòu)造了有監(jiān)督分類和無監(jiān)督聚類兩種預(yù)測模型,提出了ELM-CLA(ELM-Classification)和ELM-CLU(ELM-Clustering)兩種算法。在NASA的11個數(shù)據(jù)集上,所提方法ELM-CLA和現(xiàn)有分類算法相比,得到較好的預(yù)測結(jié)果,且大大提高了模型的訓(xùn)練速度。同時,ELM-CLU方法,較...
【文章來源】:江蘇科技大學(xué)江蘇省
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
軟件缺陷預(yù)測的整體處理過程
圖 2. 2 同項目缺陷預(yù)測與跨項目缺陷預(yù)測模型Fig 2. 2 With-project defect prediction and cross-project defect prediction model盡管研究人員從預(yù)測精度、代價敏感、實際應(yīng)用等方面初步驗證了 CPDP 的可行性,但較之 WPDP,其預(yù)測性能并不樂觀。研究者們針對跨項目缺陷預(yù)測的問題提出了多種方法,大致可分為三類:有監(jiān)督學(xué)習(xí)方法、半監(jiān)督學(xué)習(xí)方法和無監(jiān)督學(xué)習(xí)方法。[1] 有監(jiān)督學(xué)習(xí)基于有監(jiān)督的學(xué)習(xí)方法,適用于僅存在和目標(biāo)項目相關(guān)的候選源項目的場景,該類方法將候選源項目中有標(biāo)簽的數(shù)據(jù)作為訓(xùn)練集,在該訓(xùn)練集上構(gòu)建缺陷預(yù)測模型,然后對目標(biāo)項目進行預(yù)測。[2] 半監(jiān)督學(xué)習(xí)基于半監(jiān)督的學(xué)習(xí)方法適用的場景為:除了存在一些和目標(biāo)項目相關(guān)的候選源項目外,還在目標(biāo)項目中含有少量含標(biāo)簽的目標(biāo)項目模塊。該方法主要將候選源項目中含標(biāo)簽的所有數(shù)據(jù)和目標(biāo)項目中少量的標(biāo)簽數(shù)據(jù)放在一起作為訓(xùn)練集,構(gòu)建缺陷預(yù)測模型,然后對目標(biāo)項目中的無標(biāo)簽數(shù)據(jù)進行預(yù)測。
圖 2. 3 跨項目缺陷預(yù)測的研究框架圖Fig 2. 3 Framework of the research on CPDP陷預(yù)測性能評價指標(biāo)軟件缺陷預(yù)測中,合理的評價指標(biāo)能更好地評估預(yù)測結(jié)果。下文將介中的常用評價指標(biāo)。件缺陷預(yù)測可以看作是二分類問題,若將有缺陷模塊設(shè)為正例,無缺,則每個實例的分類過程中可能出現(xiàn)以下四種情況:實際為有缺陷類缺陷類,即真正例(true positive, TP);實際為無缺陷類被錯誤劃分為有例(false positive, FP);實際為無缺陷類被正確劃分為無缺陷類,即真反, TN);實際為有缺陷類被錯誤劃分為無缺陷類,即假反例(false negat智能中,混淆矩陣是表示精度評價的一種標(biāo)準(zhǔn)格式,用 n 行 n 列的矩本章所用混淆矩陣如表 2.1 所示:表 2. 1 混淆矩陣Tab 2. 1 Confusion matrix
【參考文獻】:
期刊論文
[1]跨項目軟件缺陷預(yù)測方法研究綜述[J]. 陳翔,王莉萍,顧慶,王贊,倪超,劉望舒,王秋萍. 計算機學(xué)報. 2018(01)
碩士論文
[1]基于遷移學(xué)習(xí)的軟件缺陷預(yù)測方法研究[D]. 倪超.南京大學(xué) 2017
本文編號:3371532
【文章來源】:江蘇科技大學(xué)江蘇省
【文章頁數(shù)】:80 頁
【學(xué)位級別】:碩士
【部分圖文】:
軟件缺陷預(yù)測的整體處理過程
圖 2. 2 同項目缺陷預(yù)測與跨項目缺陷預(yù)測模型Fig 2. 2 With-project defect prediction and cross-project defect prediction model盡管研究人員從預(yù)測精度、代價敏感、實際應(yīng)用等方面初步驗證了 CPDP 的可行性,但較之 WPDP,其預(yù)測性能并不樂觀。研究者們針對跨項目缺陷預(yù)測的問題提出了多種方法,大致可分為三類:有監(jiān)督學(xué)習(xí)方法、半監(jiān)督學(xué)習(xí)方法和無監(jiān)督學(xué)習(xí)方法。[1] 有監(jiān)督學(xué)習(xí)基于有監(jiān)督的學(xué)習(xí)方法,適用于僅存在和目標(biāo)項目相關(guān)的候選源項目的場景,該類方法將候選源項目中有標(biāo)簽的數(shù)據(jù)作為訓(xùn)練集,在該訓(xùn)練集上構(gòu)建缺陷預(yù)測模型,然后對目標(biāo)項目進行預(yù)測。[2] 半監(jiān)督學(xué)習(xí)基于半監(jiān)督的學(xué)習(xí)方法適用的場景為:除了存在一些和目標(biāo)項目相關(guān)的候選源項目外,還在目標(biāo)項目中含有少量含標(biāo)簽的目標(biāo)項目模塊。該方法主要將候選源項目中含標(biāo)簽的所有數(shù)據(jù)和目標(biāo)項目中少量的標(biāo)簽數(shù)據(jù)放在一起作為訓(xùn)練集,構(gòu)建缺陷預(yù)測模型,然后對目標(biāo)項目中的無標(biāo)簽數(shù)據(jù)進行預(yù)測。
圖 2. 3 跨項目缺陷預(yù)測的研究框架圖Fig 2. 3 Framework of the research on CPDP陷預(yù)測性能評價指標(biāo)軟件缺陷預(yù)測中,合理的評價指標(biāo)能更好地評估預(yù)測結(jié)果。下文將介中的常用評價指標(biāo)。件缺陷預(yù)測可以看作是二分類問題,若將有缺陷模塊設(shè)為正例,無缺,則每個實例的分類過程中可能出現(xiàn)以下四種情況:實際為有缺陷類缺陷類,即真正例(true positive, TP);實際為無缺陷類被錯誤劃分為有例(false positive, FP);實際為無缺陷類被正確劃分為無缺陷類,即真反, TN);實際為有缺陷類被錯誤劃分為無缺陷類,即假反例(false negat智能中,混淆矩陣是表示精度評價的一種標(biāo)準(zhǔn)格式,用 n 行 n 列的矩本章所用混淆矩陣如表 2.1 所示:表 2. 1 混淆矩陣Tab 2. 1 Confusion matrix
【參考文獻】:
期刊論文
[1]跨項目軟件缺陷預(yù)測方法研究綜述[J]. 陳翔,王莉萍,顧慶,王贊,倪超,劉望舒,王秋萍. 計算機學(xué)報. 2018(01)
碩士論文
[1]基于遷移學(xué)習(xí)的軟件缺陷預(yù)測方法研究[D]. 倪超.南京大學(xué) 2017
本文編號:3371532
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3371532.html
最近更新
教材專著