天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于特征選擇和實(shí)例遷移的軟件缺陷預(yù)測方法研究

發(fā)布時(shí)間:2021-10-10 14:38
  隨著軟件行業(yè)的快速發(fā)展,軟件的規(guī)模也不斷地?cái)U(kuò)大,不可避免的會(huì)產(chǎn)生許多軟件缺陷。而軟件缺陷的存在會(huì)對人們的生產(chǎn)和生活帶來巨大的損失,因此人們開始意識(shí)到軟件質(zhì)量的重要性。如果可以在軟件發(fā)布之前就找到軟件中隱藏的缺陷,那么就可以合理有效的分配測試資源,集中精力進(jìn)行修復(fù),因此軟件缺陷預(yù)測得到了人們的關(guān)注。軟件缺陷預(yù)測是通過挖掘歷史數(shù)據(jù),如軟件開發(fā)過程、軟件代碼等,進(jìn)而構(gòu)建缺陷預(yù)測模型,對新的項(xiàng)目模塊進(jìn)行預(yù)測。然而目前大部分的研究都集中在同項(xiàng)目缺陷預(yù)測。但是在實(shí)際的開發(fā)中,經(jīng)常需要對一個(gè)全新的項(xiàng)目進(jìn)行預(yù)測,或者項(xiàng)目已有的標(biāo)記數(shù)據(jù)很少。在這種情況下,跨項(xiàng)目缺陷預(yù)測應(yīng)運(yùn)而生。該方法使用已有的具有豐富標(biāo)記的其他項(xiàng)目(即源項(xiàng)目)數(shù)據(jù)構(gòu)建缺陷預(yù)測模型,對當(dāng)前項(xiàng)目(即目標(biāo)項(xiàng)目)的缺陷情況進(jìn)行預(yù)測。本文針對大部分模型在實(shí)際應(yīng)用中存在的問題:(1)缺陷數(shù)據(jù)中有大量冗余或無關(guān)特征;(2)缺陷數(shù)據(jù)存在類不平衡現(xiàn)象;(3)源項(xiàng)目和目標(biāo)項(xiàng)目之間數(shù)據(jù)分布差異較大,提出了兩種軟件缺陷預(yù)測方法。(1)基于特征選擇的軟件缺陷預(yù)測方法基于缺陷數(shù)據(jù)中存在冗余或無關(guān)特征的問題,本文提出一種基于特征選擇的軟件缺陷預(yù)測方法。該方法從源項(xiàng)... 

【文章來源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校

【文章頁數(shù)】:75 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于特征選擇和實(shí)例遷移的軟件缺陷預(yù)測方法研究


特征選擇過程

方法,樣本,過采樣,欠采樣


根據(jù)具體操作的不同主要分為對多數(shù)類樣本的欠采樣和對少數(shù)類樣本的過采樣兩種方法。其中最簡單易懂的就是隨機(jī)采樣,同理,隨機(jī)采樣也包括隨機(jī)過采樣和隨機(jī)欠采樣兩種。隨機(jī)欠采樣就是隨機(jī)的在多數(shù)類樣本中選出一些樣本并從原始數(shù)據(jù)集中移除。而隨機(jī)過采樣就是隨機(jī)選出一些少數(shù)類樣本,對這些樣本進(jìn)行復(fù)制,并添加到原始數(shù)據(jù)集中一起進(jìn)行訓(xùn)練。這兩種方法雖然都能改變原始數(shù)據(jù)集的樣本容量并且緩解數(shù)據(jù)集中的不平衡現(xiàn)象,但是都會(huì)產(chǎn)生不同的負(fù)面效果。例如欠采樣方法由于是隨機(jī)的刪除多數(shù)類樣本,因此往往會(huì)造成信息缺失,并且被刪除的多數(shù)類樣本有可能含有重要的信息。而過采樣方法由于只是對選出的少數(shù)類樣本進(jìn)行簡單的復(fù)制,經(jīng)常會(huì)導(dǎo)致過擬合現(xiàn)象。針對這些問題,研究者提出了幾種其他改進(jìn)的采樣算法,如 SMOTE 算法、BalanceCascade 算法[58]和EasyEnsemble 算法[59]等,下面將對 SMOTE 算法進(jìn)行簡單介紹。SMOTE(Synthetic Minority Oversampling Technique)是隨機(jī)過采樣算法的一種改進(jìn)方法。其基本思想是通過對少數(shù)類樣本進(jìn)行分析,利用樣本之間的相似性人工合成新樣本并添加到數(shù)據(jù)集中。具體如圖 2.2 所示:

曲線,缺陷預(yù)測,評價(jià)分類,軟件缺陷


第 2 章 軟件缺陷預(yù)測相關(guān)基礎(chǔ)pf = C curve)也是常用的評價(jià)分類器的指ration characteristic)曲線。其橫坐標(biāo)缺陷預(yù)測模型中,預(yù)測結(jié)果就對應(yīng) 形成經(jīng)過(0,0)和(1,1)兩點(diǎn)的 ROC 曲大小。AUC 的值為 0 到 1 之間,其值 曲線示意圖。

【參考文獻(xiàn)】:
期刊論文
[1]基于Box-Cox轉(zhuǎn)換的集成跨項(xiàng)目軟件缺陷預(yù)測方法[J]. 王莉萍,陳翔,王秋萍,趙英全.  計(jì)算機(jī)應(yīng)用研究. 2017(07)
[2]軟件缺陷預(yù)測中基于聚類分析的特征選擇方法[J]. 劉望舒,陳翔,顧慶,劉樹龍,陳道蓄.  中國科學(xué):信息科學(xué). 2016(09)
[3]基于遷移學(xué)習(xí)的軟件缺陷預(yù)測[J]. 程銘,毋國慶,袁夢霆.  電子學(xué)報(bào). 2016(01)
[4]靜態(tài)軟件缺陷預(yù)測方法研究[J]. 陳翔,顧慶,劉望舒,劉樹龍,倪超.  軟件學(xué)報(bào). 2016(01)
[5]軟件缺陷預(yù)測技術(shù)[J]. 王青,伍書劍,李明樹.  軟件學(xué)報(bào). 2008(07)
[6]一種基于級聯(lián)模型的類別不平衡數(shù)據(jù)分類方法[J]. 劉胥影,吳建鑫,周志華.  南京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(02)

博士論文
[1]基于機(jī)器學(xué)習(xí)的軟件缺陷預(yù)測研究[D]. 陳琳.重慶大學(xué) 2016

碩士論文
[1]基于遷移學(xué)習(xí)的軟件缺陷預(yù)測方法研究[D]. 倪超.南京大學(xué) 2017



本文編號:3428575

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3428575.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶772b5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com