一種半監(jiān)督集成跨項(xiàng)目軟件缺陷預(yù)測(cè)方法
本文選題:跨項(xiàng)目軟件缺陷預(yù)測(cè) + 半監(jiān)督學(xué)習(xí); 參考:《軟件學(xué)報(bào)》2017年06期
【摘要】:軟件缺陷預(yù)測(cè)方法可以在項(xiàng)目的開發(fā)初期,通過預(yù)先識(shí)別出所有可能含有缺陷的軟件模塊來(lái)優(yōu)化測(cè)試資源的分配.早期的缺陷預(yù)測(cè)研究大多集中于同項(xiàng)目缺陷預(yù)測(cè),但同項(xiàng)目缺陷預(yù)測(cè)需要充足的歷史數(shù)據(jù),而在實(shí)際應(yīng)用中,可能需要預(yù)測(cè)項(xiàng)目的歷史數(shù)據(jù)較為稀缺,或這個(gè)項(xiàng)目是一個(gè)全新項(xiàng)目.因此,跨項(xiàng)目缺陷預(yù)測(cè)問題成為當(dāng)前軟件缺陷預(yù)測(cè)領(lǐng)域內(nèi)的一個(gè)研究熱點(diǎn),其研究挑戰(zhàn)在于源項(xiàng)目與目標(biāo)項(xiàng)目數(shù)據(jù)集間存在的分布差異性以及數(shù)據(jù)集內(nèi)存在的類不平衡問題.受到基于搜索的軟件工程思想的啟發(fā),提出了一種基于搜索的半監(jiān)督集成跨項(xiàng)目軟件缺陷預(yù)測(cè)方法 S~3EL.該方法首先通過調(diào)整訓(xùn)練集中各類數(shù)據(jù)的分布比例,構(gòu)建出多個(gè)樸素貝葉斯基分類器;隨后,利用具有全局搜索能力的遺傳算法,基于少量已標(biāo)記目標(biāo)實(shí)例對(duì)上述基分類器進(jìn)行集成,并構(gòu)建出最終的缺陷預(yù)測(cè)模型.在Promise數(shù)據(jù)集及AEEEM數(shù)據(jù)集上與多個(gè)經(jīng)典的跨項(xiàng)目缺陷預(yù)測(cè)方法(Burak過濾法、Peters過濾法、TCA+、CODEP及HYDRA)進(jìn)行了對(duì)比.以F1值作為評(píng)測(cè)指標(biāo),結(jié)果表明:在大部分情況下,S~3EL方法可以取得最好的預(yù)測(cè)性能.
[Abstract]:The software defect prediction method can optimize the allocation of test resources by pre-identifying all software modules that may contain defects at the beginning of the project development. Most of the early research on defect prediction focuses on the same project defect prediction, but the same project defect prediction needs sufficient historical data, but in practical application, the historical data may be scarce. Or this project is a new project. Therefore, cross-project defect prediction has become a research hotspot in the field of software defect prediction. The research challenge lies in the difference of distribution between the source project and the target project data set and the class imbalance problem in the data set. Inspired by the idea of search-based software engineering, a search-based semi-supervised integrated cross-project software defect prediction method, Sz3ELL, is proposed. Firstly, by adjusting the distribution ratio of all kinds of data in the training set, a number of naive Bayesky classifiers are constructed, and then the genetic algorithm with global searching ability is used. Based on a small number of labeled target examples, the base classifier is integrated and the final defect prediction model is constructed. The Promise data sets and AEEEM data sets are compared with several classic cross project defect prediction methods: Burak filter and Peters filter. Using F1 value as the evaluation index, the results show that in most cases, the best prediction performance can be obtained by using the Szc3EL method.
【作者單位】: 天津大學(xué)軟件學(xué)院軟件工程系;南通大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61202030,61373012,61202006,71502125)~~
【分類號(hào)】:TP18;TP311.53
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王德勝;宮云戰(zhàn);;論軟件缺陷[J];計(jì)算機(jī)應(yīng)用研究;2008年12期
2 聶劍平;韓柯;陳光;曹旭;;軟件缺陷增長(zhǎng)過程的混沌分析[J];計(jì)算機(jī)工程與應(yīng)用;2008年11期
3 劉海;郝克剛;;軟件缺陷數(shù)據(jù)的分析方法及其實(shí)現(xiàn)[J];計(jì)算機(jī)科學(xué);2008年08期
4 熊斐;李建忠;徐中望;;軟件缺陷管理與防范[J];科技創(chuàng)新導(dǎo)報(bào);2009年04期
5 石劍飛;楊欣;秦瑋;閆懷志;;一種軟件缺陷預(yù)測(cè)改進(jìn)模型的研究[J];北京理工大學(xué)學(xué)報(bào);2010年09期
6 繆林松;;基于代價(jià)敏感神經(jīng)網(wǎng)絡(luò)算法的軟件缺陷預(yù)測(cè)[J];電子科技;2012年06期
7 朱小燕;曲俊燕;;淺析軟件缺陷的問題[J];無(wú)線互聯(lián)科技;2013年04期
8 田華;蒲天銀;;基于遷移學(xué)習(xí)的軟件缺陷預(yù)測(cè)方法研究[J];西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年03期
9 宮云戰(zhàn);論軟件缺陷[J];裝甲兵工程學(xué)院學(xué)報(bào);2003年01期
10 李丹;軟件缺陷報(bào)告[J];電子質(zhì)量;2003年07期
相關(guān)會(huì)議論文 前8條
1 趙修湘;石勇;劉瑩;張玲玲;;文本分類在軟件缺陷管理中的應(yīng)用[A];第四屆(2009)中國(guó)管理學(xué)年會(huì)——管理科學(xué)與工程分會(huì)場(chǎng)論文集[C];2009年
2 李立清;;軟件缺陷數(shù)據(jù)的分析和預(yù)測(cè)[A];第三屆中國(guó)測(cè)試學(xué)術(shù)會(huì)議論文集[C];2004年
3 李立清;;用軟件缺陷數(shù)據(jù)進(jìn)行缺陷預(yù)測(cè)[A];中國(guó)工程物理研究院科技年報(bào)(2005)[C];2005年
4 趙亮;侯金寶;;文件和包層次的軟件缺陷預(yù)測(cè)研究[A];第十四屆全國(guó)容錯(cuò)計(jì)算學(xué)術(shù)會(huì)議(CFTC'2011)論文集[C];2011年
5 于秀山;王廣儉;;軟件缺陷管理[A];中國(guó)電子學(xué)會(huì)可靠性分會(huì)第十三屆學(xué)術(shù)年會(huì)論文選[C];2006年
6 寇綱;彭怡;石勇;;基于數(shù)據(jù)挖掘的軟件缺陷度量評(píng)估管理及研究現(xiàn)狀綜述[A];第三屆(2008)中國(guó)管理學(xué)年會(huì)——信息管理分會(huì)場(chǎng)論文集[C];2008年
7 高通;焦彥平;龔波;;基于曲線擬合的軟件缺陷排除成本預(yù)測(cè)[A];2010年全國(guó)通信安全學(xué)術(shù)會(huì)議論文集[C];2010年
8 涂亞明;毛軍鵬;余靜;尹磊;;系統(tǒng)測(cè)試階段的軟件缺陷預(yù)測(cè)模型分析[A];第六屆中國(guó)測(cè)試學(xué)術(shù)會(huì)議論文集[C];2010年
相關(guān)重要報(bào)紙文章 前1條
1 謝敏、戴金龍;追蹤每一個(gè)軟件缺陷[N];計(jì)算機(jī)世界;2005年
相關(guān)博士學(xué)位論文 前8條
1 Gabriel Kofi Armah;[D];電子科技大學(xué);2015年
2 王偉光;動(dòng)態(tài)軟件缺陷測(cè)試關(guān)鍵技術(shù)研究[D];南京大學(xué);2016年
3 陳琳;基于機(jī)器學(xué)習(xí)的軟件缺陷預(yù)測(cè)研究[D];重慶大學(xué);2016年
4 陳媛;基于數(shù)據(jù)挖掘的軟件缺陷預(yù)測(cè)技術(shù)研究[D];中國(guó)科學(xué)院研究生院(長(zhǎng)春光學(xué)精密機(jī)械與物理研究所);2012年
5 馬櫻;基于機(jī)器學(xué)習(xí)的軟件缺陷預(yù)測(cè)技術(shù)研究[D];電子科技大學(xué);2012年
6 單純;軟件缺陷分布預(yù)測(cè)技術(shù)及應(yīng)用研究[D];北京理工大學(xué);2015年
7 張凱;軟件缺陷混沌分形描述與軟件質(zhì)量進(jìn)化度量的研究[D];武漢理工大學(xué);2005年
8 楊曉杏;基于度量元的軟件缺陷預(yù)測(cè)技術(shù)[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 趙長(zhǎng)凱;軟件缺陷管理與預(yù)測(cè)系統(tǒng)的設(shè)計(jì)[D];復(fù)旦大學(xué);2013年
2 張亮;基于改進(jìn)BP算法的軟件缺陷預(yù)測(cè)模型研究[D];北京理工大學(xué);2015年
3 王男帥;基于遺傳優(yōu)化支持向量機(jī)的軟件缺陷預(yù)測(cè)模型研究[D];北京理工大學(xué);2015年
4 陳艷;軟件缺陷管理技術(shù)研究與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
5 李碧雯;基于遷移學(xué)習(xí)的跨項(xiàng)目軟件缺陷預(yù)測(cè)[D];上海交通大學(xué);2015年
6 梁天超;一種基于人工免疫樸素貝葉斯方法的軟件缺陷預(yù)測(cè)模型[D];南京郵電大學(xué);2015年
7 陳家強(qiáng);軟件缺陷預(yù)測(cè)中數(shù)據(jù)預(yù)處理技術(shù)研究[D];南京大學(xué);2014年
8 江曉蘇;魚群優(yōu)化的多核支持向量機(jī)在軟件缺陷預(yù)測(cè)中的應(yīng)用[D];重慶師范大學(xué);2016年
9 權(quán)衡;基于Web的軟件缺陷管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華中科技大學(xué);2014年
10 劉慶山;基于復(fù)雜網(wǎng)絡(luò)的動(dòng)態(tài)軟件缺陷預(yù)測(cè)算法研究[D];燕山大學(xué);2016年
,本文編號(hào):1914444
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1914444.html