面向Bug分派的數(shù)據(jù)集約簡(jiǎn)方法的研究
發(fā)布時(shí)間:2021-09-17 05:25
隨著軟件功能及其開發(fā)過程越來(lái)越復(fù)雜,Bug倉(cāng)庫(kù)追蹤報(bào)告的Bug數(shù)量急劇增加。傳統(tǒng)的人工判讀和分析已經(jīng)無(wú)法適應(yīng)大規(guī)模的Bug數(shù)據(jù),越來(lái)越多的基于文本分類的自動(dòng)Bug分派研究應(yīng)運(yùn)而生。大多數(shù)研究都將Bug報(bào)告中的短描述作為文本信息,再在分派模型上進(jìn)行優(yōu)化,忽略了可以提供更多信息但同樣也會(huì)帶來(lái)更多噪音的長(zhǎng)描述。如果數(shù)據(jù)集質(zhì)量不高,無(wú)論如何優(yōu)化分派模型也不會(huì)達(dá)到很好的效果。另一方面,Bug數(shù)目巨大,開發(fā)人員的時(shí)間和人數(shù)有限,所以優(yōu)先修復(fù)影響較大的Bug報(bào)告,可以將它們帶來(lái)的損害最小化。然而,Bug報(bào)告數(shù)據(jù)集往往是不平衡的。因此,為了提高Bug倉(cāng)庫(kù)中Bug報(bào)告的維護(hù)和管理,減少人工成本,需要對(duì)文本描述信息中包含的噪音多及如何有效識(shí)別高影響力Bug報(bào)告作進(jìn)一步研究?紤]到Bug不同其對(duì)系統(tǒng)造成的潛在威脅也不同,嚴(yán)重程度越高的Bug報(bào)告越應(yīng)該優(yōu)先解決。針對(duì)數(shù)據(jù)集規(guī)模大、質(zhì)量低且數(shù)據(jù)不平衡的現(xiàn)象,本論文對(duì)其Bug分派方法進(jìn)行了研究,主要貢獻(xiàn)如下:(1)提出了一種加權(quán)優(yōu)化的Bug分派方法,通過去除冗余特征和噪音樣本,在保證權(quán)值和二元約束的同時(shí)最大化Bug分派的正確率,建立一個(gè)高質(zhì)量的缺陷數(shù)據(jù)集。本文提出...
【文章來(lái)源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.2?Bug報(bào)告摘要??Fig.?1.2?Bug?report?summary??
本文編號(hào):3398056
【文章來(lái)源】:大連海事大學(xué)遼寧省 211工程院校
【文章頁(yè)數(shù)】:68 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.2?Bug報(bào)告摘要??Fig.?1.2?Bug?report?summary??
本文編號(hào):3398056
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3398056.html
最近更新
教材專著