天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于隨機(jī)森林和SVM的軟件缺陷預(yù)測(cè)方法研究

發(fā)布時(shí)間:2021-04-13 12:44
  隨著軟件系統(tǒng)的規(guī)模和復(fù)雜度日益龐大,正確地找到有缺陷的軟件模塊需要消耗大量的人力、物力等資源。軟件缺陷預(yù)測(cè)技術(shù)通過(guò)挖掘、分析軟件項(xiàng)目中的歷史開(kāi)發(fā)數(shù)據(jù)來(lái)檢測(cè)潛在有缺陷的軟件模塊,從而提高開(kāi)發(fā)效率節(jié)省開(kāi)發(fā)成本。目前在軟件缺陷預(yù)測(cè)領(lǐng)域,研究者主要使用機(jī)器學(xué)習(xí)的理論來(lái)構(gòu)建缺陷預(yù)測(cè)模型,這些模型在實(shí)際應(yīng)用中存在軟件缺陷數(shù)據(jù)集中會(huì)包含大量的冗余特征、數(shù)據(jù)集的分布不平衡等問(wèn)題,這些因素在很大程度上會(huì)影響模型的預(yù)測(cè)性能。本文針對(duì)軟件缺陷預(yù)測(cè)過(guò)程中存在的問(wèn)題分別利用隨機(jī)森林算法對(duì)特征進(jìn)行選擇從而刪除數(shù)據(jù)集中的冗余特征,利用SMOTE過(guò)采樣結(jié)合隨機(jī)欠采樣技術(shù)改善數(shù)據(jù)集的不平衡率。本文結(jié)合數(shù)據(jù)集特點(diǎn)選用SVM作為基礎(chǔ)分類(lèi)器,設(shè)計(jì)了基于隨機(jī)森林和SVM的軟件缺陷預(yù)測(cè)模型。論文的主要研究?jī)?nèi)容如下:(1)利用隨機(jī)森林分類(lèi)器的分類(lèi)準(zhǔn)確率作為特征可分性的依據(jù)通過(guò)選取最高分類(lèi)準(zhǔn)確率對(duì)應(yīng)的特征子集實(shí)現(xiàn)對(duì)特征的選擇。(2)結(jié)合SMOTE過(guò)采樣和隨機(jī)欠采樣技術(shù)使樣本中多數(shù)類(lèi)和少數(shù)類(lèi)的數(shù)目達(dá)到平衡,同時(shí)樣本數(shù)量降到原來(lái)樣本數(shù)量的一半,提升了分類(lèi)速度。(3)對(duì)于特征選擇和數(shù)據(jù)采樣的先后順序以及數(shù)據(jù)預(yù)處理后作用于采樣后的數(shù)據(jù)集還是... 

【文章來(lái)源】:浙江工業(yè)大學(xué)浙江省

【文章頁(yè)數(shù)】:62 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于隨機(jī)森林和SVM的軟件缺陷預(yù)測(cè)方法研究


軟件缺陷預(yù)測(cè)技術(shù)分類(lèi)示意圖

工作流程圖,預(yù)測(cè)技術(shù),缺陷,靜態(tài)


基于隨機(jī)森林和SVM的軟件缺陷預(yù)測(cè)方法研究7的數(shù)目、缺陷密度或缺陷傾向性等。如今有大量研究者根據(jù)軟件的靜態(tài)代碼特征結(jié)合機(jī)器學(xué)習(xí)算法來(lái)構(gòu)建軟件缺陷預(yù)測(cè)模型。通過(guò)對(duì)軟件系統(tǒng)的分析得知,80%的缺陷集中分布于20%的軟件模塊內(nèi)[25],為了預(yù)測(cè)這些缺陷模塊研究人員按照預(yù)測(cè)的目的不同將模型分為基于缺陷分類(lèi)的預(yù)測(cè)和基于缺陷數(shù)目的預(yù)測(cè);谌毕莘诸(lèi)的預(yù)測(cè)主要是預(yù)測(cè)軟件模塊中是否存在缺陷,從而引導(dǎo)軟件測(cè)試人員合理安排測(cè)試資源;谌毕輸(shù)目的預(yù)測(cè)主要是為了估計(jì)軟件系統(tǒng)中存在缺陷模塊的個(gè)數(shù)或缺陷的密度。當(dāng)前缺陷預(yù)測(cè)技術(shù)主要的研究方向是利用機(jī)器學(xué)習(xí)中的分類(lèi)算法構(gòu)建預(yù)測(cè)模型,本文設(shè)計(jì)的基于隨機(jī)森林和SVM的軟件缺陷預(yù)測(cè)模型屬于基于缺陷分類(lèi)的靜態(tài)預(yù)測(cè)技術(shù)。靜態(tài)軟件缺陷預(yù)測(cè)技術(shù)的工作流程如圖2-2所示:圖2-2靜態(tài)軟件缺陷預(yù)測(cè)技術(shù)的工作流程Figure2-2.Workflowofstaticsoftwaredefectpredictiontechnology對(duì)于缺陷分類(lèi)的預(yù)測(cè)可以將缺陷預(yù)測(cè)簡(jiǎn)化一個(gè)二分類(lèi)問(wèn)題[26]。其目標(biāo)就是預(yù)測(cè)軟件模塊內(nèi)是否含有缺陷,若模塊中的缺陷個(gè)數(shù)大于或等于1,則認(rèn)為該模塊含有缺陷,若模塊中缺陷個(gè)數(shù)等于0,則認(rèn)為該模塊沒(méi)有缺陷。一般靜態(tài)軟件缺陷預(yù)測(cè)包含如下四個(gè)步驟:(1):挖掘、分析軟件倉(cāng)庫(kù)中的歷史開(kāi)發(fā)數(shù)據(jù),選取與軟件缺陷相關(guān)性較強(qiáng)的度量元,通常為了提高預(yù)測(cè)的準(zhǔn)確性,所選取的度量元應(yīng)該能夠反映軟件模塊的內(nèi)在復(fù)雜度和代碼規(guī)模,進(jìn)而構(gòu)建軟件缺陷數(shù)據(jù)集。(2):一般原始的缺陷數(shù)據(jù)集中會(huì)存在噪聲數(shù)據(jù)和無(wú)關(guān)數(shù)據(jù),所以需要對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,然后選擇有意義的度量元用于模型訓(xùn)練。(3):選擇合適的學(xué)習(xí)算法從相關(guān)數(shù)據(jù)中學(xué)習(xí),從而得到度量元與軟件缺陷之間的映射關(guān)系,構(gòu)建缺陷預(yù)測(cè)模型。

示意圖,軟件度量,方法,示意圖


基于隨機(jī)森林和SVM的軟件缺陷預(yù)測(cè)方法研究9圖2-3軟件度量方法分類(lèi)示意圖Figure2-3.Schematicdiagramofsoftwaremeasurementmethods在本文中主要使用的是基于軟件產(chǎn)品屬性確定的度量元,即通過(guò)分析軟件源代碼來(lái)設(shè)計(jì)度量元,描述軟件產(chǎn)品的特征,用于產(chǎn)品評(píng)估和決策;谲浖a(chǎn)品屬性的度量元主要研究的是軟件模塊的代碼規(guī)模和軟件復(fù)雜度等屬性。下面重點(diǎn)介紹幾種常用的基于軟件產(chǎn)品屬性的面向過(guò)程度量:(1)規(guī)模度量軟件的規(guī)模是較為直觀的度量方式,早期的研究人員對(duì)程序中代碼的具體的行數(shù)進(jìn)行度量[33],例如,Akiyama發(fā)現(xiàn)了缺陷數(shù)(D)和代碼總行數(shù)(L)的關(guān)系表達(dá)式:D=4.86+0.018L;除了代碼總行數(shù)(LOC)之外,相關(guān)的度量元還包括注釋行數(shù)(LOComment)、空代碼行數(shù)(LOBlank)、方法行數(shù)等,但這些度量元還不能有效地去度量軟件系統(tǒng)的規(guī)模。(2)復(fù)雜度度量軟件的復(fù)雜度度量主要有面向過(guò)程的傳統(tǒng)度量和面向?qū)ο蟮亩攘。面向過(guò)程的傳統(tǒng)度量是對(duì)面向過(guò)程的程序設(shè)計(jì)的方法級(jí)別進(jìn)行的度量,主要包括Halstead[34]以及McCabe度量[35]。Halstead度量主要關(guān)注的是程序中出現(xiàn)的可執(zhí)行代碼行的操作數(shù)和操作符的數(shù)量,代碼中的操作數(shù)和操作符越多,則相應(yīng)的程序結(jié)構(gòu)復(fù)雜度越高。McCabe度量主要關(guān)注的是程序的控制流復(fù)雜度,將程序抽象為控制流程圖并根據(jù)控制流的復(fù)雜性來(lái)計(jì)算程序的復(fù)雜性,順序結(jié)構(gòu)組成的程序在復(fù)雜度方面最為簡(jiǎn)單,而選擇和循環(huán)構(gòu)成的環(huán)路越多,則程序越復(fù)雜。程序復(fù)雜度越高,認(rèn)為程序中存在缺陷的可能性也越高。隨著開(kāi)發(fā)方法的不斷發(fā)展,面向過(guò)程的度量已經(jīng)不能描述對(duì)象間的繼承關(guān)系,研究者們依據(jù)代碼結(jié)構(gòu)中的繼承、耦合、內(nèi)聚等關(guān)系計(jì)算代碼的復(fù)雜度,提出了面向?qū)ο蠖攘。面向(qū)ο蠓椒ㄒ仓饾u成為主流開(kāi)發(fā)方法,其特有

【參考文獻(xiàn)】:
期刊論文
[1]軟件缺陷預(yù)測(cè)技術(shù)研究進(jìn)展[J]. 宮麗娜,姜淑娟,姜麗.  軟件學(xué)報(bào). 2019(10)
[2]SVM參數(shù)優(yōu)化及其在儲(chǔ)集層評(píng)價(jià)中的應(yīng)用研究[J]. 任義麗,米蘭,馮周.  信息系統(tǒng)工程. 2019(07)
[3]即時(shí)軟件缺陷預(yù)測(cè)研究進(jìn)展[J]. 蔡亮,范元瑞,鄢萌,夏鑫.  軟件學(xué)報(bào). 2019(05)
[4]改進(jìn)的軟件缺陷預(yù)測(cè)模型研究[J]. 劉愷,包月青,趙先鋒.  浙江工業(yè)大學(xué)學(xué)報(bào). 2019(02)
[5]孿生支持向量機(jī)綜述[J]. 安悅瑄,丁世飛,胡繼普.  計(jì)算機(jī)科學(xué). 2018(11)
[6]基于多核字典學(xué)習(xí)的軟件缺陷預(yù)測(cè)[J]. 王鐵建,吳飛,荊曉遠(yuǎn).  計(jì)算機(jī)科學(xué). 2017(12)
[7]基于AUC統(tǒng)計(jì)量的隨機(jī)森林變量重要性評(píng)分的研究[J]. 張曉鳳,侯艷,李康.  中國(guó)衛(wèi)生統(tǒng)計(jì). 2016(03)
[8]靜態(tài)軟件缺陷預(yù)測(cè)方法研究[J]. 陳翔,顧慶,劉望舒,劉樹(shù)龍,倪超.  軟件學(xué)報(bào). 2016(01)
[9]航天嵌入式軟件可信性度量方法及應(yīng)用研究[J]. 王婧,陳儀香,顧斌,郭向英,王保華,金晟毅,徐建,張居陽(yáng).  中國(guó)科學(xué):技術(shù)科學(xué). 2015(02)
[10]特征選擇方法與算法的研究[J]. 李敏,卡米力·木依丁.  計(jì)算機(jī)技術(shù)與發(fā)展. 2013(12)

碩士論文
[1]基于動(dòng)態(tài)代價(jià)敏感型貝葉斯網(wǎng)絡(luò)的軟件缺陷預(yù)測(cè)方法研究[D]. 張俊宇.華中師范大學(xué) 2016
[2]SVM核參數(shù)優(yōu)化研究與應(yīng)用[D]. 楊海.浙江大學(xué) 2014
[3]隨機(jī)森林特征選擇[D]. 王全才.大連理工大學(xué) 2011
[4]BOSS網(wǎng)管軟件測(cè)試的管理與實(shí)踐[D]. 梁煥青.北京郵電大學(xué) 2006



本文編號(hào):3135321

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3135321.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)26202***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com