天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于機(jī)器學(xué)習(xí)的軟件缺陷預(yù)測(cè)方案研究

發(fā)布時(shí)間:2021-05-05 17:34
  隨著網(wǎng)絡(luò)科技的快速發(fā)展,用戶對(duì)于軟件的質(zhì)量也提出了更高的要求。軟件缺陷是影響軟件質(zhì)量的最大因素,軟件缺陷的檢測(cè)成為軟件上線前的必經(jīng)步驟。然而通常一個(gè)軟件的體量非常巨大,如果要檢查全部軟件代碼,花費(fèi)的成本也是巨大的。軟件缺陷預(yù)測(cè)的提出正是為了解決這一問題,將檢測(cè)的人力物力更好的分配到可能有缺陷的地方,既可以提高效率又可以節(jié)省成本。本文針對(duì)基于機(jī)器學(xué)習(xí)的軟件缺陷預(yù)測(cè)中對(duì)特征關(guān)聯(lián)性考慮不足和無標(biāo)簽預(yù)測(cè)問題深入研究,從多個(gè)角度入手以提高預(yù)測(cè)的曲線下面積(Area Under Curve,AUC)指標(biāo),相比準(zhǔn)確率指標(biāo)更好的表達(dá)較少的有缺陷類的預(yù)測(cè)效果。論文主要成果有:首先,針對(duì)軟件缺陷預(yù)測(cè)中分類的不平衡性,即與正常代碼部分相比有缺陷的部分往往占少數(shù),提出了新型的上采樣方案。方案中增加了類內(nèi)離散度信息與支持向量清洗策略,使得新樣本分布更均勻。通過與多個(gè)上采樣方案在多個(gè)軟件缺陷預(yù)測(cè)中流行的機(jī)器學(xué)習(xí)方法上進(jìn)行實(shí)驗(yàn)對(duì)比,證明了所提出的上采樣方案取得了更高的AUC值。其次,從特征入手,根據(jù)每個(gè)特征對(duì)最終預(yù)測(cè)效果的影響程度對(duì)原有的特征進(jìn)行篩選,提出一套特征篩選與預(yù)測(cè)為一體的方案。方案分別從正向增加特征與反向... 

【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:66 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景與意義
    1.2 研究現(xiàn)狀
        1.2.1 采樣方法的研究現(xiàn)狀及在軟件缺陷預(yù)測(cè)中的應(yīng)用
        1.2.2 特征選擇在軟件缺陷領(lǐng)域的研究現(xiàn)狀
        1.2.3 無標(biāo)簽軟件缺陷預(yù)測(cè)的研究現(xiàn)狀
    1.3 論文主要工作
    1.4 論文的組織結(jié)構(gòu)
第二章 軟件缺陷預(yù)測(cè)關(guān)鍵技術(shù)
    2.1 特征提取方法
    2.2 評(píng)價(jià)指標(biāo)
    2.3 采樣技術(shù)
    2.4 特征降維方法
    2.5 本文機(jī)器學(xué)習(xí)方法
第三章 基于類內(nèi)離散度的上采樣方法
    3.1 上采樣方案
        3.1.1 概述
        3.1.2 上采樣方案步驟
        3.1.3 類內(nèi)離散度
        3.1.4 支持向量調(diào)整比例
        3.1.5 ENN數(shù)據(jù)清洗
    3.2 實(shí)驗(yàn)與分析
        3.2.1 數(shù)據(jù)與評(píng)價(jià)指標(biāo)
        3.2.2 實(shí)驗(yàn)設(shè)計(jì)
        3.2.3 實(shí)驗(yàn)結(jié)果分析
    3.3 本章小結(jié)
第四章 自動(dòng)特征子集選擇方案
    4.1 引言
    4.2 特征分析與特征子集
        4.2.1 選擇獨(dú)立特征
        4.2.2 特征子集選擇優(yōu)化
    4.3 結(jié)合隨機(jī)森林的特征子集選擇方案
        4.3.1 方案整體介紹
        4.3.2 隨機(jī)森林分類器的融入
    4.4 結(jié)合類內(nèi)離散度上采樣的向前特征子集選擇
    4.5 實(shí)驗(yàn)與分析
        4.5.1 實(shí)驗(yàn)流程
        4.5.2 結(jié)果分析
    4.6 本章小結(jié)
第五章 PCLAI無監(jiān)督缺陷預(yù)測(cè)方法
    5.1 改進(jìn)CLAMI的模型
        5.1.1 CLAMI缺陷分析
        5.1.2 改進(jìn)的無監(jiān)督標(biāo)記方法PCLAI
    5.2 實(shí)驗(yàn)與分析
        5.2.1 實(shí)驗(yàn)設(shè)計(jì)
        5.2.2 結(jié)果分析
    5.3 本章小結(jié)
第六章 總結(jié)與展望
    6.1 工作總結(jié)
    6.2 展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文


【參考文獻(xiàn)】:
期刊論文
[1]SBFS:基于搜索的軟件缺陷預(yù)測(cè)特征選擇框架[J]. 陳翔,陸凌姣,吉人,魏世鑫.  計(jì)算機(jī)應(yīng)用研究. 2017(04)
[2]基于ADASYN與AdaBoostSVM相結(jié)合的不平衡分類算法[J]. 柳培忠,洪銘,黃德天,駱炎民,王守覺.  北京工業(yè)大學(xué)學(xué)報(bào). 2017(03)
[3]一種半監(jiān)督集成跨項(xiàng)目軟件缺陷預(yù)測(cè)方法[J]. 何吉元,孟昭鵬,陳翔,王贊,樊向宇.  軟件學(xué)報(bào). 2017(06)
[4]基于不平衡數(shù)據(jù)集的軟件缺陷預(yù)測(cè)[J]. 張曉風(fēng),張德平.  計(jì)算機(jī)應(yīng)用研究. 2017(07)
[5]軟件缺陷預(yù)測(cè)中基于聚類分析的特征選擇方法[J]. 劉望舒,陳翔,顧慶,劉樹龍,陳道蓄.  中國科學(xué):信息科學(xué). 2016(09)
[6]靜態(tài)軟件缺陷預(yù)測(cè)方法研究[J]. 陳翔,顧慶,劉望舒,劉樹龍,倪超.  軟件學(xué)報(bào). 2016(01)
[7]面向不平衡數(shù)據(jù)集的改進(jìn)型SMOTE算法[J]. 王超學(xué),張濤,馬春森.  計(jì)算機(jī)科學(xué)與探索. 2014(06)
[8]特征選擇方法綜述[J]. 姚旭,王曉丹,張玉璽,權(quán)文.  控制與決策. 2012(02)



本文編號(hào):3170299

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3170299.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f181f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com