天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于程序語(yǔ)義的軟件缺陷預(yù)測(cè)技術(shù)研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-06-17 18:15
  軟件缺陷預(yù)測(cè)技術(shù)能夠輔助開發(fā)者發(fā)現(xiàn)潛在的軟件缺陷,并降低發(fā)現(xiàn)缺陷所需的開銷。傳統(tǒng)軟件缺陷預(yù)測(cè)方法通常利用軟件度量元信息(代碼行數(shù)、控制流圈復(fù)雜度等)作為特征來構(gòu)建機(jī)器學(xué)習(xí)模型,預(yù)測(cè)有缺陷的軟件模塊。然而這種方法的缺點(diǎn)在于軟件度量元中不包含軟件的語(yǔ)法結(jié)構(gòu)信息和語(yǔ)義信息。本文提出了一種使用詞嵌入和深度學(xué)習(xí)技術(shù)以學(xué)習(xí)程序語(yǔ)義信息,進(jìn)而預(yù)測(cè)程序中缺陷的方法Seml(Semantic LSTM model)。本方法首先從源碼的抽象語(yǔ)法樹中按順序抽取特定結(jié)點(diǎn)token,組成一個(gè)token序列,然后利用一個(gè)無(wú)監(jiān)督訓(xùn)練得到的詞嵌入模型,將每個(gè)token映射為一個(gè)定長(zhǎng)的實(shí)值向量。在將每個(gè)樣本的token序列轉(zhuǎn)換為向量序列后,本方法利用訓(xùn)練集的向量序列和它們的標(biāo)簽(是否包含缺陷)來構(gòu)建基于長(zhǎng)短期記憶網(wǎng)絡(luò)的缺陷預(yù)測(cè)模型。長(zhǎng)短期記憶網(wǎng)絡(luò)模型能夠從序列中自動(dòng)學(xué)習(xí)token的順序關(guān)系,從而習(xí)得程序的語(yǔ)義信息。在PROMISE數(shù)據(jù)集的8個(gè)開源項(xiàng)目上進(jìn)行的一系列實(shí)驗(yàn)表明,相比于現(xiàn)有的基于深度學(xué)習(xí)的缺陷預(yù)測(cè)方法以及目前先進(jìn)的基于度量元的缺陷預(yù)測(cè)方法(DBN方法,tb-LSTM方法和ISDA方法),本文提出的方法在項(xiàng)目?jī)?nèi)... 

【文章來源】:北京郵電大學(xué)北京市 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:69 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于程序語(yǔ)義的軟件缺陷預(yù)測(cè)技術(shù)研究與實(shí)現(xiàn)


圖3_?1?Sem丨的整體結(jié)構(gòu)??Semi的輸入為以文件為單位的軟件項(xiàng)0的源碼,輸出為待測(cè)文件的標(biāo)簽(有??缺陷或無(wú)缺陷)

框架圖,軟件缺陷,主界面,預(yù)測(cè)系統(tǒng)


缺陷預(yù)測(cè)??報(bào)告??圖4-1系統(tǒng)框架圖??圖4-1為基于程序語(yǔ)義的軟件缺陷預(yù)測(cè)系統(tǒng)的框架圖。系統(tǒng)的輸入為文件名??中帶有標(biāo)識(shí)字符串的訓(xùn)練集源碼或待測(cè)項(xiàng)目源碼,輸出為訓(xùn)練好的缺陷預(yù)測(cè)模型??或待測(cè)項(xiàng)目的缺陷預(yù)測(cè)報(bào)告。系統(tǒng)由標(biāo)簽識(shí)別、特征抽取、token預(yù)處理、token??映射、CBOW模型訓(xùn)練、缺陷預(yù)測(cè)模型訓(xùn)練、缺陷預(yù)測(cè)和報(bào)告生成等模塊組成。??下面對(duì)每個(gè)模塊的設(shè)計(jì)和部分細(xì)節(jié)進(jìn)行簡(jiǎn)要介紹:??1.

序列,系統(tǒng)特征,界面,模型訓(xùn)練


?取消??圖4-3系統(tǒng)特征抽取界面??如圖4-3所示為系統(tǒng)的特征抽収部分的界而。這一部分能夠指定源碼文件所??在的文件夾和生成的token序列所在的文件夾,從而實(shí)現(xiàn)對(duì)源碼文件進(jìn)行批量抽??取特征。??特征抽収部分的工作流程為:從用戶指定的文件夾中讀取全部Java文件,??對(duì)每個(gè)Java文件,首先將其轉(zhuǎn)換為抽象語(yǔ)法樹,再?gòu)某橄笳Z(yǔ)法樹中抽収特定結(jié)??點(diǎn)并記4?token。生成token序列后,將每個(gè)token序列在用戶指定的位置保存為??一個(gè)文本文件,并以對(duì)應(yīng)源碼文件的絕對(duì)路徑來命名該文件。??4.2.2模型訓(xùn)練??特S文件所在目錄:?(None丨?▼??模型選擇:??◎長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)??其他??開始訓(xùn)練?取消??圖4-4系統(tǒng)模型訓(xùn)練界面??圖4-4為系統(tǒng)的模型訓(xùn)練界面。模型訓(xùn)練界而能夠指定訓(xùn)練集特征所在目錄。??其中訓(xùn)練數(shù)據(jù)需要人工進(jìn)行標(biāo)注,標(biāo)注方法為:對(duì)于包含缺陷的源碼文件,在其??25??

【參考文獻(xiàn)】:
期刊論文
[1]基于深度自編碼網(wǎng)絡(luò)的軟件缺陷預(yù)測(cè)方法[J]. 周末,徐玲,楊夢(mèng)寧,廖勝平,鄢萌.  計(jì)算機(jī)工程與科學(xué). 2018(10)
[2]基于局部稀疏重構(gòu)度量學(xué)習(xí)的軟件缺陷預(yù)測(cè)[J]. 王晴,荊曉遠(yuǎn),朱陽(yáng)平,吳飛,董西偉,程立.  計(jì)算機(jī)技術(shù)與發(fā)展. 2016(11)
[3]一種面向軟件缺陷預(yù)測(cè)的可容忍噪聲的特征選擇框架[J]. 劉望舒,陳翔,顧慶,劉樹龍,陳道蓄.  計(jì)算機(jī)學(xué)報(bào). 2018(03)
[4]基于集成學(xué)習(xí)的軟件缺陷檢測(cè)[J]. 黃文聰,荊曉遠(yuǎn),姚永芳,吳飛.  計(jì)算機(jī)技術(shù)與發(fā)展. 2015(10)
[5]代價(jià)敏感分類的軟件缺陷預(yù)測(cè)方法[J]. 李勇,黃志球,房丙午,王勇.  計(jì)算機(jī)科學(xué)與探索. 2014(12)
[6]基于均衡有偏支持向量機(jī)的軟件缺陷預(yù)測(cè)[J]. 李倩茹,姚偉.  計(jì)算機(jī)工程. 2013(08)



本文編號(hào):3235680

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3235680.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶68264***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com