天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于語義分析的源碼缺陷預(yù)測(cè)系統(tǒng)

發(fā)布時(shí)間:2024-12-22 06:41
  隨著軟件應(yīng)用場(chǎng)景的不斷擴(kuò)大,軟件的規(guī)模和復(fù)雜度也隨之增大,在軟件的開發(fā)和維護(hù)過程中,為了避免軟件在生產(chǎn)環(huán)境中出現(xiàn)問題,需要對(duì)軟件源碼進(jìn)行一定的測(cè)試,而軟件測(cè)試隨著規(guī)模的擴(kuò)大,所需要投入的資源也呈爆炸式的增長(zhǎng)。軟件缺陷預(yù)測(cè)是軟件測(cè)試中的一部分,依據(jù)歷史數(shù)據(jù)來預(yù)測(cè)開發(fā)的軟件源碼是否存在缺陷,從而合理的分配測(cè)試資源。近年來,軟件缺陷預(yù)測(cè)主要研究的是軟件工程領(lǐng)域的特征,包括代碼的結(jié)構(gòu)和復(fù)雜度特征,將不同的軟件工程特征進(jìn)行選擇和組合。而隨著深度學(xué)習(xí)與自然語言處理領(lǐng)域的不斷發(fā)展和體系完善,基于語義特征的軟件缺陷預(yù)測(cè)成為現(xiàn)階段研究的熱點(diǎn),本文將源碼缺陷預(yù)測(cè)與自然語言處理領(lǐng)域的文本分類相類比,針對(duì)源碼本身所蘊(yùn)含的語義特征難以提取的關(guān)鍵問題,在分析現(xiàn)有語義特征提取模型的基礎(chǔ)上,設(shè)計(jì)了基于卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)的源碼語義提取模型,該模型通過深度神經(jīng)網(wǎng)絡(luò)對(duì)源碼文本進(jìn)行特征抽象,獲取源碼語義特征;并提出采用Word Embedding技術(shù)對(duì)源碼輸入進(jìn)行詞向量映射,以此作為語義特征提取模型的基礎(chǔ),該技術(shù)能夠?qū)斎霐?shù)據(jù)進(jìn)行降維,并映射到低維的語義空間。實(shí)驗(yàn)和分析表明,針對(duì)相同的開源數(shù)據(jù)集,基于語義特征提取的預(yù)...

【文章頁數(shù)】:64 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2-1有監(jiān)督的缺陷預(yù)測(cè)一般過程

圖2-1有監(jiān)督的缺陷預(yù)測(cè)一般過程

目前缺陷預(yù)測(cè)模型在訓(xùn)練過程上主要分為兩種,有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。有監(jiān)督的缺陷預(yù)測(cè)模型需要人工標(biāo)注樣本的標(biāo)簽,通過已有的訓(xùn)練樣本和對(duì)應(yīng)的標(biāo)簽去訓(xùn)練得到一個(gè)符合當(dāng)前特征集的最優(yōu)模型,再利用訓(xùn)練好的模型對(duì)待預(yù)測(cè)數(shù)據(jù)進(jìn)行輸入映射并進(jìn)行計(jì)算,得到類別的概率輸出,對(duì)輸出類別概率與特定的閾值....


圖2-2缺陷代碼示例

圖2-2缺陷代碼示例

圖2-2缺陷代碼示例在圖2-2的這個(gè)示例中,上文中所提出的缺陷預(yù)測(cè)度量元會(huì)出現(xiàn)下列問題:(1)相似的軟件度量:兩段代碼在代碼行數(shù)、條件判斷、變量、循環(huán)以及分支完全一致,因此,如果將軟件度量用作特征,則它們將難以區(qū)分。在其他情況下,兩段代碼可能具有相同的度量,但它們的行為....


圖2-3樸素貝葉斯分類網(wǎng)在樸素貝葉斯分類算法中,每個(gè)數(shù)據(jù)特征都是互相獨(dú)立的,因此需要計(jì)算每個(gè)

圖2-3樸素貝葉斯分類網(wǎng)在樸素貝葉斯分類算法中,每個(gè)數(shù)據(jù)特征都是互相獨(dú)立的,因此需要計(jì)算每個(gè)

華中科技大學(xué)碩士學(xué)位論文向量條件下,數(shù)據(jù)屬于特定類別的后驗(yàn)概率,其中最大的后簽。公式表示為12argmax{,,...,}|iiniCCcPCPdddC數(shù)據(jù)中,由于各個(gè)特征維度是的聯(lián)合后驗(yàn)概率難以得到準(zhǔn)確斯....


圖2-4線性可分的分類面

圖2-4線性可分的分類面

區(qū)分?jǐn)?shù)據(jù)類別的分類線。數(shù)據(jù)邊界與分類‖。支持向量機(jī)模型在二維空間下就是得下,使分類間隔最大。在高維空間中,區(qū)據(jù)維度的情況下,將最優(yōu)分類的函數(shù)稱為分類學(xué)習(xí)問題的數(shù)據(jù)集:(,),=1,2,…設(shè)數(shù)據(jù)集線性可分,這些樣本數(shù)據(jù)可以被類別。據(jù)集,可假定訓(xùn)練集的數(shù)據(jù)向....



本文編號(hào):4019602

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/4019602.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶75ba2***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com