基于語義分析的源碼缺陷預(yù)測(cè)系統(tǒng)
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1有監(jiān)督的缺陷預(yù)測(cè)一般過程
目前缺陷預(yù)測(cè)模型在訓(xùn)練過程上主要分為兩種,有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。有監(jiān)督的缺陷預(yù)測(cè)模型需要人工標(biāo)注樣本的標(biāo)簽,通過已有的訓(xùn)練樣本和對(duì)應(yīng)的標(biāo)簽去訓(xùn)練得到一個(gè)符合當(dāng)前特征集的最優(yōu)模型,再利用訓(xùn)練好的模型對(duì)待預(yù)測(cè)數(shù)據(jù)進(jìn)行輸入映射并進(jìn)行計(jì)算,得到類別的概率輸出,對(duì)輸出類別概率與特定的閾值....
圖2-2缺陷代碼示例
圖2-2缺陷代碼示例在圖2-2的這個(gè)示例中,上文中所提出的缺陷預(yù)測(cè)度量元會(huì)出現(xiàn)下列問題:(1)相似的軟件度量:兩段代碼在代碼行數(shù)、條件判斷、變量、循環(huán)以及分支完全一致,因此,如果將軟件度量用作特征,則它們將難以區(qū)分。在其他情況下,兩段代碼可能具有相同的度量,但它們的行為....
圖2-3樸素貝葉斯分類網(wǎng)在樸素貝葉斯分類算法中,每個(gè)數(shù)據(jù)特征都是互相獨(dú)立的,因此需要計(jì)算每個(gè)
華中科技大學(xué)碩士學(xué)位論文向量條件下,數(shù)據(jù)屬于特定類別的后驗(yàn)概率,其中最大的后簽。公式表示為12argmax{,,...,}|iiniCCcPCPdddC數(shù)據(jù)中,由于各個(gè)特征維度是的聯(lián)合后驗(yàn)概率難以得到準(zhǔn)確斯....
圖2-4線性可分的分類面
區(qū)分?jǐn)?shù)據(jù)類別的分類線。數(shù)據(jù)邊界與分類‖。支持向量機(jī)模型在二維空間下就是得下,使分類間隔最大。在高維空間中,區(qū)據(jù)維度的情況下,將最優(yōu)分類的函數(shù)稱為分類學(xué)習(xí)問題的數(shù)據(jù)集:(,),=1,2,…設(shè)數(shù)據(jù)集線性可分,這些樣本數(shù)據(jù)可以被類別。據(jù)集,可假定訓(xùn)練集的數(shù)據(jù)向....
本文編號(hào):4019602
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/4019602.html