天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于程序向量樹的代碼克隆檢測

發(fā)布時間:2021-04-26 11:19
  代碼克隆能夠加速軟件開發(fā)但是也會導(dǎo)致缺陷重復(fù)發(fā)生和軟件質(zhì)量問題。部分類型的代碼克隆在字面上相似度低,導(dǎo)致識別困難。針對這一問題,提出一種基于程序向量樹的代碼克隆檢測方法。首先,基于統(tǒng)計語言模型抽取詞法單元的特征表示,分析不同字面單詞之間的語義相似性;接著,通過語法分析提取程序的抽象語法樹(AST),為葉子節(jié)點賦予對應(yīng)字面單詞的特征表示,將抽象語法樹轉(zhuǎn)化為程序向量樹;最后,提出一種加權(quán)編碼規(guī)則,在考慮區(qū)分不同樹節(jié)點重要程度的基礎(chǔ)上,將程序向量樹編碼為定長向量,而具有相似向量表示的代碼片段被判定為代碼克隆。實驗結(jié)果表明,在真實代碼克隆的大規(guī)模標(biāo)準(zhǔn)數(shù)據(jù)集BigCloneBench上,針對在字面上相似度較低的Moderately Type-3和Type-4類型克隆進(jìn)行檢測時,該方法均優(yōu)于當(dāng)前的主流方法,包括NiCad、Deckard、SourcererCC和Oreo等,證實了該方法的有效性。 

【文章來源】:計算機科學(xué)與探索. 2020,14(10)北大核心CSCD

【文章頁數(shù)】:14 頁

【文章目錄】:
1 引言
2 相關(guān)工作
3 基于程序向量樹的代碼克隆檢測方法
    3.1 構(gòu)造程序向量樹
    3.2 向量編碼與近鄰向量搜索
        3.2.1 將抽象語法樹轉(zhuǎn)化為完滿二叉樹
        3.2.2 基于程序向量樹將程序編碼為定長向量
        3.2.3 近鄰向量搜索
4 實驗與結(jié)果分析
    4.1 實驗數(shù)據(jù)集與評測指標(biāo)
    4.2 實驗步驟
    4.3 實驗結(jié)果
    4.4 討論
5 總結(jié)與展望


【參考文獻(xiàn)】:
期刊論文
[1]代碼克隆檢測研究進(jìn)展[J]. 陳秋遠(yuǎn),李善平,鄢萌,夏鑫.  軟件學(xué)報. 2019(04)
[2]大規(guī)模代碼克隆的檢測方法[J]. 郭穎,陳峰宏,周明輝.  計算機科學(xué)與探索. 2014(04)



本文編號:3161324

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3161324.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶dc5e9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com