基于神經(jīng)網(wǎng)絡(luò)語言模型的代碼分析方法研究

發(fā)布時(shí)間：2019-10-18 01:20

【摘要】：深度學(xué)習(xí)已經(jīng)在人工智能領(lǐng)域中取得了顯著的成就。這得益于其捕捉高維復(fù)雜特征的強(qiáng)大能力,而且并不需要人工特征的干預(yù)。利用深度神經(jīng)網(wǎng)絡(luò)來解決代碼分析問題要比基于統(tǒng)計(jì)的方法更為簡單。例如在代碼分類問題中,深度神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)地抽取出代碼中有用的特征。從局部到高層的抽象過程,特征在每一層能夠被自動(dòng)地組織起來�；谶@些抽象的特征,我們能夠確定一段代碼的類別。深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)并不像傳統(tǒng)的方法需要過多的人工特征。更加自然的特征對于多任務(wù)學(xué)習(xí)是更有利的。深度學(xué)習(xí)結(jié)構(gòu)對于其他的代碼分析任務(wù)同樣是有效果的。但是,將深度學(xué)習(xí)應(yīng)用在代碼分析領(lǐng)域還是存在一些困難。因?yàn)樘荻葟浬⒌膯栴},導(dǎo)致傳統(tǒng)的學(xué)習(xí)算法并不能對網(wǎng)絡(luò)進(jìn)行有效的訓(xùn)練。本文借用了深度學(xué)習(xí)在解決自然語言處理問題中的思想,構(gòu)造可以學(xué)習(xí)代碼結(jié)構(gòu)的分布式表示的模型,從而將深度學(xué)習(xí)應(yīng)用于代碼分析領(lǐng)域。本文提出了一條編碼規(guī)則建立抽象語法樹結(jié)點(diǎn)的向量表示,這是將深度學(xué)習(xí)應(yīng)用于代碼分析問題的基礎(chǔ)。根據(jù)實(shí)驗(yàn)的結(jié)果可以得出,該編碼規(guī)則可以有效地學(xué)習(xí)到抽象語法樹結(jié)點(diǎn)的向量表示。為了證明深度學(xué)習(xí)對于代碼分析問題是否真的有效。本文將學(xué)習(xí)到的特征向量輸入到一個(gè)深度神經(jīng)網(wǎng)絡(luò)中,實(shí)驗(yàn)結(jié)果表明較淺層學(xué)習(xí)方法,深度學(xué)習(xí)方法取得了更好的效果。本文還提出了另一種通過學(xué)習(xí)程序控制流圖的的根子圖的向量表示來對代碼進(jìn)行建模的方法。這是受圖核函數(shù)最近的一些研究成果的啟發(fā)。該模型以無監(jiān)督學(xué)習(xí)的方式,利用鄰居結(jié)點(diǎn)之間的關(guān)系,來學(xué)習(xí)它們之間隱藏的相似性。通過實(shí)驗(yàn)證明了模型與支持向量機(jī)這樣的核分類器以及關(guān)聯(lián)聚類算法一起在監(jiān)督學(xué)習(xí)以及無監(jiān)督學(xué)習(xí)任務(wù)中均取得了很好的效果。實(shí)驗(yàn)不僅僅是在一些基準(zhǔn)數(shù)據(jù)集上進(jìn)行的,同時(shí)還有實(shí)際問題中的數(shù)據(jù)集。相信在未來,深度學(xué)習(xí)會(huì)成為代碼分析領(lǐng)域中的一種重要途徑。
【圖文】：

交叉熵,語料庫,編程語言,訓(xùn)練項(xiàng)目

電子科技大學(xué)碩士學(xué)位論文上測試得到的交叉熵的范圍。底部的折線表示在訓(xùn)練項(xiàng)目上進(jìn)行測結(jié)果�？梢钥闯�，語言模型確實(shí)能夠獲取顯著的局部規(guī)律，而不僅僅言語法上的簡單，而是因?yàn)槌绦蛘Z言與自然語言在本質(zhì)上是相似的。

交叉熵,編程語言,程序員,規(guī)律

18圖 2-7 10 個(gè) Java 項(xiàng)目中編程語言交叉熵的相互比較還有一個(gè)更有意思的結(jié)果：每個(gè)項(xiàng)目中都存在其獨(dú)有的、局部的、非 Ja特有的規(guī)律，在不同的項(xiàng)目中這個(gè)規(guī)律也是不同的。很多程序員都有這樣
【學(xué)位授予單位】：電子科技大學(xué)
【學(xué)位級(jí)別】：碩士
【學(xué)位授予年份】：2017
【分類號(hào)】：TP18;TP312

【參考文獻(xiàn)】

相關(guān)期刊論文前5條

1 胡彬;王春東;胡思琦;周景春;;基于機(jī)器學(xué)習(xí)的移動(dòng)終端高級(jí)持續(xù)性威脅檢測技術(shù)研究[J];計(jì)算機(jī)工程;2017年01期

2 張凱;王東安;李超;賈冰;;基于協(xié)同采樣主動(dòng)學(xué)習(xí)的惡意代碼檢測[J];高技術(shù)通訊;2016年05期

3 毛蔚軒;蔡忠閩;童力;;一種基于主動(dòng)學(xué)習(xí)的惡意代碼檢測方法[J];軟件學(xué)報(bào);2017年02期

4 李挺;董航;袁春陽;杜躍進(jìn);徐國愛;;基于Dalvik指令的Android惡意代碼特征描述及驗(yàn)證[J];計(jì)算機(jī)研究與發(fā)展;2014年07期

5 王蕊;蘇璞睿;楊軼;馮登國;;一種抗混淆的惡意代碼變種識(shí)別系統(tǒng)[J];電子學(xué)報(bào);2011年10期

相關(guān)博士學(xué)位論文前1條

1 章程;基于機(jī)器學(xué)習(xí)和程序分析相結(jié)合的程序調(diào)試技術(shù)研究[D];上海交通大學(xué);2013年

，

本文編號(hào)：2550842

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2550842.html

上一篇：復(fù)雜環(huán)境下基于粒子濾波的故障檢測方法研究
下一篇：煤礦災(zāi)害救援雙級(jí)式信息探測機(jī)器人系統(tǒng)研制

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于神經(jīng)網(wǎng)絡(luò)語言模型的代碼分析方法研究