天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于門控卷積神經(jīng)網(wǎng)絡的代碼自動摘要算法

發(fā)布時間:2021-09-07 19:02
  隨著互聯(lián)網(wǎng)技術的發(fā)展和開源社區(qū)的興起,開源代碼的數(shù)量急劇增加,從開源社區(qū)中發(fā)掘出有用信息需要耗費大量的時間和精力。自動摘要技術廣泛地應用于文本主要內(nèi)容的獲取,但針對代碼的相關技術研究較少。本文使用深度學習思想解決這一問題,利用卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)模型提取代碼特征,從而緩解信息爆炸帶給人們的時間精力問題。本文對代碼自動摘要問題進行了分析,將問題拆分為代碼特征提取和摘要自動生成兩個子問題,結合深度學習中端到端的模型設計思想,在設計模型時綜合考慮這兩個問題,提出了一種基于深度學習的代碼自動摘要模型。本文首先對代碼特征提取問題進行了研究,本文使用門控卷積神經(jīng)網(wǎng)絡提取代碼的文本特征,在門控卷積神經(jīng)網(wǎng)絡中,對輸入元素添加位置信息以獲取序列中詞的位置,引入門控線性單元使模型可以選擇對預測有益的詞或者特征,利用殘差連接解決梯度彌散問題。本文使用抽象語法樹卷積神經(jīng)網(wǎng)絡提取代碼的結構特征,在抽象語法樹卷積神經(jīng)網(wǎng)絡中,使用Tree-Based CNN和Pre-Order CNN相結合的方式,獲取語法樹中節(jié)點的完整信息。本文其次對摘要自動生成問題進... 

【文章來源】:云南大學云南省 211工程院校

【文章頁數(shù)】:58 頁

【學位級別】:碩士

【部分圖文】:

基于門控卷積神經(jīng)網(wǎng)絡的代碼自動摘要算法


圖2-2:門控卷積神經(jīng)網(wǎng)絡模型結構圖??資料來源:FAIR:《Language?Modeling?with?Gated?Convolutional?Networks》,2016?年

結構圖,改進模型,結構圖,注意力機制


?(2.2)??其中,P為每個詞對應的概率,g為Softmax函數(shù)。??Google團隊[3Q1提出了?Seq2Seq模型的改進模型,其模型結構如圖2-4所示。??W?X?Y?Z?<EOS>??;k?h?“?>?^?A???^?^?^??>????????A?“?i?v?“?“?“?i?[??ABC?<EOS>?W?X?Y?Z??圖2_4:?Seq2Seq改進模型結構圖??資料來源:Google?Brain:《Sequence?to?Sequence?Learning?with?Neural?Networks》,2014?年。??圖2-4為在時間維度上進行展開的模型圖,在未展開的情況下,Encoder端??使用一個神經(jīng)網(wǎng)絡接收輸入序列“AB?CEOS(EOS=EndofSentence,句末標記)”,??在接收過程中,每隔一個時間點接收一個字或者詞,在讀取到EOS時停止輸入,??最后輸出一個向量作為輸入序列的語義表征向量。Decoder端使用第二個神經(jīng)網(wǎng)??絡接收到Encoder端產(chǎn)生的輸出向量后,再輸出對應的語義向量,此時每個時間??點輸出詞的概率都與前一個時間點的輸出相關,最后將輸入序列依次映射為“W??X?Y?Z?EOS”,從而實現(xiàn)語句的翻譯任務。??2.2.2?注意力機制(Attention?Mechanism)??注意力機制(AttentionMechanism)最早被提出是在視覺圖像領域。之后由??于Google?Brain團隊157]在RNN模型的基礎上引入了注意力機制來完成圖像分類??任務

算法,概率分布,概率,組成序列


?0.1??圖2-7:?Beam?Search算法示例圖??以圖2-7為例,K的值為2,?K為集束寬度(Beam?Width)。??首先,在[0.1,0.1,0.3,0.4,0.1]概率分布中挑選出概率最大的兩個數(shù)值:0.3和??0.4,代表的序列分別為Je和moi。??然后,將Je和moi分別作為解碼器端的輸入,獲得兩個概率分布,再從得??到的兩個概率分布中選擇概率和最大的組成序列:0.3+0.8和0.4+0.6,代表的序??列分別為Je?suis和moi?suis。??以此類推,得到最終的兩個序列,分別為Je?suis?dtudiant和moi?suis?dtudiant,??兩者相比,前者的概率和最大,即為最終結果。??2.2.4?雙語互譯質(zhì)量輔助工具算法(BLEU)??在機器翻譯領域當中,需要一個用來衡量機器翻譯結果與人工翻譯結果匹配??度的指標。為了能夠獲取更好的效果

【參考文獻】:
期刊論文
[1]基于結構感知雙編碼器的代碼注釋自動生成[J]. 徐少峰,潘文韜,熊赟,朱揚勇.  計算機工程. 2020(02)
[2]基于改進Sequence-to-Sequence模型的文本摘要生成方法[J]. 周健,田萱,崔曉暉.  計算機工程與應用. 2019(01)
[3]一種改進的基于抽象語法樹的軟件源代碼比對算法[J]. 劉楠,韓麗芳,夏坤峰,曲通.  信息網(wǎng)絡安全. 2014(01)
[4]一個重建GCC抽象語法樹的方法[J]. 劉文偉,劉堅.  計算機工程與應用. 2004(18)

碩士論文
[1]基于抽象語法樹的程序代碼抄襲檢測技術研究[D]. 趙彥博.內(nèi)蒙古師范大學 2010



本文編號:3390085

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3390085.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶9f0c9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产欧美一区二区色综合| 亚洲国产日韩欧美三级| 亚洲最大的中文字幕在线视频| 欧美字幕一区二区三区| 亚洲国产av精品一区二区| 日韩和欧美的一区二区三区| 国产成人精品99在线观看| 国产精品一区二区成人在线| 日韩中文字幕免费在线视频| 日韩一区二区三区18| 久久热中文字幕在线视频| 午夜色午夜视频之日本| 在线欧洲免费无线码二区免费| 风间中文字幕亚洲一区| 在线免费视频你懂的观看| 91亚洲国产成人久久精品麻豆| 区一区二区三中文字幕| 国产综合香蕉五月婷在线| 久久99精品日韩人妻| 国产级别精品一区二区视频| 国产又粗又猛又爽又黄| 99视频精品免费视频| 欧美一区二区三区99| 最新午夜福利视频偷拍| 欧美又大又黄刺激视频| 欧美日韩在线观看自拍| 久久精品久久久精品久久| 色偷偷偷拍视频在线观看| av中文字幕一区二区三区在线| 一区二区三区18禁看| 国产午夜精品亚洲精品国产| 视频在线播放你懂的一区| 加勒比东京热拍拍一区二区| 国产又色又粗又黄又爽| 黄色三级日本在线观看| 加勒比东京热拍拍一区二区| 欧美久久一区二区精品| 亚洲中文字幕剧情在线播放| 日韩精品综合福利在线观看| 日本中文在线不卡视频| 欧美国产日本免费不卡|