天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

程序代碼相似性度量方法研究

發(fā)布時(shí)間:2017-08-31 18:12

  本文關(guān)鍵詞:程序代碼相似性度量方法研究


  更多相關(guān)文章: 相似性度量 GST算法 token特征串 抽象語(yǔ)法樹(shù) 抄襲檢測(cè)


【摘要】:計(jì)算機(jī)信息技術(shù)的飛速發(fā)展,使得資源的獲取和使用也變得更加的快捷方便。但與此同時(shí),信息資源之間的抄襲也變得越來(lái)越簡(jiǎn)單和難以防范。例如在計(jì)算機(jī)的程序設(shè)計(jì)類(lèi)課程中,進(jìn)行程序作業(yè)完成提交及在線測(cè)試時(shí),學(xué)生之間進(jìn)行彼此抄襲的現(xiàn)象非常的普遍。這種現(xiàn)象嚴(yán)重影響了教學(xué)質(zhì)量、制約了學(xué)生素質(zhì)的提高發(fā)展,更加無(wú)法確?己说墓焦浴4送,在軟件商業(yè)領(lǐng)域中,軟件產(chǎn)品發(fā)生版權(quán)爭(zhēng)端的事件也時(shí)有發(fā)生。對(duì)程序代碼相似性度量方法及其應(yīng)用的進(jìn)一步深入高效研究,將在很大程度上扼制在程序設(shè)計(jì)類(lèi)課程中存在的普遍的抄襲現(xiàn)象,加大對(duì)軟件商業(yè)領(lǐng)域中軟件產(chǎn)品的知識(shí)產(chǎn)權(quán)保護(hù)力度。本文分析了目前國(guó)內(nèi)外在程序相似性度量領(lǐng)域的相關(guān)研究,對(duì)常用的相似性度量檢測(cè)方法做了綜合的對(duì)比分析。并在此基礎(chǔ)上對(duì)程序代碼相似性度量方法進(jìn)行了以下的相關(guān)研究。首先,對(duì)于傳統(tǒng)字符串匹配算法GST算法在進(jìn)行串匹配時(shí)需要逐個(gè)比較串的每個(gè)字符、造成時(shí)問(wèn)復(fù)雜度相對(duì)較大的問(wèn)題,提出了一種基于Java多線程并行匹配的設(shè)計(jì)方式,以此對(duì)GST算法的匹配過(guò)程進(jìn)行了改進(jìn),有效的提高了算法進(jìn)行匹配檢測(cè)的時(shí)間效率;然后,針對(duì)GST算法時(shí)間復(fù)雜度和參加檢測(cè)匹配的字符串長(zhǎng)度成正比的特點(diǎn),對(duì)能夠代表程序語(yǔ)義結(jié)構(gòu)的token序列,提出一種設(shè)計(jì)思想:在對(duì)其語(yǔ)義沒(méi)有影響的條件下對(duì)其長(zhǎng)度進(jìn)行縮短,可以進(jìn)一步降低匹配的時(shí)間復(fù)雜度;最后,針對(duì)利用工具生成抽象語(yǔ)法樹(shù)時(shí)會(huì)包含大量的冗余信息,容易造成資源的極大浪費(fèi)的問(wèn)題,設(shè)計(jì)并實(shí)現(xiàn)了一種構(gòu)造抽象語(yǔ)法樹(shù)的算法,該算法通過(guò)先創(chuàng)建父節(jié)點(diǎn)后創(chuàng)建子節(jié)點(diǎn),再將其關(guān)聯(lián)的方式,將程序中類(lèi)、方法等體現(xiàn)程序語(yǔ)義結(jié)構(gòu)的有用信息進(jìn)行抽象語(yǔ)法樹(shù)的構(gòu)造,并且設(shè)計(jì)了類(lèi)信息表和方法信息表進(jìn)行數(shù)據(jù)的存儲(chǔ)和更新,方便數(shù)據(jù)的使用。通過(guò)抽象語(yǔ)法樹(shù)的算法設(shè)計(jì),在構(gòu)造生成語(yǔ)法樹(shù)后,可以遍歷解析語(yǔ)法樹(shù)使其生成能夠表示程序語(yǔ)義結(jié)構(gòu)的token序列串,再結(jié)合改進(jìn)的字符串匹配算法GST進(jìn)行相似度的計(jì)算,得到最終的相似性度量分析結(jié)果。根據(jù)上述的方法理論,本文設(shè)計(jì)并且實(shí)現(xiàn)了一個(gè)基于Java語(yǔ)言的程序代碼相似度檢測(cè)系統(tǒng),該系統(tǒng)可以計(jì)算源程序?qū)χg的相似度。在同等測(cè)試程序集和程序?qū)Φ幕A(chǔ)上和Moss系統(tǒng)的抄襲檢測(cè)結(jié)果進(jìn)行了對(duì)比分析。實(shí)驗(yàn)結(jié)果表明,本文的研究?jī)?nèi)容,可以有效的檢測(cè)出大部分抄襲手段,并且具有較高的檢測(cè)時(shí)問(wèn)效率。在代碼檢測(cè)的精度和準(zhǔn)確度方面都具有較高的可靠性。
【關(guān)鍵詞】:相似性度量 GST算法 token特征串 抽象語(yǔ)法樹(shù) 抄襲檢測(cè)
【學(xué)位授予單位】:長(zhǎng)春工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP311.1
【目錄】:
  • 摘要2-3
  • Abstract3-7
  • 第一章 緒論7-11
  • 1.1 研究背景及意義7
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀及其分析7-9
  • 1.2.1 國(guó)外研究現(xiàn)狀7-8
  • 1.2.2 國(guó)內(nèi)研究現(xiàn)狀8-9
  • 1.2.3 研究現(xiàn)狀分析及發(fā)展趨勢(shì)9
  • 1.3 本文的主要工作9-10
  • 1.4 本文的組織結(jié)構(gòu)10-11
  • 第二章 程序代碼抄襲檢測(cè)研究概述11-18
  • 2.1 代碼抄襲種類(lèi)描述11-12
  • 2.2 相似性度量相關(guān)概念12-13
  • 2.2.1 相似度定義12-13
  • 2.2.2 抄襲檢測(cè)概念13
  • 2.3 相似性度量技術(shù)概述13-15
  • 2.3.1 屬性計(jì)數(shù)法14
  • 2.3.2 結(jié)構(gòu)度量法14-15
  • 2.3.3 其他方法15
  • 2.4 現(xiàn)有的相似度檢測(cè)系統(tǒng)15-17
  • 2.4.1 Plague系統(tǒng)15-16
  • 2.4.2 MOSS系統(tǒng)16
  • 2.4.3 SIM系統(tǒng)16-17
  • 2.4.4 JPlag系統(tǒng)17
  • 2.5 本章小結(jié)17-18
  • 第三章 字符串匹配算法比較和改進(jìn)研究18-28
  • 3.1 基本概念18
  • 3.2 Knuth-Morris-Pratt算法18-19
  • 3.3 Longest Common Subsequence算法19-20
  • 3.4 動(dòng)態(tài)程序設(shè)計(jì)20-21
  • 3.5 Rabin-Karp算法21
  • 3.6 Greedy String Tiling算法21-23
  • 3.7 對(duì)GST算法的改進(jìn)23-27
  • 3.8 本章小結(jié)27-28
  • 第四章 基于抽象語(yǔ)法樹(shù)的程序代碼抄襲檢測(cè)28-39
  • 4.1 抽象語(yǔ)法樹(shù)概述28-29
  • 4.1.1 抽象語(yǔ)法樹(shù)28
  • 4.1.2 本文研究抄襲檢測(cè)流程28-29
  • 4.2 代碼預(yù)處理29-30
  • 4.3 生成抽象語(yǔ)法樹(shù)30-37
  • 4.3.1 算法描述30-31
  • 4.3.2 算法實(shí)現(xiàn)結(jié)果31-34
  • 4.3.3 數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)描述34
  • 4.3.4 AST算法及存儲(chǔ)結(jié)構(gòu)分析34-37
  • 4.4 相似性度量37-38
  • 4.5 本章小結(jié)38-39
  • 第五章 相似度檢測(cè)的實(shí)驗(yàn)與結(jié)果分析39-47
  • 5.1 實(shí)驗(yàn)環(huán)境和實(shí)驗(yàn)數(shù)據(jù)39-40
  • 5.1.1 實(shí)驗(yàn)環(huán)境39
  • 5.1.2 實(shí)驗(yàn)數(shù)據(jù)39-40
  • 5.2 實(shí)驗(yàn)結(jié)果分析40-46
  • 5.2.1 源程序與待檢測(cè)程序檢測(cè)結(jié)果分析40-43
  • 5.2.2 測(cè)試集任意兩程序匹配檢測(cè)結(jié)果分析43-46
  • 5.2.3 實(shí)驗(yàn)數(shù)據(jù)說(shuō)明46
  • 5.3 本章小結(jié)46-47
  • 第六章 總結(jié)與展望47-48
  • 6.1 總結(jié)47
  • 6.2 展望47-48
  • 致謝48-49
  • 參考文獻(xiàn)49-52
  • 作者簡(jiǎn)介52
  • 攻讀碩士學(xué)位期間研究成果52-53

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前6條

1 趙長(zhǎng)海;晏海華;金茂忠;;基于編譯優(yōu)化和反匯編的程序相似性檢測(cè)方法[J];北京航空航天大學(xué)學(xué)報(bào);2008年06期

2 張鵬;王國(guó)胤;陶春梅;羅海;;基于本體粗糙集的程序代碼相似度度量方法[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年06期

3 于海英;;字符串相似度度量中LCS和GST算法比較[J];電子科技;2011年03期

4 熊浩;晏海華;赫建營(yíng);趙長(zhǎng)海;;一種基于靜態(tài)詞法樹(shù)的程序相似性檢測(cè)方法[J];計(jì)算機(jī)應(yīng)用研究;2009年04期

5 張麗萍;劉東升;李彥臣;鐘美;;一種基于AST的代碼抄襲檢測(cè)方法[J];計(jì)算機(jī)應(yīng)用研究;2011年12期

6 張文典,任冬偉;程序抄襲判定系統(tǒng)[J];小型微型計(jì)算機(jī)系統(tǒng);1988年10期

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條

1 王繼遠(yuǎn);一種用于軟件作業(yè)評(píng)判系統(tǒng)的程序結(jié)構(gòu)分析算法的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2007年

2 侯敏;程序代碼復(fù)制檢測(cè)中特征串提取技術(shù)研究[D];內(nèi)蒙古師范大學(xué);2009年

3 趙彥博;基于抽象語(yǔ)法樹(shù)的程序代碼抄襲檢測(cè)技術(shù)研究[D];內(nèi)蒙古師范大學(xué);2010年

4 胡正軍;程序代碼相似度檢測(cè)方法研究及應(yīng)用[D];中南大學(xué);2012年



本文編號(hào):767117

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/falvlunwen/zhishichanquanfa/767117.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)59bbb***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com