軟件工程數據挖掘若干問題應用研究.pdf
本文關鍵詞:軟件工程數據挖掘若干問題研究,,由筆耕文化傳播整理發(fā)布。
餓 軟件工程數據挖掘若干問題研究 of Data SomeIssuesSoftware Mining Engineering 郁抒思 指導教師 周水庚教授
萬方數據 lIIIII I II IIIIII111 11l Y座機電話號碼 摘要 軟件工程數據是軟件工程整個過程中所產生的各種數據,包括軟件的源代碼、文檔、 缺陷報告等。在絕大多數情況下,軟件工程數據是開發(fā)者獲取信息的唯一來源。隨著計 算機軟件規(guī)模的不斷擴大,手工獲取開發(fā)和維護軟件所需的信息越來越困難。數據挖掘 技術可從軟件工程數據中自動發(fā)現所需信息,加快軟件開發(fā)進程,提高軟件質量。本文 針對軟件工程數據挖掘的若干問題進行研究,主要貢獻如下: 1.提出了一種Java源代碼中Method的自動命名方法。軟件源代碼中標識符的正確命名 對軟件維護非常重要,恰當的Method名能夠使開發(fā)者了解Method的功能,而不恰當 的命名則會誤導他們。但是,開發(fā)者除了個人的經驗技術之外,他們在為Method命名 時幾乎無所憑依。本文提出了一種基于文本分類的方法,為Method2選擇恰當的動作 名。實驗表明,本文方法的命名正確率達至1J70%以上。 2.提出了一種程序盜用檢測方法。與軟件業(yè)、特別是開源軟件的蓬勃發(fā)展相比,用以保 護現有軟件免遭軟件盜用者侵害的檢測工具少得可憐。一個不自律的開發(fā)者可以通 過代碼偽裝技術盜用他人的源碼,而又逃脫法律的制裁,F有的基于程序依賴圖的檢 測工具可以檢出若干種專業(yè)的代碼偽裝,但時問效率無法讓人滿意,并且它們無法識 破影響程序依賴圖結構的偽裝。本文提出了一種新的盜用檢測T具TPLAG,它不僅 將代碼盜用檢測的時間復雜度從指數級降到多項式級,而且能成功地識破影響圖結 構的代碼偽裝技術。 3.提出了一種缺陷分派方法。人型軟件的開發(fā)組每天都
本文關鍵詞:軟件工程數據挖掘若干問題研究,由筆耕文化傳播整理發(fā)布。
本文編號:101114
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/101114.html