基于大規(guī)模源碼挖掘的日志語句級別推薦方法
發(fā)布時間:2023-04-11 21:34
記錄日志是軟件開發(fā)過程中一種普遍的代碼實踐,目的是收集軟件系統(tǒng)運(yùn)行時的重要信息,這些信息在軟件系統(tǒng)的跟蹤調(diào)試、缺陷排查、性能優(yōu)化、重要業(yè)務(wù)信息備案等工作中都有不可替代的作用。為此,日志的記錄需要全面地覆蓋必要的運(yùn)行時信息,同時避免引發(fā)額外的問題(如:性能開銷,日志冗余等問題)。為了達(dá)到這樣的目的,一個重要的手段是:在代碼中插入日志語句時,對日志消息進(jìn)行分級管理。然而,能否為日志消息選擇一個恰當(dāng)?shù)募墑e,既取決于軟件開發(fā)者的領(lǐng)域知識、開發(fā)經(jīng)驗等個人能力因素,也受到實際軟件開發(fā)過程中各種客觀條件的影響。對于新手開發(fā)者來說,這項任務(wù)尤其具有挑戰(zhàn)性。為了幫助開發(fā)人員做出更恰當(dāng)?shù)娜罩炯墑e決定,本文提出了一種基于大規(guī)模源碼挖掘的日志語句級別推薦方法。本文基于大量日志代碼實例以及與之相關(guān)的程序上下文特征,研究日志語句級別的選擇,主要貢獻(xiàn)如下:(1)本文使用數(shù)據(jù)挖掘的方法,分析了大量開源軟件倉庫中的實際項目,并獲取到較大數(shù)據(jù)量帶級別標(biāo)注的日志語句實例。同時,本文基于抽象語法樹,對獲取到的日志代碼實例進(jìn)行靜態(tài)程序分析,從項目、文件到代碼語句等多個軟件層次中抽取出日志級別選擇相關(guān)的5類程序上下文特征。這些程...
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究內(nèi)容
1.3 論文結(jié)構(gòu)
第2章 相關(guān)技術(shù)及研究現(xiàn)狀
2.1 關(guān)于日志實踐的經(jīng)驗性研究
2.2 軟件倉庫挖掘
2.3 日志數(shù)據(jù)分析
2.4 日志增強(qiáng)
2.5 相關(guān)工作總結(jié)
第3章 基于大規(guī)模源碼挖掘的日志語句級別推薦方法
3.1 相關(guān)概念及其定義
3.2 方法概述
3.3 日志代碼實例獲取
3.3.1 基于抽象語法樹的靜態(tài)代碼解析
3.3.2 日志代碼級別歸一化
3.3.3 開源軟件倉庫挖掘
3.4 數(shù)據(jù)預(yù)處理
3.4.1 特征抽取
3.4.2 文本特征處理
3.4.3 特征選擇
3.5 機(jī)器學(xué)習(xí)模型訓(xùn)練
3.5.1 數(shù)據(jù)均衡處理
3.5.2 去除噪聲數(shù)據(jù)
3.5.3 隨機(jī)森林分類算法
3.6 相關(guān)工作的對比和分析
3.7 本章小結(jié)
第4章 實驗與分析
4.1 實驗數(shù)據(jù)集介紹
4.2 實驗評估指標(biāo)
4.3 實驗環(huán)境
4.4 實驗過程及結(jié)果
4.4.1 日志代碼數(shù)據(jù)獲取
4.4.2 數(shù)據(jù)預(yù)處理
4.4.3 日志代碼級別推薦
4.4.4 實驗結(jié)果與分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士期間取得的學(xué)術(shù)成果
致謝
本文編號:3789790
【文章頁數(shù)】:63 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究內(nèi)容
1.3 論文結(jié)構(gòu)
第2章 相關(guān)技術(shù)及研究現(xiàn)狀
2.1 關(guān)于日志實踐的經(jīng)驗性研究
2.2 軟件倉庫挖掘
2.3 日志數(shù)據(jù)分析
2.4 日志增強(qiáng)
2.5 相關(guān)工作總結(jié)
第3章 基于大規(guī)模源碼挖掘的日志語句級別推薦方法
3.1 相關(guān)概念及其定義
3.2 方法概述
3.3 日志代碼實例獲取
3.3.1 基于抽象語法樹的靜態(tài)代碼解析
3.3.2 日志代碼級別歸一化
3.3.3 開源軟件倉庫挖掘
3.4 數(shù)據(jù)預(yù)處理
3.4.1 特征抽取
3.4.2 文本特征處理
3.4.3 特征選擇
3.5 機(jī)器學(xué)習(xí)模型訓(xùn)練
3.5.1 數(shù)據(jù)均衡處理
3.5.2 去除噪聲數(shù)據(jù)
3.5.3 隨機(jī)森林分類算法
3.6 相關(guān)工作的對比和分析
3.7 本章小結(jié)
第4章 實驗與分析
4.1 實驗數(shù)據(jù)集介紹
4.2 實驗評估指標(biāo)
4.3 實驗環(huán)境
4.4 實驗過程及結(jié)果
4.4.1 日志代碼數(shù)據(jù)獲取
4.4.2 數(shù)據(jù)預(yù)處理
4.4.3 日志代碼級別推薦
4.4.4 實驗結(jié)果與分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士期間取得的學(xué)術(shù)成果
致謝
本文編號:3789790
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3789790.html
最近更新
教材專著