基于大規(guī)模源碼挖掘的日志語(yǔ)句級(jí)別推薦方法
發(fā)布時(shí)間:2023-04-11 21:34
記錄日志是軟件開(kāi)發(fā)過(guò)程中一種普遍的代碼實(shí)踐,目的是收集軟件系統(tǒng)運(yùn)行時(shí)的重要信息,這些信息在軟件系統(tǒng)的跟蹤調(diào)試、缺陷排查、性能優(yōu)化、重要業(yè)務(wù)信息備案等工作中都有不可替代的作用。為此,日志的記錄需要全面地覆蓋必要的運(yùn)行時(shí)信息,同時(shí)避免引發(fā)額外的問(wèn)題(如:性能開(kāi)銷(xiāo),日志冗余等問(wèn)題)。為了達(dá)到這樣的目的,一個(gè)重要的手段是:在代碼中插入日志語(yǔ)句時(shí),對(duì)日志消息進(jìn)行分級(jí)管理。然而,能否為日志消息選擇一個(gè)恰當(dāng)?shù)募?jí)別,既取決于軟件開(kāi)發(fā)者的領(lǐng)域知識(shí)、開(kāi)發(fā)經(jīng)驗(yàn)等個(gè)人能力因素,也受到實(shí)際軟件開(kāi)發(fā)過(guò)程中各種客觀條件的影響。對(duì)于新手開(kāi)發(fā)者來(lái)說(shuō),這項(xiàng)任務(wù)尤其具有挑戰(zhàn)性。為了幫助開(kāi)發(fā)人員做出更恰當(dāng)?shù)娜罩炯?jí)別決定,本文提出了一種基于大規(guī)模源碼挖掘的日志語(yǔ)句級(jí)別推薦方法。本文基于大量日志代碼實(shí)例以及與之相關(guān)的程序上下文特征,研究日志語(yǔ)句級(jí)別的選擇,主要貢獻(xiàn)如下:(1)本文使用數(shù)據(jù)挖掘的方法,分析了大量開(kāi)源軟件倉(cāng)庫(kù)中的實(shí)際項(xiàng)目,并獲取到較大數(shù)據(jù)量帶級(jí)別標(biāo)注的日志語(yǔ)句實(shí)例。同時(shí),本文基于抽象語(yǔ)法樹(shù),對(duì)獲取到的日志代碼實(shí)例進(jìn)行靜態(tài)程序分析,從項(xiàng)目、文件到代碼語(yǔ)句等多個(gè)軟件層次中抽取出日志級(jí)別選擇相關(guān)的5類(lèi)程序上下文特征。這些程...
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究?jī)?nèi)容
1.3 論文結(jié)構(gòu)
第2章 相關(guān)技術(shù)及研究現(xiàn)狀
2.1 關(guān)于日志實(shí)踐的經(jīng)驗(yàn)性研究
2.2 軟件倉(cāng)庫(kù)挖掘
2.3 日志數(shù)據(jù)分析
2.4 日志增強(qiáng)
2.5 相關(guān)工作總結(jié)
第3章 基于大規(guī)模源碼挖掘的日志語(yǔ)句級(jí)別推薦方法
3.1 相關(guān)概念及其定義
3.2 方法概述
3.3 日志代碼實(shí)例獲取
3.3.1 基于抽象語(yǔ)法樹(shù)的靜態(tài)代碼解析
3.3.2 日志代碼級(jí)別歸一化
3.3.3 開(kāi)源軟件倉(cāng)庫(kù)挖掘
3.4 數(shù)據(jù)預(yù)處理
3.4.1 特征抽取
3.4.2 文本特征處理
3.4.3 特征選擇
3.5 機(jī)器學(xué)習(xí)模型訓(xùn)練
3.5.1 數(shù)據(jù)均衡處理
3.5.2 去除噪聲數(shù)據(jù)
3.5.3 隨機(jī)森林分類(lèi)算法
3.6 相關(guān)工作的對(duì)比和分析
3.7 本章小結(jié)
第4章 實(shí)驗(yàn)與分析
4.1 實(shí)驗(yàn)數(shù)據(jù)集介紹
4.2 實(shí)驗(yàn)評(píng)估指標(biāo)
4.3 實(shí)驗(yàn)環(huán)境
4.4 實(shí)驗(yàn)過(guò)程及結(jié)果
4.4.1 日志代碼數(shù)據(jù)獲取
4.4.2 數(shù)據(jù)預(yù)處理
4.4.3 日志代碼級(jí)別推薦
4.4.4 實(shí)驗(yàn)結(jié)果與分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士期間取得的學(xué)術(shù)成果
致謝
本文編號(hào):3789790
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究?jī)?nèi)容
1.3 論文結(jié)構(gòu)
第2章 相關(guān)技術(shù)及研究現(xiàn)狀
2.1 關(guān)于日志實(shí)踐的經(jīng)驗(yàn)性研究
2.2 軟件倉(cāng)庫(kù)挖掘
2.3 日志數(shù)據(jù)分析
2.4 日志增強(qiáng)
2.5 相關(guān)工作總結(jié)
第3章 基于大規(guī)模源碼挖掘的日志語(yǔ)句級(jí)別推薦方法
3.1 相關(guān)概念及其定義
3.2 方法概述
3.3 日志代碼實(shí)例獲取
3.3.1 基于抽象語(yǔ)法樹(shù)的靜態(tài)代碼解析
3.3.2 日志代碼級(jí)別歸一化
3.3.3 開(kāi)源軟件倉(cāng)庫(kù)挖掘
3.4 數(shù)據(jù)預(yù)處理
3.4.1 特征抽取
3.4.2 文本特征處理
3.4.3 特征選擇
3.5 機(jī)器學(xué)習(xí)模型訓(xùn)練
3.5.1 數(shù)據(jù)均衡處理
3.5.2 去除噪聲數(shù)據(jù)
3.5.3 隨機(jī)森林分類(lèi)算法
3.6 相關(guān)工作的對(duì)比和分析
3.7 本章小結(jié)
第4章 實(shí)驗(yàn)與分析
4.1 實(shí)驗(yàn)數(shù)據(jù)集介紹
4.2 實(shí)驗(yàn)評(píng)估指標(biāo)
4.3 實(shí)驗(yàn)環(huán)境
4.4 實(shí)驗(yàn)過(guò)程及結(jié)果
4.4.1 日志代碼數(shù)據(jù)獲取
4.4.2 數(shù)據(jù)預(yù)處理
4.4.3 日志代碼級(jí)別推薦
4.4.4 實(shí)驗(yàn)結(jié)果與分析
4.5 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士期間取得的學(xué)術(shù)成果
致謝
本文編號(hào):3789790
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3789790.html
最近更新
教材專(zhuān)著