基于特征重要度的缺陷報(bào)告推薦方法研究
發(fā)布時(shí)間:2021-05-08 06:17
由于開(kāi)源軟件的研發(fā)與維護(hù)采用自愿參與、分散組織方式,相對(duì)于商業(yè)軟件,開(kāi)源軟件缺陷分派存在更多的不確定性、往往具有更長(zhǎng)的缺陷修復(fù)過(guò)程。一些像Mozilla、Eclipse等具有廣泛用戶的大型開(kāi)源軟件,隨著版本迭代升級(jí),功能日趨復(fù)雜,每天都產(chǎn)生大量的缺陷報(bào)告。而由于缺陷提交者水平、經(jīng)驗(yàn)參差不齊,存在大量低質(zhì)量、重復(fù)甚至無(wú)效的缺陷報(bào)告,這些報(bào)告直接影響到整個(gè)缺陷分派與修復(fù)的效率;另一方面,缺陷需要大量的結(jié)構(gòu)化、半結(jié)構(gòu)化信息描述,哪些信息需要重點(diǎn)闡述?哪些信息可以簡(jiǎn)略描述?明確這些問(wèn)題,不僅能夠有效指導(dǎo)提交者提交高質(zhì)量缺陷報(bào)告,也將輔助于缺陷分派者和修復(fù)者能夠快速聚焦缺陷關(guān)鍵特征,形成缺陷有效性準(zhǔn)確判定和難易程度準(zhǔn)確預(yù)測(cè),直接和間接提升缺陷分派的效率。傳統(tǒng)的缺陷分派推薦多是基于缺陷的文本特征,采用各類機(jī)器學(xué)習(xí)方法進(jìn)行的,但預(yù)測(cè)的準(zhǔn)確率一直較低。本文綜合考慮缺陷的各類特征,分析不同類特征的重要性,設(shè)計(jì)一種既可以完成相應(yīng)的缺陷預(yù)測(cè)的又同時(shí)實(shí)現(xiàn)了特征重要度度量的深度學(xué)習(xí)模型,并在此基礎(chǔ)上設(shè)計(jì)融合特征權(quán)重的相似度度量方法,并改進(jìn)歷史缺陷分派傳遞圖(Tossing Graph)對(duì)推薦列表進(jìn)行優(yōu)化,提升缺...
【文章來(lái)源】:青島科技大學(xué)山東省
【文章頁(yè)數(shù)】:94 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 課題研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 基于文本的分類推薦
1.2.2 非文本分類推薦
1.2.3 基于傳遞圖的推薦方法
1.3 論文研究?jī)?nèi)容及創(chuàng)新點(diǎn)
1.4 論文組織結(jié)構(gòu)
2 相關(guān)概念和方法
2.1 缺陷以及缺陷報(bào)告
2.1.1 開(kāi)源軟件缺陷
2.1.2 缺陷報(bào)告
2.1.3 缺陷報(bào)告狀態(tài)
2.1.4 缺陷報(bào)告生命周期
2.2 相關(guān)方法
2.2.1 文本向量化方法
2.2.2 分類方法
2.3 本章小結(jié)
3 數(shù)據(jù)爬取與數(shù)據(jù)統(tǒng)計(jì)分析
3.1 缺陷報(bào)告庫(kù)
3.2 缺陷報(bào)告爬取方法
3.2.1 爬取入口
3.2.2 爬取方法
3.3 缺陷報(bào)告數(shù)據(jù)統(tǒng)計(jì)分析
3.4 本章小結(jié)
4 缺陷報(bào)告特征權(quán)重的度量方法
4.1 缺陷報(bào)告特征提取
4.1.1 發(fā)布者經(jīng)驗(yàn)
4.1.2 完整性
4.1.3 可讀性
4.1.4 社交網(wǎng)絡(luò)
4.1.5 文本
4.2 方法與模型
4.2.1 Field Attention缺陷報(bào)告預(yù)測(cè)模型
4.2.2 Field Attention特征權(quán)重方法
4.2.3 維度內(nèi)單獨(dú)特征重要度方法
4.2.4 維度間與維度內(nèi)的特征權(quán)值融合
4.3 實(shí)驗(yàn)數(shù)據(jù)和評(píng)價(jià)標(biāo)準(zhǔn)
4.3.1 實(shí)驗(yàn)數(shù)據(jù)
4.3.2 評(píng)價(jià)指標(biāo)
4.4 實(shí)驗(yàn)及結(jié)果分析
4.4.1 實(shí)驗(yàn)方法
4.4.2 有效性重要度權(quán)重度量實(shí)驗(yàn)及分析
4.4.3 修復(fù)快慢重要度權(quán)重度量實(shí)驗(yàn)及分析
4.4.4 維度內(nèi)特征重要度實(shí)驗(yàn)及分析
4.5 本章小結(jié)
5 基于特征重要度的缺陷報(bào)告推薦方法
5.1 方法模型
5.1.1 基于特征重要度權(quán)重相似度計(jì)算方法
5.1.2 傳統(tǒng)Tossing Graph
5.1.3 Tossing Assign
5.2 實(shí)驗(yàn)設(shè)計(jì)
5.2.1 數(shù)據(jù)準(zhǔn)備
5.2.2 實(shí)驗(yàn)方法
5.2.3 評(píng)價(jià)指標(biāo)
5.3 實(shí)驗(yàn)結(jié)果
5.3.1 與機(jī)器學(xué)習(xí)推薦方法對(duì)比
5.3.2 與不加入重要度權(quán)值和Tossing Graph的方法對(duì)比
5.4 結(jié)果分析
5.5 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
本文編號(hào):3174833
【文章來(lái)源】:青島科技大學(xué)山東省
【文章頁(yè)數(shù)】:94 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 課題研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 基于文本的分類推薦
1.2.2 非文本分類推薦
1.2.3 基于傳遞圖的推薦方法
1.3 論文研究?jī)?nèi)容及創(chuàng)新點(diǎn)
1.4 論文組織結(jié)構(gòu)
2 相關(guān)概念和方法
2.1 缺陷以及缺陷報(bào)告
2.1.1 開(kāi)源軟件缺陷
2.1.2 缺陷報(bào)告
2.1.3 缺陷報(bào)告狀態(tài)
2.1.4 缺陷報(bào)告生命周期
2.2 相關(guān)方法
2.2.1 文本向量化方法
2.2.2 分類方法
2.3 本章小結(jié)
3 數(shù)據(jù)爬取與數(shù)據(jù)統(tǒng)計(jì)分析
3.1 缺陷報(bào)告庫(kù)
3.2 缺陷報(bào)告爬取方法
3.2.1 爬取入口
3.2.2 爬取方法
3.3 缺陷報(bào)告數(shù)據(jù)統(tǒng)計(jì)分析
3.4 本章小結(jié)
4 缺陷報(bào)告特征權(quán)重的度量方法
4.1 缺陷報(bào)告特征提取
4.1.1 發(fā)布者經(jīng)驗(yàn)
4.1.2 完整性
4.1.3 可讀性
4.1.4 社交網(wǎng)絡(luò)
4.1.5 文本
4.2 方法與模型
4.2.1 Field Attention缺陷報(bào)告預(yù)測(cè)模型
4.2.2 Field Attention特征權(quán)重方法
4.2.3 維度內(nèi)單獨(dú)特征重要度方法
4.2.4 維度間與維度內(nèi)的特征權(quán)值融合
4.3 實(shí)驗(yàn)數(shù)據(jù)和評(píng)價(jià)標(biāo)準(zhǔn)
4.3.1 實(shí)驗(yàn)數(shù)據(jù)
4.3.2 評(píng)價(jià)指標(biāo)
4.4 實(shí)驗(yàn)及結(jié)果分析
4.4.1 實(shí)驗(yàn)方法
4.4.2 有效性重要度權(quán)重度量實(shí)驗(yàn)及分析
4.4.3 修復(fù)快慢重要度權(quán)重度量實(shí)驗(yàn)及分析
4.4.4 維度內(nèi)特征重要度實(shí)驗(yàn)及分析
4.5 本章小結(jié)
5 基于特征重要度的缺陷報(bào)告推薦方法
5.1 方法模型
5.1.1 基于特征重要度權(quán)重相似度計(jì)算方法
5.1.2 傳統(tǒng)Tossing Graph
5.1.3 Tossing Assign
5.2 實(shí)驗(yàn)設(shè)計(jì)
5.2.1 數(shù)據(jù)準(zhǔn)備
5.2.2 實(shí)驗(yàn)方法
5.2.3 評(píng)價(jià)指標(biāo)
5.3 實(shí)驗(yàn)結(jié)果
5.3.1 與機(jī)器學(xué)習(xí)推薦方法對(duì)比
5.3.2 與不加入重要度權(quán)值和Tossing Graph的方法對(duì)比
5.4 結(jié)果分析
5.5 本章小結(jié)
總結(jié)與展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄
本文編號(hào):3174833
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3174833.html
最近更新
教材專著