一種基于文本、分類信息融合的重復(fù)缺陷報(bào)告檢測(cè)方法
發(fā)布時(shí)間:2022-10-29 12:44
用戶和測(cè)試人員所提交的缺陷報(bào)告是發(fā)現(xiàn)軟件缺陷的重要途經(jīng)之一。缺陷報(bào)告是描述缺陷的載體,開發(fā)人員對(duì)缺陷報(bào)告描述問(wèn)題的修復(fù)是完善軟件的必要手段。不同用戶和測(cè)試人員針對(duì)同一缺陷提交報(bào)告,導(dǎo)致缺陷報(bào)告庫(kù)有大量重復(fù)的缺陷報(bào)告。隨著軟件規(guī)模和復(fù)雜度的日益增大,針對(duì)重復(fù)報(bào)告的手動(dòng)分診已無(wú)法適應(yīng)越來(lái)越復(fù)雜的軟件系統(tǒng)。重復(fù)缺陷報(bào)告檢測(cè)研究旨在過(guò)濾缺陷報(bào)告庫(kù)中的重復(fù)部分,有效提高軟件維護(hù)活動(dòng)的執(zhí)行效率,是軟件維護(hù)領(lǐng)域的研究熱點(diǎn)。當(dāng)前重復(fù)缺陷報(bào)告檢測(cè)的準(zhǔn)確率還有很大的提升空間,尚無(wú)法滿足業(yè)界對(duì)重復(fù)缺陷報(bào)告預(yù)測(cè)的期望。提高預(yù)測(cè)精度的難點(diǎn)在于尋找一個(gè)合適且全面的方法衡量缺陷報(bào)告之間的相似性。借鑒數(shù)據(jù)融合方法,本文提出了一種基于文本信息、分類信息融合的重復(fù)缺陷報(bào)告檢測(cè)方法CBLO(Combinationof BM25F、LSI and One-Hot)。本方法包括4個(gè)步驟:1.數(shù)據(jù)預(yù)處理,提取重復(fù)缺陷報(bào)告的文本信息與分類信息。2.使用BM25F與LSI算法對(duì)文本信息進(jìn)行數(shù)值化處理,給出文本信息相似性測(cè)度。3.使用One-Hot算法對(duì)分類信息進(jìn)行數(shù)值化處理,給出分類信息相似性測(cè)度。4.基于相似性融合方法,實(shí)現(xiàn)文本信...
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 論文的主要工作及創(chuàng)新
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)研究基礎(chǔ)
2.1 軟件缺陷報(bào)告
2.1.1 缺陷報(bào)告管理流程
2.1.2 缺陷報(bào)告結(jié)構(gòu)
2.2 TF-IDF方法
2.3 潛語(yǔ)義索引LSI方法
2.4 空間向量
2.4.1 One-Hot空間向量生成
2.4.2 空間向量相似性測(cè)度
2.5 信息檢索評(píng)價(jià)指標(biāo)MRR
2.6 本章小結(jié)
第三章 本文CBLO方法
3.1 數(shù)據(jù)預(yù)處理
3.2 相似性計(jì)算
3.2.1 文本信息相似性計(jì)算
3.2.2 分類信息相似性計(jì)算
3.3 相似性融合
3.4 CBLO方法流程
3.5 本章小結(jié)
第四章 實(shí)驗(yàn)與結(jié)果分析
4.1 數(shù)據(jù)集及評(píng)價(jià)指標(biāo)
4.1.1 數(shù)據(jù)集
4.1.2 評(píng)價(jià)指標(biāo)
4.2 基線方法
4.3 實(shí)驗(yàn)設(shè)計(jì)
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 實(shí)驗(yàn)結(jié)果
4.4.2 結(jié)果分析
4.5 存在的局限與不足
4.6 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于卷積網(wǎng)絡(luò)的句子語(yǔ)義相似性模型[J]. 黃江平,姬東鴻. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(03)
[2]奇異值分解定理的幾何意義[J]. 姜芳,曹榮美. 科技創(chuàng)新導(dǎo)報(bào). 2013(04)
[3]自動(dòng)分析軟件缺陷報(bào)告間相關(guān)性的方法研究[J]. 李楠,王曉博,劉超. 計(jì)算機(jī)應(yīng)用研究. 2010(06)
[4]軟件缺陷報(bào)告[J]. 李丹. 電子質(zhì)量. 2003(07)
博士論文
[1]軟件缺陷報(bào)告管理關(guān)鍵技術(shù)研究[D]. 喻維.華南理工大學(xué) 2018
碩士論文
[1]基于缺陷報(bào)告和源代碼的相似缺陷識(shí)別方法[D]. 董美含.哈爾濱工業(yè)大學(xué) 2018
[2]自動(dòng)重復(fù)缺陷報(bào)告檢測(cè)方法研究[D]. 王彬.華東師范大學(xué) 2016
[3]基于LDA模型的重復(fù)缺陷報(bào)告檢測(cè)的研究[D]. 蔣欣志.重慶大學(xué) 2013
[4]軟件缺陷自動(dòng)分派研究[D]. 黃小亮.復(fù)旦大學(xué) 2011
本文編號(hào):3697709
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 論文的主要工作及創(chuàng)新
1.4 論文組織結(jié)構(gòu)
第二章 相關(guān)研究基礎(chǔ)
2.1 軟件缺陷報(bào)告
2.1.1 缺陷報(bào)告管理流程
2.1.2 缺陷報(bào)告結(jié)構(gòu)
2.2 TF-IDF方法
2.3 潛語(yǔ)義索引LSI方法
2.4 空間向量
2.4.1 One-Hot空間向量生成
2.4.2 空間向量相似性測(cè)度
2.5 信息檢索評(píng)價(jià)指標(biāo)MRR
2.6 本章小結(jié)
第三章 本文CBLO方法
3.1 數(shù)據(jù)預(yù)處理
3.2 相似性計(jì)算
3.2.1 文本信息相似性計(jì)算
3.2.2 分類信息相似性計(jì)算
3.3 相似性融合
3.4 CBLO方法流程
3.5 本章小結(jié)
第四章 實(shí)驗(yàn)與結(jié)果分析
4.1 數(shù)據(jù)集及評(píng)價(jià)指標(biāo)
4.1.1 數(shù)據(jù)集
4.1.2 評(píng)價(jià)指標(biāo)
4.2 基線方法
4.3 實(shí)驗(yàn)設(shè)計(jì)
4.4 實(shí)驗(yàn)結(jié)果與分析
4.4.1 實(shí)驗(yàn)結(jié)果
4.4.2 結(jié)果分析
4.5 存在的局限與不足
4.6 本章小結(jié)
第五章 總結(jié)與展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的科研成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于卷積網(wǎng)絡(luò)的句子語(yǔ)義相似性模型[J]. 黃江平,姬東鴻. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(03)
[2]奇異值分解定理的幾何意義[J]. 姜芳,曹榮美. 科技創(chuàng)新導(dǎo)報(bào). 2013(04)
[3]自動(dòng)分析軟件缺陷報(bào)告間相關(guān)性的方法研究[J]. 李楠,王曉博,劉超. 計(jì)算機(jī)應(yīng)用研究. 2010(06)
[4]軟件缺陷報(bào)告[J]. 李丹. 電子質(zhì)量. 2003(07)
博士論文
[1]軟件缺陷報(bào)告管理關(guān)鍵技術(shù)研究[D]. 喻維.華南理工大學(xué) 2018
碩士論文
[1]基于缺陷報(bào)告和源代碼的相似缺陷識(shí)別方法[D]. 董美含.哈爾濱工業(yè)大學(xué) 2018
[2]自動(dòng)重復(fù)缺陷報(bào)告檢測(cè)方法研究[D]. 王彬.華東師范大學(xué) 2016
[3]基于LDA模型的重復(fù)缺陷報(bào)告檢測(cè)的研究[D]. 蔣欣志.重慶大學(xué) 2013
[4]軟件缺陷自動(dòng)分派研究[D]. 黃小亮.復(fù)旦大學(xué) 2011
本文編號(hào):3697709
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3697709.html
最近更新
教材專著