基于SVN日志的軟件過程活動(dòng)實(shí)時(shí)挖掘研究
發(fā)布時(shí)間:2020-06-23 18:15
【摘要】:大數(shù)據(jù)技術(shù)面臨的挑戰(zhàn)是如何將數(shù)據(jù)轉(zhuǎn)換為真正的價(jià)值。目前,大數(shù)據(jù)被過多的關(guān)注數(shù)據(jù)的存儲和處理問題而忽視了過程。過程挖掘技術(shù)在傳統(tǒng)的基于模型的數(shù)據(jù)分析如仿真技術(shù)和業(yè)務(wù)流程管理技術(shù)等和基于數(shù)據(jù)的分析技術(shù)如機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等之間搭建了橋梁,它既關(guān)注了過程,也使用了真實(shí)數(shù)據(jù),它可以用來主動(dòng)學(xué)習(xí)一些人類真實(shí)進(jìn)行的行為性模型。現(xiàn)有的過程挖掘技術(shù)不能直接應(yīng)用在軟件過程挖掘中。為解決軟件過程挖掘工作中過程日志缺少活動(dòng)屬性的問題,提出了一種動(dòng)態(tài)實(shí)時(shí)的軟件過程活動(dòng)挖掘方法。該方法立足事件與活動(dòng)的關(guān)聯(lián)關(guān)系,從軟件過程SVN日志文件中抽取日志事件記錄,并對事件記錄進(jìn)行結(jié)構(gòu)化處理,再通過對向量化的事件信息進(jìn)行聚類來發(fā)現(xiàn)這些事件包含的語義信息,發(fā)現(xiàn)活動(dòng)標(biāo)簽,并依據(jù)該標(biāo)簽構(gòu)造分類器對新的數(shù)據(jù)進(jìn)行活動(dòng)映射,將無監(jiān)督學(xué)習(xí)變?yōu)橛斜O(jiān)督學(xué)習(xí),實(shí)現(xiàn)活動(dòng)屬性的挖掘與映射,最后利用準(zhǔn)確率、召回率以及調(diào)和平均值對映射結(jié)果進(jìn)行評價(jià)。實(shí)驗(yàn)使用真實(shí)的軟件過程日志數(shù)據(jù)集,并對比之前研究提出方法的結(jié)果,最后表明該方法可以進(jìn)行軟件過程日志活動(dòng)挖掘且映射類別的平均準(zhǔn)確率、召回率、調(diào)和平均值(參數(shù)分別取0.5、1、1.5)分別達(dá)到0.85、0.87、0.83、0.84、0.85,證明方法的有效性。本文研究中的創(chuàng)新點(diǎn)主要有如下幾點(diǎn):(1)在軟件過程挖掘中開拓了從關(guān)聯(lián)關(guān)系研究過程挖掘的新思路;(2)解決了軟件過程日志事件缺乏活動(dòng)信息的問題以及對其活動(dòng)進(jìn)行有效的歸類,同時(shí)保證了整個(gè)活動(dòng)挖掘的動(dòng)態(tài)實(shí)時(shí)性;(3)解決聚類數(shù)確定,增加分類器的評價(jià)維度使得評價(jià)結(jié)果更加客觀。
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP311.5;TP181
【圖文】:
傳統(tǒng)事件日志與SVN日志數(shù)據(jù)間結(jié)構(gòu)對比圖
向量化部分結(jié)果展示圖
本文編號:2727713
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:TP311.5;TP181
【圖文】:
傳統(tǒng)事件日志與SVN日志數(shù)據(jù)間結(jié)構(gòu)對比圖
向量化部分結(jié)果展示圖
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 楊麗琴;康國勝;郭立鵬;田朝陽;張亮;張笑楠;高翔;;一種適用于多樣性環(huán)境的業(yè)務(wù)流程挖掘方法[J];軟件學(xué)報(bào);2015年03期
2 王千;王成;馮振元;葉金鳳;;K-means聚類算法研究綜述[J];電子設(shè)計(jì)工程;2012年07期
3 曾慶田;;過程挖掘的研究現(xiàn)狀與問題綜述[J];系統(tǒng)仿真學(xué)報(bào);2007年S1期
4 姜園,張朝陽,仇佩亮,周東方;用于數(shù)據(jù)挖掘的聚類算法[J];電子與信息學(xué)報(bào);2005年04期
5 楊芙清;軟件工程技術(shù)發(fā)展思索[J];軟件學(xué)報(bào);2005年01期
相關(guān)博士學(xué)位論文 前1條
1 朱銳;數(shù)據(jù)驅(qū)動(dòng)的軟件開發(fā)過程挖掘與分析研究[D];云南大學(xué);2016年
相關(guān)碩士學(xué)位論文 前1條
1 袁艷紅;基于Word2Vec語言模型與圖核設(shè)計(jì)的文本分類研究[D];西南大學(xué);2016年
本文編號:2727713
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2727713.html
最近更新
教材專著