基于SVN日志的軟件過程活動實時挖掘研究
發(fā)布時間:2020-06-23 18:15
【摘要】:大數(shù)據(jù)技術(shù)面臨的挑戰(zhàn)是如何將數(shù)據(jù)轉(zhuǎn)換為真正的價值。目前,大數(shù)據(jù)被過多的關(guān)注數(shù)據(jù)的存儲和處理問題而忽視了過程。過程挖掘技術(shù)在傳統(tǒng)的基于模型的數(shù)據(jù)分析如仿真技術(shù)和業(yè)務流程管理技術(shù)等和基于數(shù)據(jù)的分析技術(shù)如機器學習和數(shù)據(jù)挖掘等之間搭建了橋梁,它既關(guān)注了過程,也使用了真實數(shù)據(jù),它可以用來主動學習一些人類真實進行的行為性模型,F(xiàn)有的過程挖掘技術(shù)不能直接應用在軟件過程挖掘中。為解決軟件過程挖掘工作中過程日志缺少活動屬性的問題,提出了一種動態(tài)實時的軟件過程活動挖掘方法。該方法立足事件與活動的關(guān)聯(lián)關(guān)系,從軟件過程SVN日志文件中抽取日志事件記錄,并對事件記錄進行結(jié)構(gòu)化處理,再通過對向量化的事件信息進行聚類來發(fā)現(xiàn)這些事件包含的語義信息,發(fā)現(xiàn)活動標簽,并依據(jù)該標簽構(gòu)造分類器對新的數(shù)據(jù)進行活動映射,將無監(jiān)督學習變?yōu)橛斜O(jiān)督學習,實現(xiàn)活動屬性的挖掘與映射,最后利用準確率、召回率以及調(diào)和平均值對映射結(jié)果進行評價。實驗使用真實的軟件過程日志數(shù)據(jù)集,并對比之前研究提出方法的結(jié)果,最后表明該方法可以進行軟件過程日志活動挖掘且映射類別的平均準確率、召回率、調(diào)和平均值(參數(shù)分別取0.5、1、1.5)分別達到0.85、0.87、0.83、0.84、0.85,證明方法的有效性。本文研究中的創(chuàng)新點主要有如下幾點:(1)在軟件過程挖掘中開拓了從關(guān)聯(lián)關(guān)系研究過程挖掘的新思路;(2)解決了軟件過程日志事件缺乏活動信息的問題以及對其活動進行有效的歸類,同時保證了整個活動挖掘的動態(tài)實時性;(3)解決聚類數(shù)確定,增加分類器的評價維度使得評價結(jié)果更加客觀。
【學位授予單位】:云南大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP311.5;TP181
【圖文】:
傳統(tǒng)事件日志與SVN日志數(shù)據(jù)間結(jié)構(gòu)對比圖
向量化部分結(jié)果展示圖
本文編號:2727713
【學位授予單位】:云南大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP311.5;TP181
【圖文】:
傳統(tǒng)事件日志與SVN日志數(shù)據(jù)間結(jié)構(gòu)對比圖
向量化部分結(jié)果展示圖
【參考文獻】
相關(guān)期刊論文 前5條
1 楊麗琴;康國勝;郭立鵬;田朝陽;張亮;張笑楠;高翔;;一種適用于多樣性環(huán)境的業(yè)務流程挖掘方法[J];軟件學報;2015年03期
2 王千;王成;馮振元;葉金鳳;;K-means聚類算法研究綜述[J];電子設計工程;2012年07期
3 曾慶田;;過程挖掘的研究現(xiàn)狀與問題綜述[J];系統(tǒng)仿真學報;2007年S1期
4 姜園,張朝陽,仇佩亮,周東方;用于數(shù)據(jù)挖掘的聚類算法[J];電子與信息學報;2005年04期
5 楊芙清;軟件工程技術(shù)發(fā)展思索[J];軟件學報;2005年01期
相關(guān)博士學位論文 前1條
1 朱銳;數(shù)據(jù)驅(qū)動的軟件開發(fā)過程挖掘與分析研究[D];云南大學;2016年
相關(guān)碩士學位論文 前1條
1 袁艷紅;基于Word2Vec語言模型與圖核設計的文本分類研究[D];西南大學;2016年
本文編號:2727713
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2727713.html
最近更新
教材專著