基于過程挖掘的未來感知預(yù)測(cè)模型
發(fā)布時(shí)間:2020-08-15 09:45
【摘要】:將事件日志中蘊(yùn)含的過程模型看成兩緊鄰活動(dòng)的組合,提出兩種新的過程模型。首先,利用日志信息中的活動(dòng)緊鄰關(guān)系構(gòu)造鄰接矩陣提取過程模型,該模型中每個(gè)活動(dòng)僅發(fā)生一次;其次,為避免過程模型中出現(xiàn)回路或者環(huán)路而造成模型預(yù)測(cè)精度降低的情況發(fā)生,在構(gòu)造的鄰接矩陣中增加活動(dòng)在事件日志中所處的順序位次,構(gòu)造含有活動(dòng)位次信息的鄰接矩陣,以此為基礎(chǔ)上進(jìn)一步提取過程模型,該模型中每個(gè)活動(dòng)在同一個(gè)位次上僅發(fā)生一次;再次,通過矩陣中的信息可獲得過程模型中每個(gè)上層節(jié)點(diǎn)到各個(gè)下層節(jié)點(diǎn)的路徑與相應(yīng)概率;接下來,根據(jù)事件日志中信息的類型和特征,利用過程模型對(duì)決策者所需要的信息(如活動(dòng)名稱、等待時(shí)間、發(fā)生概率)進(jìn)行預(yù)測(cè);最后,利用隨機(jī)數(shù)據(jù)與實(shí)際數(shù)據(jù)同基于序列提取規(guī)則的過程模型預(yù)測(cè)結(jié)果進(jìn)行比較,驗(yàn)證所提模型的實(shí)際有效性。
【圖文】:
<IT=32.50>End2.1.2過程模型提取根據(jù)鄰接矩陣的構(gòu)造過程算法細(xì)節(jié)可知,當(dāng)鄰接矩陣中所對(duì)應(yīng)(i,j)位置數(shù)據(jù)不為空時(shí),說明在事件日志中,活動(dòng)i與j在某個(gè)或某幾個(gè)案例中作為緊鄰活動(dòng),那么在過程模型提取時(shí),這兩個(gè)活動(dòng)之間有直接的聯(lián)系,從而應(yīng)用線連接起來,當(dāng)在兩個(gè)活動(dòng)相連的線上增加矩陣中的相應(yīng)信息(頻率與時(shí)間間隔數(shù)值),可得到包含時(shí)間信息與頻率信息的過程模型。針對(duì)表2中的隨機(jī)數(shù)據(jù)(7個(gè)案例,26個(gè)活動(dòng))對(duì)應(yīng)的鄰接矩陣Ⅱ,提取的過程模型如圖1所示。圖1預(yù)測(cè)過程模型(基于鄰接矩陣Ⅱ提。┍恚仓泻械模祩(gè)不同類型的活動(dòng)在圖1的模型中僅出現(xiàn)一次,此時(shí)在圖1中活動(dòng)B與C之間存在一個(gè)回路,根據(jù)圖1中現(xiàn)有頻率信息,無法計(jì)算出活動(dòng)B與C之間回路發(fā)生的次數(shù)(無法確定活動(dòng)B與C在事件日志案例中緊鄰成對(duì)出現(xiàn)的次數(shù))。據(jù)文獻(xiàn)[2,25]可知,過程模型的預(yù)測(cè)精度與模型中回路或者環(huán)路的數(shù)量呈負(fù)相關(guān)性,隨著回路或者環(huán)路數(shù)量的增多,該過程模型的精度相應(yīng)降低。為避免過程模型中產(chǎn)生回路或者環(huán)路,在鄰接矩陣Ⅱ中的(i,j)處,增加活動(dòng)i在事件日志案例中所發(fā)生位置對(duì)應(yīng)順序數(shù)據(jù)信息,進(jìn)一步構(gòu)造含有活動(dòng)順序位次的鄰接矩陣。2.2鄰接矩陣進(jìn)一步構(gòu)造表2中,活動(dòng)A作為第1位次的活動(dòng)出現(xiàn)了7次,即A都是第一個(gè)發(fā)生的活動(dòng)。由于每個(gè)案例中發(fā)生活動(dòng)的數(shù)量與過程不同,每個(gè)活動(dòng)順序發(fā)生的位次不同,D在案例4和案例7中是第3個(gè)發(fā)生的活動(dòng),在其余5個(gè)案例中是第4個(gè)發(fā)生的活動(dòng),但所有案例中D都是最后一個(gè)
鄰的只有活動(dòng)C,利用活動(dòng)C在第3位次發(fā)生的頻率3與活動(dòng)B在第2位次發(fā)生的頻率3可以求得此時(shí)的條件概率,那么活動(dòng)C發(fā)生的概率是1(P{{3}←C/{2}←B}=3/3=1,與此同時(shí),活動(dòng)B完成后距離活動(dòng)C完成的時(shí)間是4.33。針對(duì)表2中的隨機(jī)數(shù)據(jù)事件日志信息,利用圖2中的過程模型相比利用圖1中的過程模型能得到更好地預(yù)測(cè)結(jié)果,原因在于鄰接矩陣Ⅲ比鄰接矩陣Ⅱ含有更多的信息(案例中每個(gè)活動(dòng)的順序位次信息),因此圖2中過程模型更精確。因此,在實(shí)際應(yīng)用中,可根據(jù)決策者對(duì)模型預(yù)測(cè)精度要求,在鄰接矩陣中增加不同的信息。3隨機(jī)數(shù)據(jù)預(yù)測(cè)結(jié)果比較利用隨機(jī)數(shù)據(jù),將本文提出的PMAM的預(yù)測(cè)結(jié)果與文獻(xiàn)[1]中提出的PMS的預(yù)測(cè)結(jié)果進(jìn)行比較,來驗(yàn)證PMAM算法的可行性。3.1隨機(jī)數(shù)據(jù)I針對(duì)表2中的事件日志,利用過程挖掘工具PROM[20]提。校停优cPMAM(具體數(shù)據(jù)信息如圖2中所示),這兩種模型的預(yù)測(cè)結(jié)果比較如表6所示。表6PMAM與PMS預(yù)測(cè)結(jié)果狀態(tài)PMAM預(yù)測(cè)結(jié)果PMS預(yù)測(cè)結(jié)果1START{0}(adjacencyA)[FRE=7]<IT=0>[{}]<IT=0>2A{1}(adjacencyB)[FRE=3]<IT=4.67>(adjacencyC)[FRE=2]<IT=4.50>(adjacencyE)[FRE=2]<IT=9.50>[{0=A}]<Sojourntime=6.00>3B{2}(adjacencyC)
【圖文】:
<IT=32.50>End2.1.2過程模型提取根據(jù)鄰接矩陣的構(gòu)造過程算法細(xì)節(jié)可知,當(dāng)鄰接矩陣中所對(duì)應(yīng)(i,j)位置數(shù)據(jù)不為空時(shí),說明在事件日志中,活動(dòng)i與j在某個(gè)或某幾個(gè)案例中作為緊鄰活動(dòng),那么在過程模型提取時(shí),這兩個(gè)活動(dòng)之間有直接的聯(lián)系,從而應(yīng)用線連接起來,當(dāng)在兩個(gè)活動(dòng)相連的線上增加矩陣中的相應(yīng)信息(頻率與時(shí)間間隔數(shù)值),可得到包含時(shí)間信息與頻率信息的過程模型。針對(duì)表2中的隨機(jī)數(shù)據(jù)(7個(gè)案例,26個(gè)活動(dòng))對(duì)應(yīng)的鄰接矩陣Ⅱ,提取的過程模型如圖1所示。圖1預(yù)測(cè)過程模型(基于鄰接矩陣Ⅱ提。┍恚仓泻械模祩(gè)不同類型的活動(dòng)在圖1的模型中僅出現(xiàn)一次,此時(shí)在圖1中活動(dòng)B與C之間存在一個(gè)回路,根據(jù)圖1中現(xiàn)有頻率信息,無法計(jì)算出活動(dòng)B與C之間回路發(fā)生的次數(shù)(無法確定活動(dòng)B與C在事件日志案例中緊鄰成對(duì)出現(xiàn)的次數(shù))。據(jù)文獻(xiàn)[2,25]可知,過程模型的預(yù)測(cè)精度與模型中回路或者環(huán)路的數(shù)量呈負(fù)相關(guān)性,隨著回路或者環(huán)路數(shù)量的增多,該過程模型的精度相應(yīng)降低。為避免過程模型中產(chǎn)生回路或者環(huán)路,在鄰接矩陣Ⅱ中的(i,j)處,增加活動(dòng)i在事件日志案例中所發(fā)生位置對(duì)應(yīng)順序數(shù)據(jù)信息,進(jìn)一步構(gòu)造含有活動(dòng)順序位次的鄰接矩陣。2.2鄰接矩陣進(jìn)一步構(gòu)造表2中,活動(dòng)A作為第1位次的活動(dòng)出現(xiàn)了7次,即A都是第一個(gè)發(fā)生的活動(dòng)。由于每個(gè)案例中發(fā)生活動(dòng)的數(shù)量與過程不同,每個(gè)活動(dòng)順序發(fā)生的位次不同,D在案例4和案例7中是第3個(gè)發(fā)生的活動(dòng),在其余5個(gè)案例中是第4個(gè)發(fā)生的活動(dòng),但所有案例中D都是最后一個(gè)
鄰的只有活動(dòng)C,利用活動(dòng)C在第3位次發(fā)生的頻率3與活動(dòng)B在第2位次發(fā)生的頻率3可以求得此時(shí)的條件概率,那么活動(dòng)C發(fā)生的概率是1(P{{3}←C/{2}←B}=3/3=1,與此同時(shí),活動(dòng)B完成后距離活動(dòng)C完成的時(shí)間是4.33。針對(duì)表2中的隨機(jī)數(shù)據(jù)事件日志信息,利用圖2中的過程模型相比利用圖1中的過程模型能得到更好地預(yù)測(cè)結(jié)果,原因在于鄰接矩陣Ⅲ比鄰接矩陣Ⅱ含有更多的信息(案例中每個(gè)活動(dòng)的順序位次信息),因此圖2中過程模型更精確。因此,在實(shí)際應(yīng)用中,可根據(jù)決策者對(duì)模型預(yù)測(cè)精度要求,在鄰接矩陣中增加不同的信息。3隨機(jī)數(shù)據(jù)預(yù)測(cè)結(jié)果比較利用隨機(jī)數(shù)據(jù),將本文提出的PMAM的預(yù)測(cè)結(jié)果與文獻(xiàn)[1]中提出的PMS的預(yù)測(cè)結(jié)果進(jìn)行比較,來驗(yàn)證PMAM算法的可行性。3.1隨機(jī)數(shù)據(jù)I針對(duì)表2中的事件日志,利用過程挖掘工具PROM[20]提。校停优cPMAM(具體數(shù)據(jù)信息如圖2中所示),這兩種模型的預(yù)測(cè)結(jié)果比較如表6所示。表6PMAM與PMS預(yù)測(cè)結(jié)果狀態(tài)PMAM預(yù)測(cè)結(jié)果PMS預(yù)測(cè)結(jié)果1START{0}(adjacencyA)[FRE=7]<IT=0>[{}]<IT=0>2A{1}(adjacencyB)[FRE=3]<IT=4.67>(adjacencyC)[FRE=2]<IT=4.50>(adjacencyE)[FRE=2]<IT=9.50>[{0=A}]<Sojourntime=6.00>3B{2}(adjacencyC)
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 宋煒;劉強(qiáng);;基于模擬退火算法的過程挖掘研究[J];電子學(xué)報(bào);2009年S1期
2 瞿華;;基于結(jié)構(gòu)化工作流網(wǎng)的隱含任務(wù)挖掘方法[J];中國(guó)管理信息化;2012年07期
3 王sマ
本文編號(hào):2793945
本文鏈接:http://sikaile.net/guanlilunwen/glzh/2793945.html
最近更新
教材專著