事件序列中的時(shí)序依賴發(fā)現(xiàn)
發(fā)布時(shí)間:2021-01-06 04:15
隨著數(shù)據(jù)采集和存儲(chǔ)技術(shù)的不斷發(fā)展,各個(gè)領(lǐng)域中產(chǎn)生的時(shí)序數(shù)據(jù)的類型和規(guī)模都有了巨大的增長,對這些時(shí)序數(shù)據(jù)進(jìn)行信息采集發(fā)現(xiàn)成為數(shù)據(jù)挖掘的一個(gè)重要研究方向。特別是在系統(tǒng)管理中,對歷史日志事件序列中的隱藏模式進(jìn)行挖掘,有助于管理人員了解系統(tǒng)內(nèi)部的運(yùn)行狀態(tài),進(jìn)行系統(tǒng)日志管理,異常檢測和故障溯源等工作。對于事件序列依賴發(fā)現(xiàn),傳統(tǒng)方式一方面采用時(shí)間窗口機(jī)制挖掘事件之間簡單的關(guān)聯(lián)依賴,另一方面對于存在交叉依賴的情況下只能挖掘成對時(shí)序依賴。因此本文針對以上這些問題進(jìn)行研究工作,主要的研究內(nèi)容如下:(1)本文首先對事件序列和時(shí)序依賴進(jìn)行了問題描述和分析,對事件序列依賴發(fā)現(xiàn)中的頻繁情節(jié)發(fā)現(xiàn)和基于交叉依賴的成對時(shí)序依賴發(fā)現(xiàn)算法進(jìn)行了研究和討論,總結(jié)了這兩類事件序列依賴發(fā)現(xiàn)的優(yōu)缺點(diǎn)。(2)本文提出一種基于時(shí)滯特征的成對時(shí)序依賴情節(jié)發(fā)現(xiàn)算法,引入時(shí)滯情節(jié)發(fā)現(xiàn)的概念,在事件匹配環(huán)節(jié)采用相鄰事件匹配集算法,避免預(yù)先設(shè)定時(shí)間窗口,通過時(shí)滯的概率統(tǒng)計(jì)模型處理可能存在的交叉關(guān)聯(lián),并得到時(shí)滯情節(jié)之間的時(shí)間間隔分布。與迭代最近事件算法相比,該算法衡量事件多種匹配情況的可能性,獲得一對多的相鄰事件匹配集,更加有效得模擬了時(shí)滯的實(shí)...
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
事件序列
真實(shí)數(shù)據(jù)合成數(shù)據(jù)集上進(jìn)行算法準(zhǔn)確性和效果的檢驗(yàn)后,將在實(shí)際應(yīng)用中的數(shù)據(jù)集上進(jìn)本文中所采用的真實(shí)數(shù)據(jù)集是某運(yùn)營商 openstack 上的日志數(shù)據(jù),一條原始的日3.6 所示。每一條原始日志都是由 6 個(gè)部分組成,依次為:日志發(fā)生時(shí)間戳,日別,日志發(fā)生的代碼模塊,代碼模塊的 request-id,日志內(nèi)容。圖 3.6 openstack 原始日志數(shù)據(jù)始日志的形式并不能直接適用于時(shí)滯情節(jié)挖掘的情況,所以本文的實(shí)驗(yàn)是建立析后的事件提取結(jié)果[49-50]上的。實(shí)驗(yàn)中使用的事件記錄格式如圖 3.7(a)所示。每始日志記錄路徑,事件發(fā)生時(shí)間戳,代碼模塊的 request-id 以及事件類型 ID。日志提取模板如圖 3.7(b)用于記錄每個(gè)事件類型 ID 對應(yīng)的實(shí)際事件內(nèi)容,用于。在實(shí)驗(yàn)中只使用了每個(gè)事件實(shí)例的事件類型和發(fā)生時(shí)間。
究生學(xué)位論文 。在實(shí)際系統(tǒng)中<A,B>和<B,C>可能是兩個(gè)不同的系統(tǒng)任務(wù)中間的依賴。則):事件鏈1 2 -1< , ,..., ,m me e e e 和1 2 1=< , ,..., ,n ne e e e 個(gè)事件類型me 和事件鏈 的第一個(gè)事件類型1e 相同,且事例集合 ( )mP e 和事件鏈 中事件 存在依賴的實(shí)例集合1P ( e 11=( ) ( )mme eP e P e 和 事 件 鏈 可 以 進(jìn) 行 連 接 生 成 ( 1)m n - 階 1 2 1, , ,..., ,m n ne e e e 。
本文編號:2959912
【文章來源】:南京郵電大學(xué)江蘇省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
事件序列
真實(shí)數(shù)據(jù)合成數(shù)據(jù)集上進(jìn)行算法準(zhǔn)確性和效果的檢驗(yàn)后,將在實(shí)際應(yīng)用中的數(shù)據(jù)集上進(jìn)本文中所采用的真實(shí)數(shù)據(jù)集是某運(yùn)營商 openstack 上的日志數(shù)據(jù),一條原始的日3.6 所示。每一條原始日志都是由 6 個(gè)部分組成,依次為:日志發(fā)生時(shí)間戳,日別,日志發(fā)生的代碼模塊,代碼模塊的 request-id,日志內(nèi)容。圖 3.6 openstack 原始日志數(shù)據(jù)始日志的形式并不能直接適用于時(shí)滯情節(jié)挖掘的情況,所以本文的實(shí)驗(yàn)是建立析后的事件提取結(jié)果[49-50]上的。實(shí)驗(yàn)中使用的事件記錄格式如圖 3.7(a)所示。每始日志記錄路徑,事件發(fā)生時(shí)間戳,代碼模塊的 request-id 以及事件類型 ID。日志提取模板如圖 3.7(b)用于記錄每個(gè)事件類型 ID 對應(yīng)的實(shí)際事件內(nèi)容,用于。在實(shí)驗(yàn)中只使用了每個(gè)事件實(shí)例的事件類型和發(fā)生時(shí)間。
究生學(xué)位論文 。在實(shí)際系統(tǒng)中<A,B>和<B,C>可能是兩個(gè)不同的系統(tǒng)任務(wù)中間的依賴。則):事件鏈1 2 -1< , ,..., ,m me e e e 和1 2 1=< , ,..., ,n ne e e e 個(gè)事件類型me 和事件鏈 的第一個(gè)事件類型1e 相同,且事例集合 ( )mP e 和事件鏈 中事件 存在依賴的實(shí)例集合1P ( e 11=( ) ( )mme eP e P e 和 事 件 鏈 可 以 進(jìn) 行 連 接 生 成 ( 1)m n - 階 1 2 1, , ,..., ,m n ne e e e 。
本文編號:2959912
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2959912.html
最近更新
教材專著