基于粒計(jì)算的混合屬性數(shù)據(jù)增量式知識獲取方法研究
發(fā)布時間:2022-01-14 14:53
隨著工業(yè)物聯(lián)網(wǎng)的快速普及,各領(lǐng)域中的海量復(fù)雜數(shù)據(jù)推動著企業(yè)的快速發(fā)展。但如何刪除海量復(fù)雜數(shù)據(jù)中的數(shù)據(jù)噪音,獲取對企業(yè)有價值的數(shù)據(jù)信息已經(jīng)成為了當(dāng)前信息科學(xué)的一大難題。此外,各領(lǐng)域中獲取的數(shù)據(jù)在動態(tài)地變化著,如何有效利用新舊數(shù)據(jù)之間的關(guān)系對有價值的信息進(jìn)行高效更新也是信息科學(xué)領(lǐng)域的重要問題之一。粒計(jì)算采用分而治之的策略,可以有效對動態(tài)系統(tǒng)中的知識進(jìn)行更新,獲取數(shù)據(jù)中包含的潛在價值。本文利用粒計(jì)算理論中簡化復(fù)雜問題的方法及鄰域粗糙集模型中混合數(shù)據(jù)的度量方式,以屬性約簡結(jié)果知識粒度的增量計(jì)算為技術(shù)手段,研究了混合動態(tài)信息系統(tǒng)中數(shù)據(jù)變化時的增量式屬性約簡算法。本文的主要成果包括:(1)為了提高在屬性集發(fā)生變化時混合動態(tài)信息系統(tǒng)中屬性約簡結(jié)果的更新效率,本文首先分析了具有混合屬性數(shù)據(jù)知識粒度的計(jì)算方式,然后探索了混合信息系統(tǒng)下屬性增加時基于鄰域模型的知識粒度增量更新的規(guī)律,基于此設(shè)計(jì)了一種針對混合信息系統(tǒng)中屬性集變化時的增量式約簡算法。并利用UCI數(shù)據(jù)集進(jìn)行相關(guān)仿真實(shí)驗(yàn)對所提出算法的有效性進(jìn)行了驗(yàn)證;(2)為了提高在樣本集發(fā)生變化時混合動態(tài)信息系統(tǒng)中屬性約簡結(jié)果的更新效率,本文首先利用鄰域模型下...
【文章來源】:南京財(cái)經(jīng)大學(xué)江蘇省
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文組織結(jié)構(gòu)圖
V為一個信息函數(shù),這個信息函數(shù)為每一個屬性指定一x U , ( , )af x a V[4]。.2 在信息系統(tǒng) DIS (U , A, V , f)中,B C, IND ( B ) { b B,其中 x , y U ( x y)稱為不可分辨關(guān)系。包含集B在論域U 上導(dǎo)出的劃分記為 U / IND ( B)[4]。.3 在信息系統(tǒng) IS (U , A, V , f)中,對于 X U, B C,集合以及 X 的邊界域可定義為[4]:B ( X ) { x U :[ x ] B X}B( X) {x U:[x]X }B ( ) ( ) ( )BBND X B X B X集 B ( X )也被稱為 X 的 B 正區(qū)域,記為 ( )BPOS X ;(BNEG 負(fù)區(qū)域。樣本集合 X 的關(guān)于條件屬性集 B 的等價類、下、負(fù)區(qū)域和邊界域的示意圖如圖 2.1 所示。
Segment 15 13 13.67 12 6.80Mushroom 4 4 109.35 4 35.36圖4.1 樣本增加時約簡結(jié)果的NavieBayes分類精度
【參考文獻(xiàn)】:
期刊論文
[1]粗等價粒度下基于多種加速策略的增量式求核算法[J]. 趙潔,張愷航,董振寧,梁俊杰,徐克付. 計(jì)算機(jī)科學(xué). 2017(01)
[2]基于粗糙集的屬性約簡在數(shù)據(jù)挖掘中的應(yīng)用研究[J]. 張穎淳,蘇伯洪,曹娟. 計(jì)算機(jī)科學(xué). 2013(08)
[3]知識粒度計(jì)算的矩陣方法及其在屬性約簡中的應(yīng)用[J]. 王磊,葉軍. 計(jì)算機(jī)工程與科學(xué). 2013(03)
[4]基于信息熵的屬性約簡算法及應(yīng)用[J]. 陳媛,楊棟. 重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)). 2013(01)
[5]物聯(lián)網(wǎng):概念、架構(gòu)與關(guān)鍵技術(shù)研究綜述[J]. 孫其博,劉杰,黎羴,范春曉,孫娟娟. 北京郵電大學(xué)學(xué)報(bào). 2010(03)
[6]Hash快速屬性約簡算法[J]. 劉勇,熊蓉,褚健. 計(jì)算機(jī)學(xué)報(bào). 2009(08)
[7]一種基于粗糙集理論的快速并行屬性約簡算法[J]. 肖大偉,王國胤,胡峰. 計(jì)算機(jī)科學(xué). 2009(03)
[8]基于鄰域粗糙集的符號與數(shù)值屬性快速約簡算法[J]. 胡清華,趙輝,于達(dá)仁. 模式識別與人工智能. 2008(06)
[9]基于新的條件熵的決策表約簡方法[J]. 徐久成,孫林,馬媛媛. 計(jì)算機(jī)工程與設(shè)計(jì). 2008(09)
[10]一種基于改進(jìn)差別矩陣的核增量式更新算法[J]. 楊明. 計(jì)算機(jī)學(xué)報(bào). 2006(03)
本文編號:3588700
【文章來源】:南京財(cái)經(jīng)大學(xué)江蘇省
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文組織結(jié)構(gòu)圖
V為一個信息函數(shù),這個信息函數(shù)為每一個屬性指定一x U , ( , )af x a V[4]。.2 在信息系統(tǒng) DIS (U , A, V , f)中,B C, IND ( B ) { b B,其中 x , y U ( x y)稱為不可分辨關(guān)系。包含集B在論域U 上導(dǎo)出的劃分記為 U / IND ( B)[4]。.3 在信息系統(tǒng) IS (U , A, V , f)中,對于 X U, B C,集合以及 X 的邊界域可定義為[4]:B ( X ) { x U :[ x ] B X}B( X) {x U:[x]X }B ( ) ( ) ( )BBND X B X B X集 B ( X )也被稱為 X 的 B 正區(qū)域,記為 ( )BPOS X ;(BNEG 負(fù)區(qū)域。樣本集合 X 的關(guān)于條件屬性集 B 的等價類、下、負(fù)區(qū)域和邊界域的示意圖如圖 2.1 所示。
Segment 15 13 13.67 12 6.80Mushroom 4 4 109.35 4 35.36圖4.1 樣本增加時約簡結(jié)果的NavieBayes分類精度
【參考文獻(xiàn)】:
期刊論文
[1]粗等價粒度下基于多種加速策略的增量式求核算法[J]. 趙潔,張愷航,董振寧,梁俊杰,徐克付. 計(jì)算機(jī)科學(xué). 2017(01)
[2]基于粗糙集的屬性約簡在數(shù)據(jù)挖掘中的應(yīng)用研究[J]. 張穎淳,蘇伯洪,曹娟. 計(jì)算機(jī)科學(xué). 2013(08)
[3]知識粒度計(jì)算的矩陣方法及其在屬性約簡中的應(yīng)用[J]. 王磊,葉軍. 計(jì)算機(jī)工程與科學(xué). 2013(03)
[4]基于信息熵的屬性約簡算法及應(yīng)用[J]. 陳媛,楊棟. 重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)). 2013(01)
[5]物聯(lián)網(wǎng):概念、架構(gòu)與關(guān)鍵技術(shù)研究綜述[J]. 孫其博,劉杰,黎羴,范春曉,孫娟娟. 北京郵電大學(xué)學(xué)報(bào). 2010(03)
[6]Hash快速屬性約簡算法[J]. 劉勇,熊蓉,褚健. 計(jì)算機(jī)學(xué)報(bào). 2009(08)
[7]一種基于粗糙集理論的快速并行屬性約簡算法[J]. 肖大偉,王國胤,胡峰. 計(jì)算機(jī)科學(xué). 2009(03)
[8]基于鄰域粗糙集的符號與數(shù)值屬性快速約簡算法[J]. 胡清華,趙輝,于達(dá)仁. 模式識別與人工智能. 2008(06)
[9]基于新的條件熵的決策表約簡方法[J]. 徐久成,孫林,馬媛媛. 計(jì)算機(jī)工程與設(shè)計(jì). 2008(09)
[10]一種基于改進(jìn)差別矩陣的核增量式更新算法[J]. 楊明. 計(jì)算機(jī)學(xué)報(bào). 2006(03)
本文編號:3588700
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3588700.html
最近更新
教材專著