基于粗糙集的增量屬性約簡機理與算法研究
發(fā)布時間:2018-10-26 18:09
【摘要】:在大數(shù)據(jù)時代,計算機技術的飛速發(fā)展使得人類所收集的數(shù)據(jù)普遍呈現(xiàn)規(guī)模的海量性、表示的高維性、類型的混雜性以及時空的動態(tài)性等特征。如何高效地從這種數(shù)據(jù)中去除冗余以及不相關的屬性,以解決學習算法的“維數(shù)災難”問題并提高學習算法的性能,一直是機器學習領域的熱點課題之一。經(jīng)典粗糙集屬性約簡以保持條件屬性與決策標簽之間的一致性為出發(fā)點,實現(xiàn)了對符號數(shù)據(jù)中冗余屬性的有效去除。為了處理不同類型甚至混雜的高維數(shù)據(jù),經(jīng)典粗糙集被拓展到更廣義的模型。然而,當面對大規(guī)模以及動態(tài)數(shù)據(jù)時,現(xiàn)有粗糙集屬性約簡算法常常耗費大量的計算時間,甚至在某些軟硬件環(huán)境下由于內(nèi)存溢出而無法執(zhí)行。為了克服這些問題,本文基于推廣的粗糙集模型從增量的角度對符號型、實值型以及混雜型的高維海量動態(tài)數(shù)據(jù)展開屬性約簡增量機制的研究。主要研究成果和創(chuàng)新點如下:(1)設計了主動樣本選擇的機制,永久性地過濾了無用樣本。對有用樣本,通過研究屬性約簡的增量過程,揭示了如何從當前約簡中刪去冗余屬性和加入有信息量的屬性到當前約簡。通過融合主動樣本選擇的機制和屬性約簡的增量過程,設計了經(jīng)典粗糙集屬性約簡的增量算法,實驗驗證了該算法處理符號型動態(tài)數(shù)據(jù)的時間和空間的高效性。(2)用兩個布爾向量刻畫了變精度粗糙集屬性約簡,利用極小元素構(gòu)造了變精度粗糙集屬性約簡算法。當有新樣本加入時,基于辨識矩陣中極小元素的增量計算,研究了變精度粗糙集屬性約簡的增量過程,揭示了如何從當前約簡中刪去冗余屬性以及加入有信息量的屬性到當前約簡;谶@一增量過程設計了變精度粗糙集屬性約簡的增量算法。數(shù)值實驗驗證了該增量算法的有效性和高效性。(3)用相對辨識關系刻畫了一般模糊粗糙集模型的屬性核心以及約簡,設計了基于相對辨識關系的模糊粗糙集屬性約簡算法;谙鄬Ρ孀R關系的增量計算,研究了屬性增加和刪去的準則,設計了兩個模糊粗糙集屬性約簡的增量過程:1)每次有樣本子集加入時,執(zhí)行屬性約簡的增量計算,當不再有樣本子集加入時,即獲得整個數(shù)據(jù)集的約簡;2)每次有樣本子集加入時,僅增量計算相對辨識關系,當不再有子集加入時,即可得整個數(shù)據(jù)集的相對辨識關系,基于該相對辨識關系可得整個數(shù)據(jù)集的約簡。其中,過程一更適合動態(tài)數(shù)據(jù),而過程二更適合大規(guī)模數(shù)據(jù)。實驗表明在不退化分類性能的前提下,這兩個增量過程都加速了模糊粗糙集屬性約簡的獲取,且過程二在處理大規(guī)模數(shù)據(jù)時表現(xiàn)出了更高效的性能。(4)分別對于符號屬性和數(shù)值屬性定義了辨識關系以刻畫它們相對于決策標簽的區(qū)分能力,用辨識關系的并集構(gòu)造了依賴函數(shù)以度量混合屬性與決策標簽之間的一致性,通過在小的波動范圍內(nèi)保持該依賴函數(shù)不變定義了混合數(shù)據(jù)的屬性約簡。用相對辨識關系刻畫了混合數(shù)據(jù)的屬性約簡,設計了相應的約簡算法。當有多個樣本加入混合數(shù)據(jù)時,基于相對辨識關系的增量計算,研究了混合數(shù)據(jù)屬性約簡的增量機制,提出了混合數(shù)據(jù)屬性約簡的增量算法。實驗表明,所提混合數(shù)據(jù)屬性約簡能有效處理混合數(shù)據(jù),實現(xiàn)了符號屬性和數(shù)值屬性之間的相互替換,且所提增量算法加速了混合數(shù)據(jù)屬性約簡的獲取。(5)為了從含缺省值、符號值、實值等屬性的混雜數(shù)據(jù)中選擇有信息量的屬性子集,我們引入相對辨識關系刻畫了覆蓋粗糙集的屬性核心與約簡,利用相對辨識關系設計了混雜數(shù)據(jù)的約簡算法;谙鄬Ρ孀R關系的增量計算,研究了屬性增加和刪去的準則,設計了兩個覆蓋粗糙集屬性約簡的增量過程:1)每次有樣本子集加入時,增量計算一個覆蓋約簡,當不再有子集加入時,就得到該混雜數(shù)據(jù)的覆蓋約簡;2)每次有樣本子集加入時,僅增量計算相對辨識關系,當不再有子集加入時,就得到該混雜數(shù)據(jù)的相對辨識關系,基于該相對辨識關系從空集開始計算混雜數(shù)據(jù)的覆蓋約簡。實驗表明,這兩個增量過程極大減少了計算一個覆蓋約簡的運行時間,且第二個增量過程更加高效。
[Abstract]:......
【學位授予單位】:華北電力大學(北京)
【學位級別】:博士
【學位授予年份】:2017
【分類號】:TP18
,
本文編號:2296547
[Abstract]:......
【學位授予單位】:華北電力大學(北京)
【學位級別】:博士
【學位授予年份】:2017
【分類號】:TP18
,
本文編號:2296547
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2296547.html
最近更新
教材專著