天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 論文百科 > 碩士論文 >

不完備信息系統(tǒng)的增量式知識約簡算法研究

發(fā)布時間:2017-07-28 08:16

第一章 緒論


1.1 研究背景與意義

全球每天幾十億人使用計算機、GPS 設備、電話和醫(yī)療設備,產(chǎn)生海量的數(shù)據(jù)信息。為了長遠發(fā)展,企業(yè)紛紛建立自身獨有的數(shù)據(jù)庫,以期為自身長遠發(fā)展提供決策支持,如何從這些海量數(shù)據(jù)中挖掘出對企業(yè)長遠發(fā)展有益的信息成為當前重要的研究課題。然而,數(shù)據(jù)中往往存在著大量毫無價值的信息,且難于通過主觀的經(jīng)驗去甄別,這不僅會造成資源的浪費,最重要的是會干擾企業(yè)的發(fā)展決策。研究還發(fā)現(xiàn):絕大多數(shù)擁有海量數(shù)據(jù)庫的企業(yè),數(shù)據(jù)和信息的有效利用率僅為 7%,大量的知識資源得不到有效利用。與此同時,由于各種原因,經(jīng)常會出現(xiàn)數(shù)據(jù)缺損的情況,例如:數(shù)據(jù)輸入時人為疏漏、數(shù)據(jù)傳輸堵塞、機器故障等,都會造成數(shù)據(jù)不完整。如此龐大、復雜、不完整的數(shù)據(jù)面前,人工分析已經(jīng)無能無力,寶貴的信息無法得到充分的利用,知識發(fā)現(xiàn)技術應運而生。知識發(fā)現(xiàn)[1-2]是挖掘數(shù)據(jù)庫中數(shù)據(jù)或?qū)傩蚤g一個代數(shù)關系,通過存在的關系建立數(shù)學模型以提取有用的信息提供給用戶,方便用戶在信息正確的情況下處理“縮減”后的數(shù)據(jù)信息。因此如何應對數(shù)據(jù)缺失、提取海量數(shù)據(jù)中有效的數(shù)據(jù)已經(jīng)成為數(shù)據(jù)分析的熱點課題。

...............


1.2 粗糙集在完備信息系統(tǒng)中的研究現(xiàn)狀

粗糙集理論提出至今,經(jīng)過 30 多年的研究發(fā)展,已經(jīng)成為非常有效的數(shù)據(jù)分析與處理工具。粗糙集在發(fā)表之初并未受到太多關注,直到 1990 年前后才逐漸受到廣泛的重視。尤其進入 21 世紀以來,該理論在機器學習、數(shù)據(jù)挖掘、決策支持等方面的廣泛、成功的應用使它成為諸多領域的研究熱點之一。作為粗糙集理論核心研究內(nèi)容之一的屬性約簡,約簡結果通常并不唯一。 Wang 等人[6]在研究的過程中已經(jīng)證實求解所有屬性約簡和最小約簡是 NP-hard 問題。據(jù)此,在屬性約簡中啟發(fā)式的方法被廣泛應用。常用的啟發(fā)式算法有基于信息熵的方法[7-9]、基于差別矩陣[10,11]的方法和基于正區(qū)域[12,13]的方法。

...............


第二章 信息系統(tǒng)中的基本概念


2.1 知識與分類

知識是人類通過實踐認識到的客觀世界的規(guī)律性的東西,是人類實踐經(jīng)驗的總結和升華,具有抽象性和普遍性。定義 2.1[39](知識) 設 U 是非空的有限實例的集合,稱為論域。論域中任何一個子集 X   U,稱為論域 U 的一個概念。論域 U 中任何子類族稱為關于 U的知識。在粗糙集理論中通常用不可分辨關系來表示分類及知識。而從數(shù)學和數(shù)據(jù)在計算機中的表示形式的角度來看,關系在計算機中的表示和處理比分類的表示和處理更容易、簡單,所以,我們就用等價關系或關系來表示知識及分類。在實際生活中,我們處理的數(shù)據(jù)在論域 U 上并不僅僅只是單一的劃分,而是論域 U 上的多個或一族劃分。從而,我們就有了信息庫的相關概念。

...............


2.2 上、下近似集及正區(qū)域

定義 2.5[39](上、下近似集)給定信息庫 S   (U ,A,V,f),U 為論域,集合 X U和 U 論域上的一個不可分辨關系 R  IND(S),定義兩個子集:R( X){x|(xU)([x]X)}{Y|(YU/R)(YX)}R 2.2)R( X)  {x|( x U) ([x]X  )} {Y|( Y U/R) (YX  )}R (2.3)分別稱之為 X 關于 R 的下近似集、上近似集。 R (X)稱為 X 關于知識 R的下近似,表示U 中確定劃分到集合 X 的對象組成的集合,,等價關系中屬于集合 X 的所有子集Yi的并集。R  (X)稱為 X 關于知識R 的上近似,表示論域U 中有確定和可能被劃分到集合 X 的實例組成的集合,關系中與集合 X 的交集不為空的所有子集 Yi的并集。

...............


第三章 不完備決策表的數(shù)據(jù)補齊................13

3.1 引言................13

3.2 模糊加權相似性度量.................13

第四章 基于數(shù)據(jù)補齊的不完備決策表增量式屬性約簡................20

4.1 引言...............20

4.2 補齊后的決策表化簡算法.................20

第五章 基于限制容差關系的不完備決策表增量式屬性約簡................29

5.1 引言...............29

5.2 擴展模型分析................30



第五章 基于限制容差關系的不完備決策表增量式屬性約簡


5.1 引言

當前數(shù)據(jù)普遍存在數(shù)據(jù)不完備、動態(tài)增長這兩個特性,針對數(shù)據(jù)不完備性,解決的辦法多集中在數(shù)據(jù)補齊和拓展粗糙集模型上,這兩種思路是當前不完備數(shù)據(jù)的研究基礎。同時,數(shù)據(jù)動態(tài)增長的特性導致建立的原信息系統(tǒng)的結論可能不再有效,需要對這些結論動態(tài)更新。據(jù)此,針對不完備增量式數(shù)據(jù)的知識發(fā)現(xiàn),之前的章節(jié)提出了一種基于模糊加權的粗糙集數(shù)據(jù)補齊方法,補齊后的數(shù)據(jù)可以較方便的利用現(xiàn)有的針對完備數(shù)據(jù)所取得的研究成果,在此基礎上,分析研究現(xiàn)有的針對補齊后決策表的增量式屬性約簡算法,在簡化決策表的基礎上提出一種綜合差別矩陣和正區(qū)域兩種思想的增量式屬性約簡算法,在原決策表約簡結果的基礎上,該算法能快速更新數(shù)據(jù)動態(tài)變化后的決策表屬性約簡結果,同時保證約簡結果不再包含冗余屬性。

...............


5.2 擴展模型分析

經(jīng)典粗糙集理論通過等價關系對對象進行分類和處理,然而實際數(shù)據(jù)中大量存在著不完備現(xiàn)象,當利用經(jīng)典粗糙集理論對這些數(shù)據(jù)進行處理時,將會出現(xiàn)由于不完備數(shù)據(jù)無法滿足等價關系致使經(jīng)典粗糙集束手無策的現(xiàn)象。為解決等價關系劃分不完備信息系統(tǒng)過于苛刻的問題,目前已提出多種粗糙擴展集模型,本節(jié)分析比較基于容差關系、非對稱相似關系、量化相




本文編號:582943

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenshubaike/kjzx/582943.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶716d9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com