基于模糊規(guī)則的知識發(fā)現(xiàn)與表示研究
本文選題:模糊規(guī)則 切入點:模糊決策樹 出處:《大連理工大學(xué)》2015年博士論文 論文類型:學(xué)位論文
【摘要】:在當(dāng)今數(shù)字化革命的信息時代,從數(shù)據(jù)中發(fā)現(xiàn)知識變得越來越重要。知識表示和推理一直被認(rèn)為是知識工程的核心問題;谀:(guī)則的系統(tǒng)作為一種重要的知識發(fā)現(xiàn)技術(shù)可以有效地解決知識表示和推理問題,其通過模糊規(guī)則表示知識并采用模糊邏輯推理運用知識;谀:(guī)則的系統(tǒng)可以有效地完成各種各樣的知識發(fā)現(xiàn)與運用任務(wù),包括回歸、聚類、分類、預(yù)測等。并且基于模糊規(guī)則的系統(tǒng)具有很多優(yōu)勢,其中包括較高的精度和具有易于理解的語義解釋。本文研究了基于模糊規(guī)則的系統(tǒng),包括模糊決策樹、基于模糊規(guī)則的聚類和數(shù)據(jù);。主要內(nèi)容包括:1.提出了一種新的基于模糊規(guī)則的決策樹——模糊規(guī)則決策樹(FRDT)。應(yīng)用模糊一致性設(shè)計了關(guān)聯(lián)規(guī)則提取算法(AREA),通過關(guān)聯(lián)規(guī)則提取算法AREA構(gòu)建了模糊規(guī)則決策樹。傳統(tǒng)的決策樹在每個節(jié)點處僅考慮一個特征,所提出的模糊規(guī)則決策樹在每個節(jié)點上考慮一個由若干個特征組成的模糊規(guī)則,進而構(gòu)造了高純度的葉子節(jié)點并減小了樹的規(guī)模。模糊規(guī)則決策樹克服了以超平面作為決策函數(shù)的斜決策樹沒有語義解釋的問題。應(yīng)用UCI機器學(xué)習(xí)標(biāo)準(zhǔn)數(shù)據(jù)庫的數(shù)據(jù)進行了實驗研究,分析了模糊規(guī)則決策樹的性能。與傳統(tǒng)決策樹(C4.5, LADtree, BFTree, SimpleCart, NBTree)進行了對比,所進行的統(tǒng)計假設(shè)檢驗說明了模糊規(guī)則決策樹在準(zhǔn)確率和樹的規(guī)模上均優(yōu)于傳統(tǒng)決策樹。2.在公理模糊集理論框架下,提出了一種新的聚類方法——AFS模糊聚類。首先,對于每個不同的樣本選取模糊語義集合。其次,運用公理模糊集理論,根據(jù)所選取的模糊語義構(gòu)造復(fù)雜概念作為每個樣本的模糊描述。最后,將相同的或者相似的樣本描述放入同一類中,形成該類的模糊描述,并且根據(jù)類描述實現(xiàn)對樣本數(shù)據(jù)的聚類。通過UCI機器學(xué)習(xí)標(biāo)準(zhǔn)數(shù)據(jù)庫的數(shù)據(jù)檢驗了AFS模糊聚類算法的可解釋性,并且在聚類精度上可以同其他基于規(guī)則的聚類算法以及經(jīng)典聚類算法FCM和K-means相比較。3.提出了一種快速數(shù)據(jù);椒(FRCGC),對每個得到的信息粒給出了語義解釋。首先,應(yīng)用提出的無監(jiān)督特征選擇方法選擇屬性。接下來,構(gòu)建模糊規(guī)則對樣本進行描述,并且根據(jù)樣本描述的重要程度,將典范描述挑選出來。最后,通過典范描述實現(xiàn)數(shù)據(jù)的;?梢愿鶕(jù)實際問題,調(diào)整樣本描述的定義,使得易于對該;椒ㄟM行改進,以處理復(fù)雜問題。通過UCI機器學(xué)習(xí)標(biāo)準(zhǔn)數(shù)據(jù)庫的數(shù)據(jù)驗證了所提出的數(shù)據(jù);椒ǖ目山忉屝院陀行。
[Abstract]:In the information age of the digital revolution, Finding knowledge from data has become more and more important. Knowledge representation and reasoning have always been considered as the core of knowledge engineering. As an important knowledge discovery technology, fuzzy rule based system can effectively solve knowledge. Representation and reasoning problems, The system based on fuzzy rules can effectively accomplish all kinds of tasks of knowledge discovery and application, including regression, clustering and classification. Moreover, the system based on fuzzy rules has many advantages, including high precision and easy to understand semantic interpretation. This paper studies the system based on fuzzy rules, including fuzzy decision tree, Clustering and data granulation based on fuzzy rules. The main contents include: 1. A new decision tree based on fuzzy rules, fuzzy rule decision tree (FRDTT), is proposed. The association rule extraction algorithm is designed by using fuzzy consistency. The rule extraction algorithm AREA constructs a fuzzy rule decision tree. The traditional decision tree considers only one feature at each node. The proposed fuzzy rule decision tree considers a fuzzy rule composed of several features on each node. The fuzzy rule decision tree overcomes the problem that the oblique decision tree with hyperplane as the decision function has no semantic interpretation. Using UCI machine learning standard database. The data were studied experimentally. The performance of fuzzy rule decision tree is analyzed and compared with traditional decision tree C4.5, LADtree, BFTreeSimpleCart, NBTree. The statistical hypothesis test shows that the fuzzy rule decision tree is superior to the traditional decision tree in accuracy and tree scale. A new clustering method, AFS fuzzy clustering, is proposed under the framework of axiomatic fuzzy set theory. For each sample, fuzzy semantic set is selected. Secondly, using axiomatic fuzzy set theory, complex concepts are constructed according to the selected fuzzy semantics as the fuzzy description of each sample. Finally, Put the same or similar sample descriptions into the same class to form a fuzzy description of the class, And the clustering of sample data is realized according to class description. The interpretability of AFS fuzzy clustering algorithm is tested by the data of UCI machine learning standard database. And the clustering accuracy can be compared with other rule-based clustering algorithms and classical clustering algorithms FCM and K-means. 3. A fast data granulation method is proposed. The proposed unsupervised feature selection method is applied to select attributes. Next, fuzzy rules are constructed to describe the sample, and the canonical description is selected according to the importance of the sample description. Finally, Granulation of data can be realized by canonical description. The definition of sample description can be adjusted according to practical problems, which makes it easy to improve the granulation method. In order to deal with complex problems, the interpretability and validity of the proposed data granulation method are verified by the data of UCI machine learning standard database.
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:O159;TP311.13
【相似文獻】
相關(guān)期刊論文 前10條
1 王玲;基于知識發(fā)現(xiàn)的生物信息學(xué)[J];生物工程進展;2000年03期
2 劉兵;知識發(fā)現(xiàn)與數(shù)據(jù)開采(英文)[J];世界科技研究與發(fā)展;1997年06期
3 歐陽為民,鄭誠;一種改進的基于屬性歸約的知識發(fā)現(xiàn)方法[J];安徽大學(xué)學(xué)報(自然科學(xué)版);2000年03期
4 柴毅,黃席樾,李佳,涂運華,何離慶;基于數(shù)據(jù)統(tǒng)計分析的知識發(fā)現(xiàn)[J];高技術(shù)通訊;2001年11期
5 王軍勤;羅雁;;醫(yī)學(xué)中的信號、信息和知識[J];中國科技信息;2010年03期
6 陀向明;;圖書館知識發(fā)現(xiàn)系統(tǒng)應(yīng)用狀況分析[J];科技情報開發(fā)與經(jīng)濟;2013年16期
7 盧昌荊,史開泉,薛永生;知識過濾和它的依賴推理發(fā)現(xiàn)[J];廈門大學(xué)學(xué)報(自然科學(xué)版);2005年05期
8 楊炳儒;宋威;徐章艷;;基于內(nèi)在認(rèn)知機理的知識發(fā)現(xiàn)理論及其應(yīng)用[J];自然科學(xué)進展;2006年01期
9 楊碩妍;;國外知識發(fā)現(xiàn)研究進展可視化分析[J];科技管理研究;2014年07期
10 王寶英,王昆,張利萍,閆秀云;知識發(fā)現(xiàn)系統(tǒng)原型構(gòu)架的研究[J];河北省科學(xué)院學(xué)報;2004年02期
相關(guān)會議論文 前10條
1 楊光飛;黨延忠;;不完美數(shù)據(jù)中的知識發(fā)現(xiàn)研究綜述[A];第六屆(2011)中國管理學(xué)年會——商務(wù)智能分會場論文集[C];2011年
2 楊志豪;林鴻飛;;生物醫(yī)學(xué)文獻中的隱含知識發(fā)現(xiàn)[A];全國第八屆計算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
3 張文;唐錫晉;;知識發(fā)現(xiàn)與求知模式[A];管理科學(xué)與系統(tǒng)科學(xué)研究新進展——第8屆全國青年管理科學(xué)與系統(tǒng)科學(xué)學(xué)術(shù)會議論文集[C];2005年
4 萬家華;劉冰;江早;;知識發(fā)現(xiàn)中的可視化技術(shù)[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2000年
5 張榮明;鄒湘軍;顧邦軍;;面向資源服務(wù)的知識發(fā)現(xiàn)系統(tǒng)研究[A];企業(yè)應(yīng)用集成系統(tǒng)與技術(shù)學(xué)術(shù)研究會論文集[C];2006年
6 胡學(xué)鋼;郭駿;王浩;袁兆山;;基于粗集與基于格結(jié)構(gòu)的知識發(fā)現(xiàn)方法比較[A];全國第十四屆計算機科學(xué)及其在儀器儀表中的應(yīng)用學(xué)術(shù)交流會論文集[C];2001年
7 王春雨;顧軍華;;基于知識發(fā)現(xiàn)的公交客流分析平臺[A];全國第十屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)年會論文集[C];2006年
8 張世海;劉曉燕;涂慶;歐進萍;王光遠(yuǎn);;知識發(fā)現(xiàn)及其在高層結(jié)構(gòu)智能選型中應(yīng)用[A];計算機技術(shù)在工程建設(shè)中的應(yīng)用——第十二屆全國工程建設(shè)計算機應(yīng)用學(xué)術(shù)會議論文集[C];2004年
9 董伯儒;林少培;王永文;;工程建設(shè)MIS中的知識發(fā)現(xiàn)和深化[A];中國土木工程學(xué)會計算機應(yīng)用分會第七屆年會論文集[C];1999年
10 趙榮珍;楊娟;黃顯華;;粗糙集理論的故障知識發(fā)現(xiàn)及其工程應(yīng)用模式研究[A];第十二屆全國設(shè)備故障診斷學(xué)術(shù)會議論文集[C];2010年
相關(guān)重要報紙文章 前2條
1 陳志楠;挖掘“不為人知的藝術(shù)”[N];科技日報;2009年
2 本報記者 劉曉瑩;大數(shù)據(jù)時代下的新科研[N];科技日報;2014年
相關(guān)博士學(xué)位論文 前10條
1 王顯昌;基于模糊規(guī)則的知識發(fā)現(xiàn)與表示研究[D];大連理工大學(xué);2015年
2 李存榮;產(chǎn)品制造信息中的知識發(fā)現(xiàn)及其應(yīng)用研究[D];武漢理工大學(xué);2006年
3 封毅;中醫(yī)藥知識發(fā)現(xiàn)可靠性研究[D];浙江大學(xué);2008年
4 畢雪亮;基于知識發(fā)現(xiàn)的鉆井工程優(yōu)化理論及應(yīng)用[D];大慶石油學(xué)院;2007年
5 張國慶;基于生物醫(yī)學(xué)文獻的知識發(fā)現(xiàn)方法研究[D];華中科技大學(xué);2006年
6 祁瑞華;不完整數(shù)據(jù)分類知識發(fā)現(xiàn)算法研究[D];大連理工大學(xué);2011年
7 吳濤;構(gòu)造性知識發(fā)現(xiàn)方法研究[D];安徽大學(xué);2003年
8 蒙祖強;基于分類模型的知識發(fā)現(xiàn)機理和方法研究[D];中南大學(xué);2004年
9 朱正祥;領(lǐng)域驅(qū)動知識發(fā)現(xiàn)方法研究[D];大連理工大學(xué);2010年
10 梁協(xié)雄;數(shù)據(jù)庫中的知識發(fā)現(xiàn)及其應(yīng)用研究[D];重慶大學(xué);2004年
相關(guān)碩士學(xué)位論文 前10條
1 李洋;癌癥基因表達(dá)數(shù)據(jù)屬性偏序表示與知識發(fā)現(xiàn)[D];燕山大學(xué);2015年
2 宋巧云;基于電力系統(tǒng)大數(shù)據(jù)集的知識發(fā)現(xiàn)方法的研究與實現(xiàn)[D];濟南大學(xué);2015年
3 吳劍峰;大數(shù)據(jù)時代面向知識發(fā)現(xiàn)的網(wǎng)絡(luò)信息提取方法研究[D];安徽理工大學(xué);2016年
4 姚遠(yuǎn);基于情景分析的圖書館知識發(fā)現(xiàn)服務(wù)系統(tǒng)功能定位研究[D];江蘇大學(xué);2016年
5 王博妮;基于屬性偏序結(jié)構(gòu)原理的中藥近紅外光譜知識發(fā)現(xiàn)研究[D];燕山大學(xué);2016年
6 邊紅;醫(yī)學(xué)診斷系統(tǒng)中專家知識發(fā)現(xiàn)與推理算法研究[D];燕山大學(xué);2016年
7 張帥;基于屬性偏序原理的針灸有效點的知識發(fā)現(xiàn)與應(yīng)用研究[D];燕山大學(xué);2016年
8 劉敏;基于大數(shù)據(jù)知識發(fā)現(xiàn)的復(fù)雜機電設(shè)備維護研究與應(yīng)用[D];重慶大學(xué);2016年
9 孫鵬;知識發(fā)現(xiàn)在學(xué)科服務(wù)中的應(yīng)用研究[D];東北師范大學(xué);2010年
10 陳圣青;基于本體的知識發(fā)現(xiàn)系統(tǒng)框架研究[D];南京航空航天大學(xué);2009年
,本文編號:1567572
本文鏈接:http://sikaile.net/kejilunwen/yysx/1567572.html