天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

基于模糊理論的知識發(fā)現(xiàn)方法研究及其應(yīng)用

發(fā)布時間:2020-03-24 13:49
【摘要】:隨著信息技術(shù)的飛速發(fā)展,以知識發(fā)現(xiàn)為核心的數(shù)據(jù)驅(qū)動型發(fā)展模式正推動經(jīng)濟(jì)社會各領(lǐng)域從數(shù)字化、網(wǎng)絡(luò)化向智能化加速轉(zhuǎn)變。模糊理論作為一種天然的“數(shù)據(jù)知識轉(zhuǎn)換器”,能夠在一定程度上模擬人的推理關(guān)系,通過其特有的語義化和可解釋的模糊規(guī)則可以直觀地描述復(fù)雜數(shù)據(jù)中潛在有用的知識。本文首先從應(yīng)用角度出發(fā),對模糊規(guī)則系統(tǒng)中的經(jīng)典Wang-Mendel方法做出必要的改進(jìn),并在其基礎(chǔ)上提出了一種多民族面部特征的語義描述方法,以及該方法在人臉民族屬性識別中的應(yīng)用。然后總結(jié)了傳統(tǒng)模糊集理論在知識發(fā)現(xiàn)的實際應(yīng)用中存在的弱點,通過引入公理模糊集理論,并與譜聚類和隨機權(quán)重神經(jīng)網(wǎng)絡(luò)等理論進(jìn)行有機結(jié)合,針對知識發(fā)現(xiàn)領(lǐng)域中最主要的聚類和分類任務(wù)分別提出了新穎的解決方案。主要研究工作包括:(1)針對模糊規(guī)則系統(tǒng)中的Wang-Mendel方法在提取規(guī)則的完備性和算法的魯棒性上存在的問題,本文進(jìn)行了相應(yīng)的改進(jìn),并以此為基礎(chǔ)提出了一種多民族人臉面部特征的語義描述方法。該方法首先利用人臉特征點定位技術(shù)自動提取用于刻畫人臉外觀的特征點。然后借鑒人類學(xué)在面部形態(tài)方面的已有成果,在這些特征點的基礎(chǔ)上定義了距離、周長和面積等幾何特征。最后利用改進(jìn)的Wang-Mendel方法從幾何特征數(shù)據(jù)集中提取用于描述各民族面部形態(tài)特點的語義規(guī)則。這些語義規(guī)則還可以用于實現(xiàn)人臉民族屬性識別,通過與樸素貝葉斯、C4.5、決策表、隨機森林、Adaboost和Logistic回歸等分類方法在中國民族人臉數(shù)據(jù)庫的8個數(shù)據(jù)集上的對比實驗,本文提出的方法既可以得到具有競爭力的分類準(zhǔn)確率,還可以為人類學(xué)領(lǐng)域?qū)<姨峁┍阌诶斫獾恼Z義解釋。(2)譜聚類算法因其在非凸數(shù)據(jù)集上的出色聚類能力,近年來已成為應(yīng)用最廣泛的聚類算法之一。但是現(xiàn)有的譜聚類方法在構(gòu)建相似性矩陣時對參數(shù)設(shè)定非常敏感,這嚴(yán)重影響了算法對于噪聲數(shù)據(jù)的魯棒性。而且在信用評估或醫(yī)療診斷等領(lǐng)域,知識發(fā)現(xiàn)過程要求模型的輸出結(jié)果必須是可理解的。為了使譜聚類算法在聚類準(zhǔn)確率和聚類結(jié)果的可解釋性上做出合理的權(quán)衡,本文提出了一種融合譜聚類和公理模糊集理論的聚類方法,該方法整合了公理模糊集在概念提取和語義表示方面的能力和譜聚類對數(shù)據(jù)集的分布形狀沒有要求的優(yōu)勢。通過與傳統(tǒng)的譜聚類算法和其他類型的聚類算法在17個UCI數(shù)據(jù)集上的對比實驗表明,本文提出的方法可以有效地識別出數(shù)據(jù)中的類簇,并為這些類簇給出接近自然語言的模糊描述。(3)融合公理模糊集理論和隨機權(quán)重神經(jīng)網(wǎng)絡(luò)兩種理論工具的特點,本文提出了一種可以對結(jié)果進(jìn)行語義解釋的分類方法。該方法將基于公理模糊集理論構(gòu)建的一致性隸屬函數(shù)整合進(jìn)隨機權(quán)重網(wǎng)絡(luò)的隱含節(jié)點之中。隨機權(quán)重神經(jīng)網(wǎng)絡(luò)的輸入權(quán)重由隨機分配的方式確定,正是受這一思想啟發(fā),本文隨機生成特征、簡單概念和復(fù)雜概念之間的關(guān)系。隱含節(jié)點內(nèi)的復(fù)雜概念由隨機選取的簡單概念通過公理模糊集理論中的邏輯運算組合形成。在傳統(tǒng)的基于公理模糊集理論的分類方法中,適合描述目標(biāo)類別的復(fù)雜概念需要采用調(diào)節(jié)約束條件的參數(shù)來獲得,這個過程需要大量的計算時間,而在本文提出的算法中,神經(jīng)網(wǎng)絡(luò)的輸出權(quán)重被用來評估復(fù)雜概念對于每個目標(biāo)類別的適用程度。與其它基于神經(jīng)網(wǎng)絡(luò)的分類方法相比,本文提出的方法可利用隱含節(jié)點中的模糊概念為目標(biāo)類別形成容易被人理解的語義解釋,克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型存在的“黑盒”問題。在實驗分析部分,我們將本文的方法與Ensemble、EvRBFN、NNEP、LVQ和iRProp+等5種基于神經(jīng)網(wǎng)絡(luò)的分類器在10個UCI數(shù)據(jù)集上的分類結(jié)果進(jìn)行對比發(fā)現(xiàn),本文的方法在具有良好分類能力的同時,還可以對分類結(jié)果進(jìn)行直觀地描述。
【圖文】:

機器學(xué)習(xí),知識發(fā)現(xiàn)


于知識發(fā)現(xiàn)的定義是由Fayyad[1l等人提出的,知識發(fā)現(xiàn)是指從大量數(shù)據(jù)中提取有效的、逡逑新穎的、潛在有用的、最終可被理解的模式的非平凡過程。所謂非平凡過程是指具有一逡逑定程度的智能性和自動性,而不僅僅是簡單的數(shù)值統(tǒng)計和計算,圖1.1給出了這一過程逡逑的具體步驟。從宏觀的角度上看,知識發(fā)現(xiàn)的過程主要分為四個步驟,即數(shù)據(jù)篩選、數(shù)逡逑據(jù)預(yù)處理與變換、數(shù)據(jù)挖掘和結(jié)果的可視化與評估。在這些步驟中,數(shù)據(jù)挖掘是該過程逡逑的核心,它決定了整個知識發(fā)現(xiàn)過程的效果。逡逑原始數(shù)據(jù)邐目標(biāo)數(shù)據(jù)邐變換后的數(shù)據(jù)邐模型/規(guī)則邐可理解的知識逡逑^邋^吻晶逡逑數(shù)據(jù)篩選邐數(shù)據(jù)預(yù)處理與變換邐數(shù)據(jù)挖掘邐可視化與評估逡逑圖U知識發(fā)現(xiàn)的過程逡逑Figure邋1.1邋The邋process邋of邋knowledge邋discovery逡逑從挖掘任務(wù)的角度來看,數(shù)據(jù)挖掘可分為聚類、分類、關(guān)聯(lián)規(guī)則挖掘、序列模式挖逡逑掘、回歸和異常檢測等方向[2]。實現(xiàn)這些挖掘任務(wù)可采用的方法包括統(tǒng)計方法、機器學(xué)逡逑習(xí)方法和數(shù)據(jù)庫方法等。在過去的幾十年間,機器學(xué)習(xí)已經(jīng)成為智能數(shù)據(jù)分析技術(shù)的創(chuàng)逡逑新源泉[3],被學(xué)術(shù)界和工業(yè)界認(rèn)為是知識發(fā)現(xiàn)領(lǐng)域最重要的工具,圖1.2總結(jié)了目前較為逡逑-1邋-逡逑

過程圖,過程,子集,描述性


在很多科學(xué)和商業(yè)領(lǐng)域,我們要分析的數(shù)據(jù)往往是非常復(fù)雜的,它們并不滿足一個逡逑特定參數(shù)的概率分布。知識發(fā)現(xiàn)始于對這種復(fù)雜性的探索,并從數(shù)據(jù)中發(fā)現(xiàn)隱含的模逡逑式。盡管圖1.1給出的知識發(fā)現(xiàn)過程中包含數(shù)據(jù)清洗的環(huán)節(jié),但經(jīng)過該步驟處理后的數(shù)逡逑據(jù)仍然是非常復(fù)雜的。描述性數(shù)據(jù)挖掘可以降低數(shù)據(jù)的復(fù)雜性并對數(shù)據(jù)分析結(jié)果給出合逡逑理的解釋,而聚類分析是描述性非監(jiān)督數(shù)據(jù)挖掘的主要方法。逡逑聚類算法的目的是將由凡個樣本數(shù)據(jù)組成的數(shù)據(jù)集X邋=邋{a,劃分成逡逑凡個不相交的子集(71,6<2,...,(^(;5義。每個子集被稱為簇,構(gòu)成簇的樣本之間盡可逡逑能相似,且與其它簇內(nèi)的樣本盡可能不相似:逡逑x邐…LJc—,g邐=邋0,以邋j邐(u)逡逑每個簇代表了原始數(shù)據(jù)中存在共性的一個子集,例如天文數(shù)據(jù)中的一個星系或市場營銷逡逑中的一個消費者群體,而表示離群點集合。如圖1.4所示,,Xu[<)]等人將聚類的過逡逑程概括為以下四個方面:逡逑邐^邋特征提取與特征邋邐?聚類算法設(shè)計或逡逑選擇邐^邐邋選擇逡逑mm:邐||逡逑I?邋^邐邋聚類結(jié)果評估邐考邋?邐解釋聚類結(jié)果逡逑知識逡逑圖1.4聚類的過程逡逑Figure邋1.4邋The邋proc
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:O159;TP18

【參考文獻(xiàn)】

相關(guān)期刊論文 前4條

1 汪海燕;黎建輝;楊風(fēng)雷;;支持向量機理論及算法研究綜述[J];計算機應(yīng)用研究;2014年05期

2 王永富;王殿輝;柴天佑;;一個具有完備性和魯棒性的模糊規(guī)則提取算法[J];自動化學(xué)報;2010年09期

3 張麗娟;李舟軍;;分類方法的新發(fā)展:研究綜述[J];計算機科學(xué);2006年10期

4 劉曉東,張慶靈;模糊概念的EI代數(shù)分解[J];模糊系統(tǒng)與數(shù)學(xué);2002年02期



本文編號:2598409

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2598409.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶12d41***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com