天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

基于GP算法的知識發(fā)現(xiàn)系統(tǒng)

發(fā)布時間:2014-07-29 21:04
在數(shù)據(jù)庫中發(fā)現(xiàn)有用的知識是數(shù)據(jù)挖掘(Data Mining, DM)的主要任務(wù),在一定的情況下,所有的數(shù)據(jù)庫查詢可以認(rèn)為是完成這項(xiàng)任務(wù)。我們現(xiàn)在有一套分析和探索數(shù)據(jù)的工具:SQL查詢、OLAP和數(shù)據(jù)挖掘技術(shù)。SQL查詢由關(guān)系代數(shù)所構(gòu)成;OLAP提供了建立在多維數(shù)據(jù)模型基礎(chǔ)上的高水平查詢;而數(shù)據(jù)挖掘提供了最抽象的數(shù)據(jù)分析操作。我們可以認(rèn)為不同的數(shù)據(jù)挖掘任務(wù)是在高水平上的復(fù)雜查詢。數(shù)據(jù)挖掘是機(jī)器學(xué)習(xí)和數(shù)據(jù)庫技術(shù)的交叉學(xué)科,DM系統(tǒng)的主要特點(diǎn)是:在數(shù)據(jù)庫中發(fā)現(xiàn)能夠用某些規(guī)則表述的、隱含的知識;與數(shù)據(jù)庫是緊密集成的;高度自動化的;對知識發(fā)現(xiàn)的處理是有效率的(尤其對大型數(shù)據(jù)庫)。

這里我們給出一種基于GP(Genetic Programming,遺傳編程)算法的知識發(fā)現(xiàn)系統(tǒng),和通常對數(shù)據(jù)庫的查詢不同的是,這個系統(tǒng)可對特定的對象集產(chǎn)生特定的查詢集,系統(tǒng)自動根據(jù)查詢集訪問數(shù)據(jù)庫,從而發(fā)掘出數(shù)據(jù)庫中隱含的知識。本文將對上述知識發(fā)掘過程進(jìn)行詳細(xì)描述,并提出了一種用遺傳編程(GP)來進(jìn)行數(shù)據(jù)挖掘的方法,GP個體由數(shù)據(jù)庫查詢組成,而這些查詢代表了高水平上的規(guī)則。

1 系統(tǒng)基本結(jié)構(gòu)
我們在[1]文給出的知識發(fā)現(xiàn)系統(tǒng)結(jié)構(gòu)基礎(chǔ)上加以改進(jìn),給出如圖1的基于GP算法的知識發(fā)現(xiàn)系統(tǒng)。

1.1 系統(tǒng)結(jié)構(gòu)描述
整個系統(tǒng)由GP引擎、OODBMS(Object-Oriented Database Management System,面向?qū)ο髷?shù)據(jù)庫管理系統(tǒng))、知識庫、DB接口和用戶接口組成。系統(tǒng)以一組對象、領(lǐng)域知識和模式信息作為輸入。根據(jù)所給輸入,GP引擎將產(chǎn)生許多隨機(jī)的查詢,系統(tǒng)將這些查詢應(yīng)用于OODBMS,OODBMS將返回其結(jié)果。系統(tǒng)用給定的輸入對該返回結(jié)果進(jìn)行評價,評價是計(jì)算個體查詢的適應(yīng)值的過程。那些能夠匹配所給對象集的查詢或查詢集將被選中,在沒有查詢能夠匹配所給對象集時,那么其最好的查詢將被選中。最后,將能夠最好地描述所給對象集特性的查詢作為輸出。

1.2 面向?qū)ο蟮臄?shù)據(jù)庫
這里,我們假定一個基于面向?qū)ο蠛秃瘮?shù)的數(shù)據(jù)庫模型(Object-Oriented and Functional Data Model, OOFDM),OOFDM具有面向?qū)ο蠛秃瘮?shù)數(shù)據(jù)模式的特性。這種模型要比傳統(tǒng)的關(guān)系數(shù)據(jù)庫模型在表達(dá)知識時更加逼近和容易。OOFDM的基本概念是"將感知到的真實(shí)世界作為相互關(guān)系對象的變量,并從不同的更細(xì)的層次上觀察這些對象。"[2]函數(shù)數(shù)據(jù)模型可以簡單地借助函數(shù)的數(shù)學(xué)符號來表示數(shù)據(jù)間的關(guān)系。每個類(或?qū)嶓w集)有自己的屬性和值,類與屬性間的關(guān)系是將類中的對象集映射到屬性域的一個函數(shù)。關(guān)系或逆關(guān)系組成了類間的連接。

1.3 查詢算子
我們使用下列查詢算子作為其面向?qū)ο髷?shù)據(jù)庫的查詢語言。
①SEL C-1 [(謂詞)] 該算子選擇所有屬于C-1且滿足謂詞的對象。C-1既可以是一個類名也可以是一個屬于C-1的查詢。謂詞是一個可選項(xiàng)。如果在這個算子里沒有謂詞,它將選擇該類中的所有對象。
②RES C-1 謂詞 該算子根據(jù)所給謂詞,限制給定集合的對象與另一個類的對象關(guān)聯(lián)。C-1和謂詞同SEL算子,但對于RES的謂詞屬性必須是關(guān)系型的屬性,而對于SEL算子謂詞屬性則必須是非關(guān)系型屬性。
③REL C-1 R-r Class-2 該算子選擇所有C-1中與C-2中對象有關(guān)聯(lián)的對象。這是一個通過R-r 將一個類C-1與另一個類C-2關(guān)聯(lián)起來的關(guān)系算子。R-r可以是一個通過C-1中定義的關(guān)系集中的關(guān)系屬性之一。C-1既可以是一個類名也可以是一個屬于C-1的查詢。C-2必須是一個類名或是一個屬于C-2的查詢,并且通過R-r關(guān)聯(lián)到另一個類C-1。
④G-REL C-1 R-r C-2 該算子是REL的逆算子,它選擇所有C-2中與C-1中對象有關(guān)聯(lián)的對象。C-1、C-2以及R-r的意義同REL算子。

2 GP算法
遺傳編程(GP)屬于進(jìn)化計(jì)算(Evolutionary Computation,EC)模型的一種。EC是一種借鑒自然界進(jìn)化機(jī)制而產(chǎn)生的并行隨機(jī)搜索算法。進(jìn)化算法的基本原理是選擇和改變,它區(qū)別于其他搜索方法有兩個顯著特征:首先這些算法都是基于種群(population)的;其次在種群中個體(indvidual)之間存在競爭。
為搜索特定的(感興趣的)查詢需要一種工具,這種工具可智能生成一組查詢并以它們是否能導(dǎo)出與用戶給定的同樣的對象集來進(jìn)行評價。GP算法對這一類問題是很實(shí)用的。

2.1 函數(shù)集與端點(diǎn)集
一般GP中可生成的程序集是使用者定義的函數(shù)集和端點(diǎn)集。表1給出了相應(yīng)的函數(shù)集和端點(diǎn)集,其中函數(shù)集由1.3中定義的查詢算子、邏輯運(yùn)算算子以及比較算子所組成。

函數(shù)集 {SEL,REL,G-REL,RES},{UNI,INT,DIF},{AND,OR,NOT}, {>,>=,筆耕文化傳播,=,<,<=} 端點(diǎn)集類集,屬性集,值集
表1 函數(shù)集和端點(diǎn)集

在我們的應(yīng)用中還有一些具有不同句法的查詢算子。每個算子具有不同的句法且假定的數(shù)據(jù)庫是面向?qū)ο蟮摹R虼,它具有為?chuàng)建個體而使用的特別的函數(shù)集(或算子集)和端點(diǎn)集。從而,構(gòu)成種群的所有個體的創(chuàng)建必然受到每個算子的約束[3]。約束可以是算子的句法和查詢的類型,或者是為創(chuàng)建查詢選擇適當(dāng)屬性值的領(lǐng)域知識。比較算子和邏輯算子只使用于查詢的謂詞。當(dāng)比較符號操作數(shù)時,僅使用'='。
端點(diǎn)集由CLASS-SET、SLOT-SET和VALUE-SET組成。CLASS-SET由1.2中定義的類名組成,SLOT-SET由每個類的所有屬性構(gòu)成,VALUE-SET由數(shù)值和符號值所構(gòu)成(它們均為屬性值)。數(shù)值由整型或?qū)嵭蛿?shù)構(gòu)成,其數(shù)值范圍由所用數(shù)據(jù)庫模式定義。符號值由字符串表示的符號屬性值構(gòu)成。

2.2 創(chuàng)建初始種群
為了創(chuàng)建一個個體(查詢),首先必須確定特定查詢所返回的對象類型。結(jié)果類型被選擇后,從所選類型返回例子的算子集中隨機(jī)地選擇一個算子,這個過程對查詢的每個參數(shù)遞歸地進(jìn)行。最初,那些句法正確的預(yù)定義數(shù)量的查詢被隨機(jī)地產(chǎn)生,形成初始種群。

2.3 選擇屬性值
由于可選擇范圍大,要從某個查詢的值集中選擇一個屬性值(數(shù)值或符號常數(shù))是相當(dāng)困難的。對于一個范圍為[1,10000]的整數(shù)集,隨機(jī)選到一個特定整數(shù)的概率僅為1/10000。而對于符號常數(shù),則需要很強(qiáng)的背景知識。因此,我們僅就發(fā)生在數(shù)據(jù)庫里的范圍選擇屬性值。

2.4 繁殖新一代種群
每個個體用預(yù)定義的適應(yīng)函數(shù)來進(jìn)行評價。較適應(yīng)的查詢有較高的概率被選來繁殖新種群,這個過程用三個遺傳算子:選擇、雜交和變異來完成。為了產(chǎn)生下一代,選擇算子根據(jù)個體的適應(yīng)值來選擇個體。我們用一個樹來表示一個查詢,雜交算子用交換兩個父輩的子樹來創(chuàng)建兩個后代。變異算子用一個新的子樹來代替一個父輩的子樹,從而產(chǎn)生一個新的后代。選擇-雜交-變異循環(huán)反復(fù)地進(jìn)行直到終止標(biāo)準(zhǔn)被滿足。

2.5 評價(適應(yīng)函數(shù)測量)
我們使用如下的適應(yīng)函數(shù)f來評價種群中的個體查詢i :
f ( ni , hi ) = T - ( hi * hi ) / ni ,
其中:ni > 0 , T ≥ hi , 且 i = 1 ,2 ,… ,種群的大。═是被確定的對象集的勢,hi是一個個體查詢i 被選中的次數(shù),ni是查詢 i 結(jié)果集的勢)。
上述適應(yīng)函數(shù)依賴于hi和ni ,如果一個查詢沒有被選中(hi=0),則函數(shù)的值為T,這是最差的一個適應(yīng)值。另一方面,如果查詢結(jié)果能夠很好地匹配提交給系統(tǒng)的對象集,那么它的適應(yīng)值為0(在這種情況下hi = ni = T )。如果種群中出現(xiàn)個體適應(yīng)值遠(yuǎn)遠(yuǎn)超過種群平均適應(yīng)值,該個體很快就會在群體中占有絕對的比例,從而出現(xiàn)過早收斂的現(xiàn)象。另一方面,在搜索過程的后期,群體的平均適應(yīng)值可能會接近群體的最優(yōu)適應(yīng)值,從而導(dǎo)致搜索目標(biāo)難以得到改善,出現(xiàn)停滯現(xiàn)象[4]。為了防止上述情況的發(fā)生,我們將對一個個體查詢的例子個數(shù) ni 作為分母。

3 一個例子
我們首先給出一個如表2所示的模擬"售后質(zhì)量管理函數(shù)數(shù)據(jù)庫",用它來代表一個基于OOFDM的面向?qū)ο髷?shù)據(jù)庫,它包含了客戶及其相關(guān)的信息。表3說明了類間的相互聯(lián)系。

類屬性值 客戶代碼、電話、名稱、地址、類別、地區(qū)、委托、購買 代理商代碼、名稱、地址、電話、信譽(yù)等級 產(chǎn)品名稱、編號、出廠日期、購買日期、檢驗(yàn)員 維修記錄問題、維修時間、維修次數(shù)、維修員 使用培訓(xùn)否、技術(shù)力量 質(zhì)量問題外觀、電器、機(jī)械、裝配
表2 售后質(zhì)量管理數(shù)據(jù)庫

類客戶代理商產(chǎn)品維修記錄使用質(zhì)量問題 客戶   + +   +   代理商 +           產(chǎn)品 +       + + 維修記錄           + 使用 +   +       質(zhì)量問題     + +    
表3 類間的連接表

3.1 問題的提出
根據(jù)質(zhì)量管理部門反映,有兩個客戶反饋的產(chǎn)品質(zhì)量問題較為嚴(yán)重,我們希望通過對數(shù)據(jù)庫的查詢來找出這兩個客戶在購買的產(chǎn)品及使用上所具有的共性。



本文編號:6515

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/6515.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶86065***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日韩精品福利在线观看| 美女被草的视频在线观看| 日本欧美一区二区三区高清| 中文文精品字幕一区二区| 国产一区二区三区成人精品| 亚洲精品偷拍视频免费观看| 日韩特级黄片免费观看| 国产又粗又黄又爽又硬的| 中文字幕不卡欧美在线| 日韩精品区欧美在线一区| 欧美极品欧美精品欧美| 五月天六月激情联盟网| 丰满少妇高潮一区二区| 在线亚洲成人中文字幕高清| 韩国日本欧美国产三级| 国产精品国三级国产专不卡| 国产一区二区三区香蕉av| 欧美国产日韩变态另类在线看| 国产精品夜色一区二区三区不卡| 欧美日韩国产综合特黄| 欧美精品在线观看国产| 免费在线成人激情视频| 老外那个很粗大做起来很爽| 亚洲国产另类久久精品| 91人人妻人人爽人人狠狠| 日韩精品一区二区三区含羞含羞草| 中字幕一区二区三区久久蜜桃| 夜夜嗨激情五月天精品| 欧美日韩综合在线第一页| 日韩日韩日韩日韩在线| 日韩中文无线码在线视频| 国产麻豆视频一二三区| 日韩不卡一区二区在线| 中文字幕欧美精品人妻一区| 久久国产亚洲精品成人| 91亚洲精品综合久久| 欧美日韩一区二区午夜| 亚洲欧美国产中文色妇| 日韩国产亚洲欧美激情| 亚洲中文字幕一区三区| 欧美成人高清在线播放|