基于粒度計算模型的數據挖掘方法研究
發(fā)布時間:2024-03-03 22:35
數據挖掘(Data Mining),就是從大量數據中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過程。分類是一類重要的數據挖掘問題,在商業(yè)領域中有著廣泛的應用前景。首先從數據中選出已經分好類的訓練集,在該訓練集上運用數據挖掘分類的技術,建立分類模型,對于沒有分類的數據進行分類。 粒度計算的思想產生于20世紀70年代,它的基本思想是模仿人類思考問題的方式:人類在思考和解決同一個問題時,或者是先從總體到局部進行觀察、收集、分析各方面的情況;或者反之,從局部到總體收集數據;或者從各個角度對問題進行不同方面的了解,最后對它們進行綜合分析。近年來,人們開始將粒度計算應用到數據挖掘領域中,并初步取得了一些成果,成為當前數據挖掘領域一個新的研究方向。 本文首先綜述了數據挖掘的原理和現狀,從數據挖掘和知識分類的角度,以粗糙集理論為基礎,在粒度計算方法框架下,借鑒已有的軟計算理論成果,做了一些相關的研究,主要的研究內容包括: (1)研究了基于決策樹模型的信息系統(tǒng)分類問題。以粗糙集理論為基礎,結合知識關系具有粒度性質的原理,從條件屬性集和決策屬性集之間關聯(lián)度來選擇決策屬性集,從而定義了粒度商的...
【文章頁數】:69 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3918457
【文章頁數】:69 頁
【學位級別】:碩士
【部分圖文】:
圖2.1集合X的正區(qū)域、負區(qū)域和邊界區(qū)域丑NR(x)為集合的上近似與下近似之差
RX口NE吼(x卜U。集合x關于R的邊界區(qū)域定義為:丑N孟(X)=RX一鮮一個集合XgU的下近似和上近似,將論域U劃分為三個不相交的區(qū)域:正區(qū)域尸。£,(x)、負區(qū)域NE吼(X)、和邊界區(qū)域刀ND,(x),如圖2.1所示。;;;鬢纓鬢鬢鬢黝瓢蘸....
圖4.IX選粗粒度Rn圖4.ZX選細粒度Rn一1
江蘇大學高校教師碩士學位論文對于粗糙集x,我們首先選擇一個較粗的粒度R:(如圖4.1),計算x的正域POS。(x)和邊界域朋凡(x),若在當前的知識體系之下,PoS。(x)己經能夠精細表達,無需進一步的操作,我們只需考慮尚不能精確表達的x的朋凡(x),對邊界中諸元素,我們可以適當....
本文編號:3918457
本文鏈接:http://sikaile.net/falvlunwen/sflw/3918457.html