基于模糊聚類和粗糙集的連續(xù)值屬性約簡研究
本文關鍵詞:基于模糊聚類和粗糙集的連續(xù)值屬性約簡研究
更多相關文章: 模糊聚類 粗糙集 屬性約簡 連續(xù)值決策表
【摘要】:屬性約簡是粗糙集理論的研究熱點之一,它是一種保證屬性分類能力不變的前提下,剔除冗余屬性的過程。通過屬性約簡,可以實現(xiàn)數(shù)據(jù)表的列壓縮,從而降低數(shù)據(jù)挖掘的數(shù)據(jù)量,提升挖掘效率。目前基于粗糙集的屬性約簡算法多數(shù)只適用于離散型數(shù)據(jù)。然而,在現(xiàn)實工作中,不僅有符號、類別等離散型數(shù)據(jù),更有大量的連續(xù)型數(shù)據(jù),甚至二者的混合。因此,在粗糙集屬性約簡算法的應用中,通常先對連續(xù)數(shù)據(jù)進行離散化處理。然而,離散化處理過程難以保存屬性在數(shù)值上的差異,難免造成一定程度的信息損失。因此本文深入研究以往文獻,提出了一種基于模糊聚類和粗糙集的連續(xù)值屬性約簡算法;谀:垲惡痛植诩倪B續(xù)值屬性約簡算法主要分為兩個部分:第一部分,引入模糊聚類,將屬性值上的模糊性轉(zhuǎn)化為對象關系的模糊性,并以此得到論域?qū)ο蟮膭澐?這部分相當于粗糙集屬性約簡中的等價類劃分;第二部分,同樣運用模糊聚類,將相似度貼近的屬性聚為一類,并從每一類中選擇代表性的屬性構成約簡屬性子集,而在屬性子集的評價上,結合了粗糙集依賴度的概念。通過模糊聚類和粗糙集結合算法得到的屬性約簡,綜合考慮了屬性的相異性與相關性,在保證屬性信息覆蓋廣度的同時,降低了約簡過程的信息損失,并在依賴度概念上保持了信息系統(tǒng)的分類能力不變。區(qū)別于以往粗糙集的啟發(fā)式屬性約簡算法,基于模糊聚類和粗糙集的屬性約簡不需要計算核屬性,也省去了逐層逐個計算屬性重要度的過程,因而在算法上有所提升。最后通過7組UCI標準數(shù)據(jù)集以及3組經(jīng)濟金融數(shù)據(jù)的仿真實驗,表明本文提出的算法有效,并且在進一步的決策樹分類中,基于約簡屬性的預測精度多數(shù)情況下高于全部條件屬性的預測精度。
【關鍵詞】:模糊聚類 粗糙集 屬性約簡 連續(xù)值決策表
【學位授予單位】:首都經(jīng)濟貿(mào)易大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:F224
【目錄】:
- 摘要4-5
- Abstract5-8
- 1 引言8-16
- 1.1 研究背景及意義8-9
- 1.2 屬性約簡的研究現(xiàn)狀9-12
- 1.2.1 粗糙集理論的屬性約簡9-11
- 1.2.2 模糊集理論的屬性約簡11-12
- 1.3 本文的主要工作與創(chuàng)新12-14
- 1.4 本文組織結構14-16
- 2 基于粗糙集的屬性約簡算法分析16-27
- 2.1 粗糙集的理論分析16-20
- 2.1.1 粗糙集理論16-18
- 2.1.2 決策表屬性約簡18-20
- 2.1.3 屬性選擇標準20
- 2.2 基于屬性重要性的啟發(fā)式屬性約簡算法20-25
- 2.2.1 啟發(fā)式屬性約簡算法20-21
- 2.2.2 基于Pawlak屬性重要度的屬性約簡算法21
- 2.2.3 基于差別矩陣的屬性約簡算法21-23
- 2.2.4 基于信息熵的屬性約簡算法23-25
- 2.3 粗糙集屬性約簡算法的局限性25-26
- 2.4 本章小結26-27
- 3 基于模糊聚類和粗糙集的屬性約簡27-39
- 3.1 模糊集理論27-29
- 3.2 模糊聚類技術分析29-34
- 3.3 基于模糊聚類和粗糙集的屬性約簡算法34-38
- 3.3.1 條件屬性的模糊聚類分析34-36
- 3.3.2 基于模糊聚類和粗糙集的屬性約簡36-38
- 3.4 本章小結38-39
- 4 連續(xù)值屬性約簡算法設計39-50
- 4.1 粗糙集與模糊聚類結合39-42
- 4.2 連續(xù)值屬性約簡算法設計與實現(xiàn)42-49
- 4.2.1 基于模糊聚類和粗糙集的連續(xù)型決策表對象離散化43-44
- 4.2.2 基于模糊聚類和粗糙集的連續(xù)值屬性約簡44-49
- 4.3 本章小結49-50
- 5 仿真實驗及分析50-55
- 5.1 數(shù)據(jù)準備與參數(shù)設定50-51
- 5.2 實驗結果分析51-54
- 5.3 本章小結54-55
- 6 總結與展望55-57
- 參考文獻57-61
- 附錄61-65
- 在學期間發(fā)表的學術論文和研究成果65-66
- 致謝66-67
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 譚耀武;;基于數(shù)據(jù)挖掘粗糙集技術的電信運營商客戶價值評價[J];沿海企業(yè)與科技;2006年01期
2 范霄文;郭惠英;;粗糙集理論的統(tǒng)計擴展及應用[J];統(tǒng)計與決策;2008年13期
3 劉昭斌;李金祥;劉文芝;;基于粗糙集的研究性學習的評價[J];管理觀察;2008年15期
4 梁如冰;蔡小娟;;粗糙集理論在水文水資源方面的應用現(xiàn)狀及展望[J];水利科技與經(jīng)濟;2009年12期
5 劉香怡;;粗糙集在教學質(zhì)量評價中的應用[J];中國管理信息化;2011年22期
6 于迎春;;覆蓋粗糙集中基于信息熵的幾個定義[J];商業(yè)文化(下半月);2012年02期
7 梁第;張銘麗;鄧偉;;粗糙集理論與其他理論結合的研究[J];山東省農(nóng)業(yè)管理干部學院學報;2012年02期
8 呂躍進;張旭娜;韋碧鵬;;基于優(yōu)勢關系粗糙集的模糊綜合評價的權重確定[J];統(tǒng)計與決策;2012年20期
9 劉超;吳洪波;;粗糙集理論及其在管理決策中的應用現(xiàn)狀[J];職業(yè)技術;2007年12期
10 駱公志;楊曉江;;基于劃分類歸并的粗糙集屬性約簡新算法[J];統(tǒng)計與決策;2009年20期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 黎文航;陳善本;王兵;;粗糙集理論在焊接中的應用綜述[A];第十一次全國焊接會議論文集(第2冊)[C];2005年
2 尹宗成;;粗糙集理論在我國糧食產(chǎn)量預測中的應用[A];現(xiàn)代農(nóng)業(yè)理論與實踐——安徽現(xiàn)代農(nóng)業(yè)博士科技論壇論文集[C];2007年
3 鄒剛;滕書華;孫即祥;陳森林;敖永紅;;一種粗糙集優(yōu)化協(xié)同原型模式約簡分類方法[A];第十四屆全國信號處理學術年會(CCSP-2009)論文集[C];2009年
4 葛麗;傅彥;;粗糙集在科學數(shù)據(jù)屬性約簡中的應用[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年
5 陳雪飛;;粗糙集分類中耦合數(shù)據(jù)的處理方法研究[A];2008年全國開放式分布與并行計算機學術會議論文集(上冊)[C];2008年
6 肖健梅;蘆曉明;王錫淮;;集裝箱起重機防搖系統(tǒng)粗糙集控制[A];第二十六屆中國控制會議論文集[C];2007年
7 王印松;馮康;;主汽溫調(diào)節(jié)系統(tǒng)性能評價的粗糙集實現(xiàn)方法[A];第二十七屆中國控制會議論文集[C];2008年
8 王紅萍;萬程亮;金彥豐;;應用粗糙集理論的對抗效果權重確定方法[A];2009’中國西部地區(qū)聲學學術交流會論文集[C];2009年
9 王莉;周獻中;;一種基于粗糙集的模糊神經(jīng)網(wǎng)絡模型在鋼材力學性能預測中的研究[A];2009年中國智能自動化會議論文集(第二分冊)[C];2009年
10 卓明;王麗珍;譚旭;;基于粗糙集近似集擴展的規(guī)則提取算法[A];第十七屆全國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2000年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 馬希驁;概率粗糙集屬性約簡理論及方法研究[D];西南交通大學;2014年
2 唐孝;基于粗糙集的知識發(fā)現(xiàn)方法及其在ECG信號識別中的應用[D];電子科技大學;2015年
3 曾凱;鄰域;植谟嬎愕年P鍵技術研究與應用[D];電子科技大學;2015年
4 鮑忠奎;面向不確定信息系統(tǒng)的粗糙集擴展模型研究[D];合肥工業(yè)大學;2015年
5 王永生;基于粗糙集理論的動態(tài)數(shù)據(jù)挖掘關鍵技術研究[D];北京科技大學;2016年
6 薛佩軍;正負域覆蓋廣義粗糙集與知識粗傳播研究[D];山東大學;2007年
7 孔芝;粗糙集理論若干問題的研究與應用[D];東北大學;2009年
8 秦中廣;基于粗糙集的交叉研究及其在中醫(yī)診斷的應用[D];華南理工大學;2002年
9 劉少輝;知識發(fā)現(xiàn)中粗糙集理論的研究[D];中國科學院研究生院(計算技術研究所);2003年
10 鄧大勇;基于粗糙集的數(shù)據(jù)約簡及粗糙集擴展模型的研究[D];北京交通大學;2007年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 江飛;粗糙集神經(jīng)網(wǎng)絡故障診斷方法研究[D];西安石油大學;2015年
2 何理榮;粗糙集理論在銀行信貸風險評估中的應用研究[D];華南理工大學;2015年
3 張德齊;基于粗糙集理論的電機故障診斷方法研究[D];渤海大學;2015年
4 楊禮;基于粗糙集的公路交通安全預警研究[D];西南交通大學;2015年
5 聶萌瑤;基于泛系串并模型的粗糙集概念擴展與拓撲空間[D];蘭州大學;2015年
6 徐鵬;基于粗糙集的建筑起重機械安全精細化評價研究[D];西安建筑科技大學;2015年
7 孫宇航;粗糙集屬性約簡方法在醫(yī)療診斷中的應用研究[D];蘇州大學;2015年
8 張曼;基于粗糙集和包含度的聚類分類算法研究[D];青島理工大學;2015年
9 車世遠;基于群搜索優(yōu)化粗糙集的腦科學數(shù)據(jù)研究[D];大連海事大學;2015年
10 林哲;基于粗糙集的馬田系統(tǒng)研究及其在銀行直接營銷客戶分類中的應用[D];南京理工大學;2015年
,本文編號:668445
本文鏈接:http://sikaile.net/jingjifazhanlunwen/668445.html