基于鄰域粗糙集的屬性約簡算法研究及應(yīng)用
發(fā)布時間:2020-12-31 14:10
粗糙集理論是一種數(shù)據(jù)信息的處理工具,能幫助我們從海量數(shù)據(jù)中高效的挖掘、獲取出我們所需要的信息,在許多領(lǐng)域都得到廣泛應(yīng)用。但是經(jīng)典的粗糙集理論模型只適合處理離散型數(shù)據(jù),而在用其處理連續(xù)型數(shù)據(jù)時,需要先對數(shù)據(jù)離散化,這樣容易導(dǎo)致某些數(shù)據(jù)信息的丟失。為此鄰域粗糙集模型通過引入了鄰域;投攘靠臻g的概念,將粗糙集理論的等價關(guān)系轉(zhuǎn)化為鄰域空間上對信息粒子的覆蓋關(guān)系,可直接處理連續(xù)型數(shù)據(jù),避免了原粗糙集處理連續(xù)屬性帶來的信息丟失問題,擴(kuò)大模型的適用范圍。同時,由于鄰域粗糙集模型引入了鄰域粒化的計(jì)算,導(dǎo)致整體算法效率下降。本文主要是在現(xiàn)有鄰域粗糙集屬性約簡模型的基礎(chǔ)上,針對發(fā)現(xiàn)的問題,對其進(jìn)行改進(jìn),并通過實(shí)驗(yàn)加以驗(yàn)證。另外,本文將改進(jìn)的算法應(yīng)用到改進(jìn)的C4.5決策樹分類器模型中,對其進(jìn)行深入研究。本文主要工作如下:(1)對現(xiàn)有鄰域粗糙集屬性約簡算法進(jìn)行分析,針對現(xiàn)有算法中通過依賴度函數(shù)判斷屬性重要度來進(jìn)行屬性約簡時,存在重復(fù)冗余計(jì)算,導(dǎo)致算法復(fù)雜度高、計(jì)算量大。本文重新定義了屬性重要度的求解方法,降低了算法計(jì)算的復(fù)雜性。同時,為了減少屬性間的相關(guān)性對最終結(jié)果的影響,引入相關(guān)系數(shù)的有關(guān)知識,進(jìn)一步篩檢...
【文章來源】:青島大學(xué)山東省
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 選題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文的主要內(nèi)容和組織結(jié)構(gòu)
第二章 粗糙集理論基礎(chǔ)
2.1 經(jīng)典粗糙集理論基礎(chǔ)
2.2 鄰域粗糙集理論基礎(chǔ)
2.3 本章小結(jié)
第三章 基于鄰域粗糙集的屬性約簡算法
3.1 前向貪心數(shù)值屬性約簡算法
3.2 前向搜索屬性約簡快速算法
3.3 基于鄰域粗糙集的快速屬性約簡算法
3.4 本章小結(jié)
第四章 基于鄰域粗糙集屬性重要度的快速約簡算法
4.1 基于K近鄰屬性重要度和相關(guān)系數(shù)的屬性約簡算法
4.1.1 K近鄰屬性重要度
4.1.2 相關(guān)系數(shù)及其性質(zhì)
4.1.3 算法設(shè)計(jì)與實(shí)現(xiàn)
4.1.4 實(shí)驗(yàn)分析
4.2 基于Relief的快速屬性約簡算法
4.2.1 基于Relief的屬性重要度算法
4.2.2 基于Relief的快速屬性約簡算法
4.2.3 實(shí)驗(yàn)分析
4.3 本章小結(jié)
第五章 基于鄰域粗糙集的C4.5決策樹分類算法
5.1 基于鄰域粗糙集的C4.5決策樹分類算法
5.1.1 C4.5算法簡介
5.1.2 分裂屬性的選擇標(biāo)準(zhǔn)
5.1.3 連續(xù)屬性分割閾值的選擇方法
5.1.4 算法描述
5.2 實(shí)驗(yàn)分析
5.2.1 實(shí)驗(yàn)數(shù)據(jù)
5.2.2 實(shí)驗(yàn)結(jié)果
5.3 本章小結(jié)
第六章 總結(jié)與展望
參考文獻(xiàn)
攻讀學(xué)位期間的研究成果
致謝
本文編號:2949749
【文章來源】:青島大學(xué)山東省
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 選題背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文的主要內(nèi)容和組織結(jié)構(gòu)
第二章 粗糙集理論基礎(chǔ)
2.1 經(jīng)典粗糙集理論基礎(chǔ)
2.2 鄰域粗糙集理論基礎(chǔ)
2.3 本章小結(jié)
第三章 基于鄰域粗糙集的屬性約簡算法
3.1 前向貪心數(shù)值屬性約簡算法
3.2 前向搜索屬性約簡快速算法
3.3 基于鄰域粗糙集的快速屬性約簡算法
3.4 本章小結(jié)
第四章 基于鄰域粗糙集屬性重要度的快速約簡算法
4.1 基于K近鄰屬性重要度和相關(guān)系數(shù)的屬性約簡算法
4.1.1 K近鄰屬性重要度
4.1.2 相關(guān)系數(shù)及其性質(zhì)
4.1.3 算法設(shè)計(jì)與實(shí)現(xiàn)
4.1.4 實(shí)驗(yàn)分析
4.2 基于Relief的快速屬性約簡算法
4.2.1 基于Relief的屬性重要度算法
4.2.2 基于Relief的快速屬性約簡算法
4.2.3 實(shí)驗(yàn)分析
4.3 本章小結(jié)
第五章 基于鄰域粗糙集的C4.5決策樹分類算法
5.1 基于鄰域粗糙集的C4.5決策樹分類算法
5.1.1 C4.5算法簡介
5.1.2 分裂屬性的選擇標(biāo)準(zhǔn)
5.1.3 連續(xù)屬性分割閾值的選擇方法
5.1.4 算法描述
5.2 實(shí)驗(yàn)分析
5.2.1 實(shí)驗(yàn)數(shù)據(jù)
5.2.2 實(shí)驗(yàn)結(jié)果
5.3 本章小結(jié)
第六章 總結(jié)與展望
參考文獻(xiàn)
攻讀學(xué)位期間的研究成果
致謝
本文編號:2949749
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2949749.html
最近更新
教材專著