Spark下的分布式粗糙集屬性約簡算法
發(fā)布時間:2021-01-19 13:17
屬性約簡(特征選擇)作為數(shù)據(jù)預(yù)處理的重要環(huán)節(jié),大多以屬性依賴作為篩選屬性子集的標準。設(shè)計了一種快速依賴計算方法 FDC,通過直接尋找基于相對正域的對象來計算依賴度,而不需要預(yù)先求出相對正域,相比傳統(tǒng)方法在速度上有明顯的性能提升。另外,改進鯨魚優(yōu)化算法(WOA)使其能夠有效應(yīng)用于粗糙集屬性約簡。結(jié)合上述兩個方法,提出一種基于Spark的分布式粗糙集屬性約簡算法SP-WOFRST,并在兩組人工合成的大數(shù)據(jù)集上與另一種基于Spark的粗糙集屬性約簡算法SP-RST進行對比實驗。實驗結(jié)果表明所提出的SP-WOFRST算法在精度和速度上均優(yōu)于SP-RST。
【文章來源】:計算機應(yīng)用. 2020,40(02)北大核心
【文章頁數(shù)】:6 頁
【文章目錄】:
0 引言
1 粗糙集與依賴度計算
1.1 粗糙集
1.2 依賴度計算
1.3 快速依賴計算
2 鯨魚優(yōu)化算法及其改進
2.1 鯨魚優(yōu)化算法
2.1.1 包圍獵物
2.1.2 泡泡網(wǎng)攻擊
2.1.3 搜索獵物
2.2 應(yīng)用與改進
3 SP-WOFRST算法
4 實驗結(jié)果與分析
4.1 數(shù)據(jù)集
4.2 實驗配置
4.3 度量標準
4.4 結(jié)果分析
5 結(jié)語
【參考文獻】:
期刊論文
[1]基于條件信息熵的決策表約簡[J]. 王國胤,于洪,楊大春. 計算機學報. 2002(07)
本文編號:2987060
【文章來源】:計算機應(yīng)用. 2020,40(02)北大核心
【文章頁數(shù)】:6 頁
【文章目錄】:
0 引言
1 粗糙集與依賴度計算
1.1 粗糙集
1.2 依賴度計算
1.3 快速依賴計算
2 鯨魚優(yōu)化算法及其改進
2.1 鯨魚優(yōu)化算法
2.1.1 包圍獵物
2.1.2 泡泡網(wǎng)攻擊
2.1.3 搜索獵物
2.2 應(yīng)用與改進
3 SP-WOFRST算法
4 實驗結(jié)果與分析
4.1 數(shù)據(jù)集
4.2 實驗配置
4.3 度量標準
4.4 結(jié)果分析
5 結(jié)語
【參考文獻】:
期刊論文
[1]基于條件信息熵的決策表約簡[J]. 王國胤,于洪,楊大春. 計算機學報. 2002(07)
本文編號:2987060
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2987060.html
最近更新
教材專著