基于極大相容塊鄰域粗糙集特征選擇方法研究
發(fā)布時(shí)間:2020-12-06 01:41
信息技術(shù)的高速發(fā)展催生了大數(shù)據(jù)時(shí)代,人類(lèi)生產(chǎn)生活的各個(gè)領(lǐng)域數(shù)據(jù)海量增長(zhǎng)。數(shù)據(jù)特征的高維性是大數(shù)據(jù)的重要特性之一,給數(shù)據(jù)挖掘帶來(lái)了嚴(yán)峻挑戰(zhàn),特征選擇和特征抽取是數(shù)據(jù)降維的兩種主要途徑。與特征抽取相比,特征選擇可以保持?jǐn)?shù)據(jù)表示維度的原始語(yǔ)義,有利于數(shù)據(jù)挖掘結(jié)果的解釋。粗糙集理論是特征選擇的有力工具。鄰域粗糙集是經(jīng)典粗糙集模型的重要拓展之一,適宜于在距離空間中表示的高維數(shù)據(jù)特征選擇。針對(duì)數(shù)值型數(shù)據(jù),本文將極大相容塊概念與鄰域粗糙集相結(jié)合,建立了一種極大相容塊鄰域粗糙集模型,并將模型分別應(yīng)用于單標(biāo)記特征選擇和多標(biāo)記特征選擇問(wèn)題上,設(shè)計(jì)了相應(yīng)的特征選擇算法。論文的研究?jī)?nèi)容和結(jié)論如下:(1)基于極大相容塊鄰域粗糙集的單標(biāo)記特征選擇方法現(xiàn)有的鄰域粗糙集模型僅關(guān)注那些鄰域中所有樣本都屬于同一個(gè)決策類(lèi)的一致性情形,無(wú)法利用鄰域中與多個(gè)決策類(lèi)相交的邊界樣本所蘊(yùn)含的信息。針對(duì)這一局限性,將相容關(guān)系的極大相容塊與鄰域粗糙集相結(jié)合,選取樣本鄰域內(nèi)的最大等價(jià)塊作為最小的信息粒,通過(guò)重新定義鄰域粗糙集的上下近似和屬性重要度等概念,建立了極大相容塊鄰域粗糙集模型。該模型可在更小的信息粒度下將原來(lái)邊界樣本轉(zhuǎn)化成一致性樣...
【文章來(lái)源】:山西大學(xué)山西省
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3.1例3.1中烊本分布示意圖??
本文編號(hào):2900480
【文章來(lái)源】:山西大學(xué)山西省
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3.1例3.1中烊本分布示意圖??
本文編號(hào):2900480
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/2900480.html
最近更新
教材專(zhuān)著