針對(duì)流特征的動(dòng)態(tài)特征選擇算法研究
發(fā)布時(shí)間:2021-03-16 10:41
大數(shù)據(jù)的高速發(fā)展,使特征選擇技術(shù)面臨著新的數(shù)據(jù)類型的挑戰(zhàn),類型之一的是流特征。流特征是指數(shù)據(jù)的樣本空間固定不變,特征空間隨時(shí)間而增大,特征逐個(gè)流入特征空間的場(chǎng)景,其難點(diǎn)在于流特征所在的高維數(shù)據(jù)空間呈現(xiàn)動(dòng)態(tài)性,即特征空間不是或不能事先給定,而是隨時(shí)間動(dòng)態(tài)變化,因而特征空間呈未知性和演化性。盡管目前已經(jīng)有許多針對(duì)流特征的特征選擇算法的出現(xiàn),但它們?nèi)匀淮嬖谥┰S不足和缺點(diǎn)。首先,針對(duì)目前的流特征選擇算法一旦認(rèn)定特征是冗余的,則會(huì)剔除該特征,忽略了在流特征背景下被刪除的冗余特征仍然可能對(duì)任務(wù)性能提升起到作用這一現(xiàn)象。本文提出了一種基于一個(gè)大小固定的緩沖池的在線流特征選擇算法。緩沖池技術(shù)已廣泛應(yīng)用于流樣本領(lǐng)域,本文將此應(yīng)用在流特征上以解決上述問(wèn)題。具體而言,算法通過(guò)緩沖池動(dòng)態(tài)地保留和恢復(fù)特征來(lái)處理變化的特征空間,并結(jié)合了兩種不同類型的特征選擇器以提高預(yù)測(cè)表現(xiàn)的同時(shí)壓縮特征空間。最終,將本文提出了的算法在12個(gè)典型的特征選擇數(shù)據(jù)集上與現(xiàn)有流特征選擇對(duì)比,表明了該算法能夠獲得更加優(yōu)異的分類精度和空間壓縮率。其次,Grafting算法是基于稀疏正則化約束的流特征選擇經(jīng)典算法。針對(duì)Grafting的諸多...
【文章來(lái)源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
UCI機(jī)器學(xué)習(xí)倉(cāng)庫(kù)中近30年的數(shù)據(jù)樣本和維度增長(zhǎng)趨勢(shì)圖
特征按相關(guān)性劃分從特征與類別和特征相互之間的相關(guān)性角度,可以將特征劃分為無(wú)關(guān)特征,弱相關(guān)[8]
監(jiān)督特征選擇基本框架
【參考文獻(xiàn)】:
期刊論文
[1]基于?2,1范數(shù)的在線流特征選擇算法[J]. 吳中華,鄭瑋. 計(jì)算機(jī)與數(shù)字工程. 2019(06)
博士論文
[1]流特征下的在線知識(shí)發(fā)現(xiàn)研究[D]. 俞奎.合肥工業(yè)大學(xué) 2013
本文編號(hào):3085914
【文章來(lái)源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:66 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
UCI機(jī)器學(xué)習(xí)倉(cāng)庫(kù)中近30年的數(shù)據(jù)樣本和維度增長(zhǎng)趨勢(shì)圖
特征按相關(guān)性劃分從特征與類別和特征相互之間的相關(guān)性角度,可以將特征劃分為無(wú)關(guān)特征,弱相關(guān)[8]
監(jiān)督特征選擇基本框架
【參考文獻(xiàn)】:
期刊論文
[1]基于?2,1范數(shù)的在線流特征選擇算法[J]. 吳中華,鄭瑋. 計(jì)算機(jī)與數(shù)字工程. 2019(06)
博士論文
[1]流特征下的在線知識(shí)發(fā)現(xiàn)研究[D]. 俞奎.合肥工業(yè)大學(xué) 2013
本文編號(hào):3085914
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3085914.html
最近更新
教材專著