針對流特征的動態(tài)特征選擇算法研究
發(fā)布時間:2021-03-16 10:41
大數(shù)據(jù)的高速發(fā)展,使特征選擇技術(shù)面臨著新的數(shù)據(jù)類型的挑戰(zhàn),類型之一的是流特征。流特征是指數(shù)據(jù)的樣本空間固定不變,特征空間隨時間而增大,特征逐個流入特征空間的場景,其難點在于流特征所在的高維數(shù)據(jù)空間呈現(xiàn)動態(tài)性,即特征空間不是或不能事先給定,而是隨時間動態(tài)變化,因而特征空間呈未知性和演化性。盡管目前已經(jīng)有許多針對流特征的特征選擇算法的出現(xiàn),但它們?nèi)匀淮嬖谥┰S不足和缺點。首先,針對目前的流特征選擇算法一旦認定特征是冗余的,則會剔除該特征,忽略了在流特征背景下被刪除的冗余特征仍然可能對任務(wù)性能提升起到作用這一現(xiàn)象。本文提出了一種基于一個大小固定的緩沖池的在線流特征選擇算法。緩沖池技術(shù)已廣泛應(yīng)用于流樣本領(lǐng)域,本文將此應(yīng)用在流特征上以解決上述問題。具體而言,算法通過緩沖池動態(tài)地保留和恢復(fù)特征來處理變化的特征空間,并結(jié)合了兩種不同類型的特征選擇器以提高預(yù)測表現(xiàn)的同時壓縮特征空間。最終,將本文提出了的算法在12個典型的特征選擇數(shù)據(jù)集上與現(xiàn)有流特征選擇對比,表明了該算法能夠獲得更加優(yōu)異的分類精度和空間壓縮率。其次,Grafting算法是基于稀疏正則化約束的流特征選擇經(jīng)典算法。針對Grafting的諸多...
【文章來源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
UCI機器學(xué)習(xí)倉庫中近30年的數(shù)據(jù)樣本和維度增長趨勢圖
特征按相關(guān)性劃分從特征與類別和特征相互之間的相關(guān)性角度,可以將特征劃分為無關(guān)特征,弱相關(guān)[8]
監(jiān)督特征選擇基本框架
【參考文獻】:
期刊論文
[1]基于?2,1范數(shù)的在線流特征選擇算法[J]. 吳中華,鄭瑋. 計算機與數(shù)字工程. 2019(06)
博士論文
[1]流特征下的在線知識發(fā)現(xiàn)研究[D]. 俞奎.合肥工業(yè)大學(xué) 2013
本文編號:3085914
【文章來源】:南京理工大學(xué)江蘇省 211工程院校
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【部分圖文】:
UCI機器學(xué)習(xí)倉庫中近30年的數(shù)據(jù)樣本和維度增長趨勢圖
特征按相關(guān)性劃分從特征與類別和特征相互之間的相關(guān)性角度,可以將特征劃分為無關(guān)特征,弱相關(guān)[8]
監(jiān)督特征選擇基本框架
【參考文獻】:
期刊論文
[1]基于?2,1范數(shù)的在線流特征選擇算法[J]. 吳中華,鄭瑋. 計算機與數(shù)字工程. 2019(06)
博士論文
[1]流特征下的在線知識發(fā)現(xiàn)研究[D]. 俞奎.合肥工業(yè)大學(xué) 2013
本文編號:3085914
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3085914.html
最近更新
教材專著