基于代價(jià)敏感的特征選擇算法研究及應(yīng)用
【圖文】:
圖 1-1 特征選擇的基本框架如圖 1-1 所示,目前的特征選擇算法是一套包含了多種方法與策略的框架,其中包含了特征評(píng)價(jià)指標(biāo)、特征搜索過程、搜索停止準(zhǔn)則、驗(yàn)證評(píng)估方法等多個(gè)內(nèi)容[30]。一般的特征選擇所需步驟如下所述:1、首先,使用特征評(píng)價(jià)指標(biāo)對(duì)單個(gè)特征或特征子集的有效性進(jìn)行評(píng)價(jià)。在這一步驟中,用到的評(píng)價(jià)指標(biāo)計(jì)算方式有:方差分析、互信息、卡方檢驗(yàn)、分類器的分類正確率等。按照評(píng)價(jià)指標(biāo)的原理和作用范圍,可將特征選擇方法分為過濾式(Filter)、包裹式(Wrapper)、嵌入式(Embedded)等。2、然后,基于評(píng)價(jià)指標(biāo)制定一定的搜索策略,尋找最優(yōu)的特征子集,在這一部分中根據(jù)其搜索方法又可以分為窮舉、啟發(fā)式增刪、隨機(jī)選擇等策略。例如窮舉搜索中的廣度優(yōu)先搜索、深度優(yōu)先搜索,以及啟發(fā)式搜索中的序列前向搜索、序列后向搜索、遺傳算法等。3、搜索停止準(zhǔn)則是在搜索過程中,根據(jù)一定的指標(biāo)停止搜索過程。例如選擇的特征數(shù)目達(dá)到指定數(shù)目、特征評(píng)價(jià)指標(biāo)達(dá)到指定閾值等。
蘭州大學(xué)碩士學(xué)位論文 基于代價(jià)敏感的特征選擇算法研究及應(yīng)用要么陷入局部最優(yōu)導(dǎo)致過擬合,要么無法進(jìn)行有效尋優(yōu)導(dǎo)致在驗(yàn)證集和測(cè)試集上分類正確率很低。要在單個(gè)模型上同時(shí)解決這兩個(gè)問題是非常困難的。因此,可以考慮退而求其次,通過劃分?jǐn)?shù)據(jù),用各個(gè)部分的數(shù)據(jù)子集所包含的信息去訓(xùn)練多個(gè)模型[41]。一個(gè)很可能的結(jié)果是,每一個(gè)模型都擁有各自的優(yōu)缺點(diǎn),且因?yàn)槊恳粋(gè)模型所用的訓(xùn)練數(shù)據(jù)各不相同,它們的優(yōu)點(diǎn)之間是可以互相彌補(bǔ)的。然后,根據(jù)一定的融合策略,如加權(quán)、投票等,將每個(gè)模型組合在一起,得到最終的模型。其基本框架如圖 2-1 所示所示。在這過程中,每一個(gè)分類器被稱為基學(xué)習(xí)器。基學(xué)習(xí)器在一定集成提升策略下,,共同構(gòu)成一個(gè)集成學(xué)習(xí)模型。
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP181;R749.4
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吳中華;鄭瑋;;基于?_(2,1)范數(shù)的在線流特征選擇算法[J];計(jì)算機(jī)與數(shù)字工程;2019年06期
2 代琨;于宏毅;馬學(xué)剛;李青;;基于支持向量機(jī)的特征選擇算法綜述[J];信息工程大學(xué)學(xué)報(bào);2014年01期
3 陳建華;王治和;蔣蕓;許虎寅;樊東輝;;一種改進(jìn)的文本分類特征選擇算法[J];微電子學(xué)與計(jì)算機(jī);2011年12期
4 張文靜;王備戰(zhàn);張志宏;;基于圖的特征選擇算法綜述[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2017年01期
5 孫剛;張靖;;面向高維微陣列數(shù)據(jù)的集成特征選擇算法[J];計(jì)算機(jī)工程與科學(xué);2016年07期
6 張自敏;;大數(shù)據(jù)中基于稀疏投影的在線特征選擇算法[J];湖南科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2018年03期
7 陳曉明;;海量高維數(shù)據(jù)下分布式特征選擇算法的研究與應(yīng)用[J];科技通報(bào);2013年08期
8 李富星;蒙祖強(qiáng);;一種改進(jìn)的類別區(qū)分詞特征選擇算法[J];計(jì)算機(jī)與現(xiàn)代化;2019年03期
9 劉飛飛;;特征選擇算法及應(yīng)用綜述[J];辦公自動(dòng)化;2018年21期
10 侯嶼;秦小林;彭皓月;張力戈;;全局調(diào)距和聲特征選擇算法[J];計(jì)算機(jī)工程與應(yīng)用;2019年02期
相關(guān)會(huì)議論文 前10條
1 甄超;鄭濤;許潔萍;;音樂流派分類中特征選擇算法研究[A];第18屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2009)、第5屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2009)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2009)論文集[C];2009年
2 陳偉海;李建軍;趙志華;曹丹陽;李晉宏;;數(shù)據(jù)挖掘特征選擇算法研究及其在鋁電解中的應(yīng)用[A];2011中國(guó)有色金屬行業(yè)儀表自動(dòng)化學(xué)術(shù)會(huì)議論文集[C];2011年
3 張仰森;曹元大;;最大熵建模方法中一種改進(jìn)的特征選擇算法[A];NCIRCS2004第一屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2004年
4 張錚;胡社教;江萍;;基于EP模式的特征選擇算法[A];2011中國(guó)儀器儀表與測(cè)控技術(shù)大會(huì)論文集[C];2011年
5 周炎濤;唐劍波;王家琴;;基于信息熵的改進(jìn)TFIDF特征選擇算法[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年
6 徐燕;孫春明;王斌;李錦濤;;基于詞條頻率的特征選擇算法研究[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
7 李文法;段m#毅;劉悅;孫春來;;一種面向流分類的特征選擇算法[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
8 戴鍵;楊宏暉;;用于水聲目標(biāo)識(shí)別的自適應(yīng)免疫克隆特征選擇算法[A];2011'中國(guó)西部聲學(xué)學(xué)術(shù)交流會(huì)論文集[C];2011年
9 楊宏暉;李江濤;甘安琴;姚曉輝;;用于水下目標(biāo)識(shí)別的無監(jiān)督譜特征選擇算法[A];2016年中國(guó)造船工程學(xué)會(huì)水中目標(biāo)特性學(xué)組學(xué)術(shù)交流會(huì)論文集[C];2016年
10 羅勇;周超;許超;;文本分類在商品廣告分類中的應(yīng)用[A];全國(guó)第五屆信號(hào)和智能信息處理與應(yīng)用學(xué)術(shù)會(huì)議專刊(第一冊(cè))[C];2011年
相關(guān)博士學(xué)位論文 前10條
1 田肅巖;吸納通路信息識(shí)別相關(guān)基因的特征選擇算法的研究[D];吉林大學(xué);2018年
2 黃鑫;基于特征關(guān)聯(lián)關(guān)系的特征選擇算法研究[D];大連理工大學(xué);2018年
3 李云;特征選擇算法及其在基于內(nèi)容圖像檢索中的應(yīng)用研究[D];重慶大學(xué);2005年
4 張靖;面向高維小樣本數(shù)據(jù)的分類特征選擇算法研究[D];合肥工業(yè)大學(xué);2014年
5 劉華文;基于信息熵的特征選擇算法研究[D];吉林大學(xué);2010年
6 史彩娟;網(wǎng)絡(luò)空間圖像標(biāo)注中半監(jiān)督稀疏特征選擇算法研究[D];北京交通大學(xué);2015年
7 楊杰明;文本分類中文本表示模型和特征選擇算法研究[D];吉林大學(xué);2013年
8 潘巍巍;故障嚴(yán)重程度識(shí)別的有序分類特征分析方法[D];哈爾濱工業(yè)大學(xué);2013年
9 楊峻山;生物組學(xué)數(shù)據(jù)的集成特征選擇研究[D];深圳大學(xué);2017年
10 王劍橋;基于局部特性的毫米波距離像識(shí)別方法研究[D];南京理工大學(xué);2014年
相關(guān)碩士學(xué)位論文 前10條
1 李昌聰;基于代價(jià)敏感的特征選擇算法研究及應(yīng)用[D];蘭州大學(xué);2019年
2 李森;基于多目標(biāo)進(jìn)化優(yōu)化的癌癥數(shù)據(jù)特征選擇算法研究[D];安徽大學(xué);2019年
3 郭偉;大樣本高維數(shù)據(jù)下基于進(jìn)化多目標(biāo)優(yōu)化的特征選擇算法研究[D];安徽大學(xué);2019年
4 唐莉;基于樣本差異性分析的多標(biāo)記特征選擇算法研究[D];閩南師范大學(xué);2019年
5 趙凱;Android惡意應(yīng)用檢測(cè)中特征選擇算法的研究[D];湖南大學(xué);2016年
6 趙軍;基于Top-r方法的特征選擇算法研究[D];湖南大學(xué);2014年
7 樊力文;基于Spark的穩(wěn)定特征及流式特征選擇算法研究[D];河南大學(xué);2018年
8 脫倩娟;基于數(shù)據(jù)相似性的特征選擇算法研究[D];閩南師范大學(xué);2018年
9 張夢(mèng)林;基于SAL框架的特征選擇算法[D];吉林大學(xué);2018年
10 施瑞朗;中文文本分類中特征選擇算法的研究與改進(jìn)[D];杭州電子科技大學(xué);2018年
本文編號(hào):2664609
本文鏈接:http://sikaile.net/yixuelunwen/jsb/2664609.html