基于遺傳算法與支持向量機(jī)的癌癥特征基因提取
發(fā)布時(shí)間:2022-01-01 23:47
針對(duì)癌癥基因特征提取問(wèn)題,根據(jù)遺傳算法中不同迭代時(shí)期的種群特性,設(shè)計(jì)了新的突變方法。多突變基因庫(kù)與種群代數(shù)相關(guān)的設(shè)計(jì),使得算法能夠較快地收斂到最優(yōu)解而又避免其過(guò)早陷入局部最優(yōu)解中;選擇算子中包括個(gè)體對(duì)種群的基因豐富度貢獻(xiàn);針對(duì)種群中大量的重復(fù)個(gè)體,加入重復(fù)控制,去除重復(fù)個(gè)體,提高個(gè)體與種群基因的多樣性。算法在幾種實(shí)驗(yàn)數(shù)據(jù)集上均取得了較好的結(jié)果。
【文章來(lái)源】:電腦知識(shí)與技術(shù). 2020,16(26)
【文章頁(yè)數(shù)】:4 頁(yè)
【部分圖文】:
染色體編碼
采用中點(diǎn)交叉互換法,如圖2所示,從種群中隨機(jī)選出兩個(gè)個(gè)體,以解的中點(diǎn)為界,交叉互換兩個(gè)解的一部分。本算法中交叉互換率設(shè)置為0.7,本算法在此步添加了重復(fù)控制,當(dāng)chromosome中包含重復(fù)基因時(shí),此次交叉互換失效,重新進(jìn)行。2.3.3 變異算子
采用單基因突變,如圖3所示,隨機(jī)選取解的一個(gè)基因進(jìn)行突變,本算法在突變的過(guò)程中添加了重復(fù)控制,突變時(shí)進(jìn)行檢查,如果突變基因在原來(lái)的解中,則需要重新進(jìn)行突變,這一步和交叉互換中的重復(fù)控制保證了所有的染色體符合解約束(特征子集數(shù)),突變率設(shè)置為0.3。本算法設(shè)計(jì)了一個(gè)基于最大信息系數(shù)(MIC)打分,并與種群代數(shù)相關(guān)的突變方法進(jìn)行突變基因的選擇。MIC又稱(chēng)最大相互信息系數(shù),是基于信息的非參數(shù)性方法,用于衡量?jī)蓚(gè)變量之間的線性或非線性的強(qiáng)度。本算法先利用MIC計(jì)算基因與類(lèi)別的相關(guān)性,并將相關(guān)性作為基因的分?jǐn)?shù)。
【參考文獻(xiàn)】:
期刊論文
[1]高維小樣本分類(lèi)問(wèn)題中特征選擇研究綜述[J]. 王翔,胡學(xué)鋼. 計(jì)算機(jī)應(yīng)用. 2017(09)
[2]基于K折交叉驗(yàn)證的選擇性集成分類(lèi)算法[J]. 胡局新,張功杰. 科技通報(bào). 2013(12)
[3]基于過(guò)采樣技術(shù)和隨機(jī)森林的不平衡微陣列數(shù)據(jù)分類(lèi)方法研究[J]. 于化龍,高尚,趙靖,秦斌. 計(jì)算機(jī)科學(xué). 2012(05)
[4]不平衡類(lèi)數(shù)據(jù)挖掘研究綜述[J]. 翟云,楊炳儒,曲武. 計(jì)算機(jī)科學(xué). 2010(10)
[5]基于filter-wrapper的兩步特征變量提取方法[J]. 陳巖,來(lái)海鋒,王清,王衛(wèi)偉. 機(jī)電工程. 2010(04)
碩士論文
[1]基因表達(dá)譜數(shù)據(jù)特征選擇與提取方法研究[D]. 劉金勇.中國(guó)計(jì)量學(xué)院 2014
本文編號(hào):3563059
【文章來(lái)源】:電腦知識(shí)與技術(shù). 2020,16(26)
【文章頁(yè)數(shù)】:4 頁(yè)
【部分圖文】:
染色體編碼
采用中點(diǎn)交叉互換法,如圖2所示,從種群中隨機(jī)選出兩個(gè)個(gè)體,以解的中點(diǎn)為界,交叉互換兩個(gè)解的一部分。本算法中交叉互換率設(shè)置為0.7,本算法在此步添加了重復(fù)控制,當(dāng)chromosome中包含重復(fù)基因時(shí),此次交叉互換失效,重新進(jìn)行。2.3.3 變異算子
采用單基因突變,如圖3所示,隨機(jī)選取解的一個(gè)基因進(jìn)行突變,本算法在突變的過(guò)程中添加了重復(fù)控制,突變時(shí)進(jìn)行檢查,如果突變基因在原來(lái)的解中,則需要重新進(jìn)行突變,這一步和交叉互換中的重復(fù)控制保證了所有的染色體符合解約束(特征子集數(shù)),突變率設(shè)置為0.3。本算法設(shè)計(jì)了一個(gè)基于最大信息系數(shù)(MIC)打分,并與種群代數(shù)相關(guān)的突變方法進(jìn)行突變基因的選擇。MIC又稱(chēng)最大相互信息系數(shù),是基于信息的非參數(shù)性方法,用于衡量?jī)蓚(gè)變量之間的線性或非線性的強(qiáng)度。本算法先利用MIC計(jì)算基因與類(lèi)別的相關(guān)性,并將相關(guān)性作為基因的分?jǐn)?shù)。
【參考文獻(xiàn)】:
期刊論文
[1]高維小樣本分類(lèi)問(wèn)題中特征選擇研究綜述[J]. 王翔,胡學(xué)鋼. 計(jì)算機(jī)應(yīng)用. 2017(09)
[2]基于K折交叉驗(yàn)證的選擇性集成分類(lèi)算法[J]. 胡局新,張功杰. 科技通報(bào). 2013(12)
[3]基于過(guò)采樣技術(shù)和隨機(jī)森林的不平衡微陣列數(shù)據(jù)分類(lèi)方法研究[J]. 于化龍,高尚,趙靖,秦斌. 計(jì)算機(jī)科學(xué). 2012(05)
[4]不平衡類(lèi)數(shù)據(jù)挖掘研究綜述[J]. 翟云,楊炳儒,曲武. 計(jì)算機(jī)科學(xué). 2010(10)
[5]基于filter-wrapper的兩步特征變量提取方法[J]. 陳巖,來(lái)海鋒,王清,王衛(wèi)偉. 機(jī)電工程. 2010(04)
碩士論文
[1]基因表達(dá)譜數(shù)據(jù)特征選擇與提取方法研究[D]. 劉金勇.中國(guó)計(jì)量學(xué)院 2014
本文編號(hào):3563059
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3563059.html
最近更新
教材專(zhuān)著