基于遺傳算法與支持向量機的癌癥特征基因提取
發(fā)布時間:2022-01-01 23:47
針對癌癥基因特征提取問題,根據(jù)遺傳算法中不同迭代時期的種群特性,設(shè)計了新的突變方法。多突變基因庫與種群代數(shù)相關(guān)的設(shè)計,使得算法能夠較快地收斂到最優(yōu)解而又避免其過早陷入局部最優(yōu)解中;選擇算子中包括個體對種群的基因豐富度貢獻;針對種群中大量的重復(fù)個體,加入重復(fù)控制,去除重復(fù)個體,提高個體與種群基因的多樣性。算法在幾種實驗數(shù)據(jù)集上均取得了較好的結(jié)果。
【文章來源】:電腦知識與技術(shù). 2020,16(26)
【文章頁數(shù)】:4 頁
【部分圖文】:
染色體編碼
采用中點交叉互換法,如圖2所示,從種群中隨機選出兩個個體,以解的中點為界,交叉互換兩個解的一部分。本算法中交叉互換率設(shè)置為0.7,本算法在此步添加了重復(fù)控制,當chromosome中包含重復(fù)基因時,此次交叉互換失效,重新進行。2.3.3 變異算子
采用單基因突變,如圖3所示,隨機選取解的一個基因進行突變,本算法在突變的過程中添加了重復(fù)控制,突變時進行檢查,如果突變基因在原來的解中,則需要重新進行突變,這一步和交叉互換中的重復(fù)控制保證了所有的染色體符合解約束(特征子集數(shù)),突變率設(shè)置為0.3。本算法設(shè)計了一個基于最大信息系數(shù)(MIC)打分,并與種群代數(shù)相關(guān)的突變方法進行突變基因的選擇。MIC又稱最大相互信息系數(shù),是基于信息的非參數(shù)性方法,用于衡量兩個變量之間的線性或非線性的強度。本算法先利用MIC計算基因與類別的相關(guān)性,并將相關(guān)性作為基因的分數(shù)。
【參考文獻】:
期刊論文
[1]高維小樣本分類問題中特征選擇研究綜述[J]. 王翔,胡學鋼. 計算機應(yīng)用. 2017(09)
[2]基于K折交叉驗證的選擇性集成分類算法[J]. 胡局新,張功杰. 科技通報. 2013(12)
[3]基于過采樣技術(shù)和隨機森林的不平衡微陣列數(shù)據(jù)分類方法研究[J]. 于化龍,高尚,趙靖,秦斌. 計算機科學. 2012(05)
[4]不平衡類數(shù)據(jù)挖掘研究綜述[J]. 翟云,楊炳儒,曲武. 計算機科學. 2010(10)
[5]基于filter-wrapper的兩步特征變量提取方法[J]. 陳巖,來海鋒,王清,王衛(wèi)偉. 機電工程. 2010(04)
碩士論文
[1]基因表達譜數(shù)據(jù)特征選擇與提取方法研究[D]. 劉金勇.中國計量學院 2014
本文編號:3563059
【文章來源】:電腦知識與技術(shù). 2020,16(26)
【文章頁數(shù)】:4 頁
【部分圖文】:
染色體編碼
采用中點交叉互換法,如圖2所示,從種群中隨機選出兩個個體,以解的中點為界,交叉互換兩個解的一部分。本算法中交叉互換率設(shè)置為0.7,本算法在此步添加了重復(fù)控制,當chromosome中包含重復(fù)基因時,此次交叉互換失效,重新進行。2.3.3 變異算子
采用單基因突變,如圖3所示,隨機選取解的一個基因進行突變,本算法在突變的過程中添加了重復(fù)控制,突變時進行檢查,如果突變基因在原來的解中,則需要重新進行突變,這一步和交叉互換中的重復(fù)控制保證了所有的染色體符合解約束(特征子集數(shù)),突變率設(shè)置為0.3。本算法設(shè)計了一個基于最大信息系數(shù)(MIC)打分,并與種群代數(shù)相關(guān)的突變方法進行突變基因的選擇。MIC又稱最大相互信息系數(shù),是基于信息的非參數(shù)性方法,用于衡量兩個變量之間的線性或非線性的強度。本算法先利用MIC計算基因與類別的相關(guān)性,并將相關(guān)性作為基因的分數(shù)。
【參考文獻】:
期刊論文
[1]高維小樣本分類問題中特征選擇研究綜述[J]. 王翔,胡學鋼. 計算機應(yīng)用. 2017(09)
[2]基于K折交叉驗證的選擇性集成分類算法[J]. 胡局新,張功杰. 科技通報. 2013(12)
[3]基于過采樣技術(shù)和隨機森林的不平衡微陣列數(shù)據(jù)分類方法研究[J]. 于化龍,高尚,趙靖,秦斌. 計算機科學. 2012(05)
[4]不平衡類數(shù)據(jù)挖掘研究綜述[J]. 翟云,楊炳儒,曲武. 計算機科學. 2010(10)
[5]基于filter-wrapper的兩步特征變量提取方法[J]. 陳巖,來海鋒,王清,王衛(wèi)偉. 機電工程. 2010(04)
碩士論文
[1]基因表達譜數(shù)據(jù)特征選擇與提取方法研究[D]. 劉金勇.中國計量學院 2014
本文編號:3563059
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3563059.html
最近更新
教材專著