基于對稱不確定性和SVM遞歸特征消除的信息基因選擇方法
本文選題:基因選擇 切入點:對稱不確定性 出處:《模式識別與人工智能》2017年05期
【摘要】:基因表達(dá)譜中存在大量與腫瘤分類無關(guān)的基因,嚴(yán)重降低腫瘤診斷的準(zhǔn)確率.基因表達(dá)譜還存在高維小樣本、噪聲大等問題,增加腫瘤診斷的難度.為了獲取基因數(shù)量較少且分類能力較強的信息基因子集,文中提出基于對稱不確定性(SU)和支持向量機遞歸特征消除(SVM-RFE)的信息基因選擇方法.首先利用SU評估基因和類標(biāo)簽之間的相關(guān)性,根據(jù)SU定義近似馬爾科夫毯,快速消除大量無關(guān)和冗余基因.然后利用SVM-RFE進(jìn)一步剔除冗余基因,獲取有效的信息基因子集.實驗表明,文中方法可以在選取維數(shù)較少或相等的信息基因子集情況下獲取較高的腫瘤分類性能.
[Abstract]:There are a large number of genes not related to tumor classification in gene expression profiles, which seriously reduce the accuracy of tumor diagnosis. There are many problems in gene expression profiles, such as high dimension and small samples, large noise, etc. In order to obtain a subset of information genes with fewer genes and stronger classification ability, In this paper, an information gene selection method based on symmetric uncertainty (SUU) and support vector machine recursive feature cancellation (SVM-RFE) is proposed. Firstly, the correlation between genes and class tags is evaluated by Su, and the Markov blanket is approximated according to the definition of Su. A large number of unrelated and redundant genes are eliminated quickly. Then the redundant genes are further eliminated by SVM-RFE, and an effective subset of information genes is obtained. The proposed method can obtain higher tumor classification performance under the condition of selecting a subset of information genes with less dimension or equal dimension.
【作者單位】: 皖南醫(yī)學(xué)院計算機教研室;安徽師范大學(xué)數(shù)學(xué)計算機科學(xué)學(xué)院;
【基金】:國家自然科學(xué)基金項目(No.61672386) 教育部人文社會科學(xué)研究規(guī)劃基金項目(No.16YJAZH071) 安徽省自然科學(xué)基金項目(No.1708085MF142) 安徽高校省級自然科學(xué)研究重點基金項目(No.KJ2016A275,KJ2014A266)資助~~
【分類號】:R73;TP18
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 董紅斌;滕旭陽;楊雪;;一種基于關(guān)聯(lián)信息熵度量的特征選擇方法[J];計算機研究與發(fā)展;2016年08期
2 林俊;許露;劉龍;;基于SVM-RFE-BPSO算法的特征選擇方法[J];小型微型計算機系統(tǒng);2015年08期
3 謝娟英;高紅超;;基于統(tǒng)計相關(guān)性與K-means的區(qū)分基因子集選擇算法[J];軟件學(xué)報;2014年09期
4 謝娟英;謝維信;;基于特征子集區(qū)分度與支持向量機的特征選擇算法[J];計算機學(xué)報;2014年08期
5 張靖;胡學(xué)鋼;李培培;張玉紅;;基于迭代Lasso的腫瘤分類信息基因選擇方法研究[J];模式識別與人工智能;2014年01期
6 崔自峰;徐寶文;張衛(wèi)豐;徐峻嶺;;一種近似Markov Blanket最優(yōu)特征選擇算法[J];計算機學(xué)報;2007年12期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李鋒;萬小強;;基于關(guān)聯(lián)矩陣的短信自動分類[J];計算機科學(xué);2017年S1期
2 孫廣路;宋智超;劉金來;朱素霞;何勇軍;;基于最大信息系數(shù)和近似馬爾科夫毯的特征選擇方法[J];自動化學(xué)報;2017年05期
3 葉明全;高凌云;伍長榮;萬春圓;;基于對稱不確定性和SVM遞歸特征消除的信息基因選擇方法[J];模式識別與人工智能;2017年05期
4 王歡;李紅輝;張駿溫;;改進(jìn)K-means聚類的云任務(wù)調(diào)度算法[J];計算機與現(xiàn)代化;2017年02期
5 張嬌鵬;王鋒;梁吉業(yè);;特征選擇:一種面向數(shù)據(jù)取值更新的批處理機制[J];小型微型計算機系統(tǒng);2017年02期
6 安旭;張樹東;;基于支持向量機的模糊特征分類算法研究[J];計算機工程;2017年01期
7 謝娟英;王明釗;胡秋鋒;;最大化ROC曲線下面積的不平衡基因數(shù)據(jù)集差異表達(dá)基因選擇算法[J];陜西師范大學(xué)學(xué)報(自然科學(xué)版);2017年01期
8 徐慶娟;楊彬彬;;基于R軟件的Lasso回歸在腫瘤信息基因選擇中的應(yīng)用[J];廣西師范學(xué)院學(xué)報(自然科學(xué)版);2016年04期
9 吳佳;曾惟如;陳瀚霖;唐雪飛;;基于隱馬爾可夫模型的軟件狀態(tài)評估預(yù)測方法[J];軟件學(xué)報;2016年12期
10 肖文華;包衛(wèi)東;朱曉敏;邵屹楊;陳超;Jianhong Wu;;面向多源大數(shù)據(jù)云端處理的成本最小化方法[J];軟件學(xué)報;2017年03期
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 楊曇;馮翔;虞慧群;;基于多群體公平模型的特征選擇算法[J];計算機研究與發(fā)展;2015年08期
2 段潔;胡清華;張靈均;錢宇華;李德玉;;基于鄰域粗糙集的多標(biāo)記分類特征選擇算法[J];計算機研究與發(fā)展;2015年01期
3 謝娟英;謝維信;;基于特征子集區(qū)分度與支持向量機的特征選擇算法[J];計算機學(xué)報;2014年08期
4 王毅;趙建軍;馮巍巍;付龍文;陳令新;;基于自適應(yīng)混沌粒子群優(yōu)化的防空目標(biāo)分配[J];計算機工程;2012年20期
5 張靖;胡學(xué)鋼;張玉紅;施萬鋒;;K-split Lasso:有效的腫瘤特征基因選擇方法[J];計算機科學(xué)與探索;2012年12期
6 吳紅霞;吳悅;劉宗田;雷州;;基于Relief和SVM-RFE的組合式SNP特征選擇[J];計算機應(yīng)用研究;2012年06期
7 朱紅萍;鞏青歌;雷戰(zhàn)波;;基于遺傳算法的入侵檢測特征選擇[J];計算機應(yīng)用研究;2012年04期
8 姚旭;王曉丹;張玉璽;權(quán)文;;特征選擇方法綜述[J];控制與決策;2012年02期
9 袁浩;;基于粒子群算法的WSN路徑優(yōu)化[J];計算機工程;2010年04期
10 王樹林;王戟;陳火旺;李樹濤;張波云;;腫瘤信息基因啟發(fā)式寬度優(yōu)先搜索算法研究[J];計算機學(xué)報;2008年04期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李鈞濤;賈英民;;用于癌癥分類與基因選擇的一種改進(jìn)的彈性網(wǎng)絡(luò)(英文)[J];自動化學(xué)報;2010年07期
2 黃海燕;;高矮胖瘦由你說[J];大眾科技;1999年08期
3 張樹波;賴劍煌;;基于融合信息的癌癥相關(guān)基因選擇方法[J];計算機科學(xué);2010年12期
4 姬翔;王安文;;一種基于SVM和相關(guān)性的基因選擇方法[J];計算機應(yīng)用與軟件;2007年06期
5 黃海燕;;胖瘦將由你掌握——人類未來飲食的重大變革[J];大科技;1999年05期
6 游偉;李樹濤;譚明奎;;基于SVM-RFE-SFS的基因選擇方法[J];中國生物醫(yī)學(xué)工程學(xué)報;2010年01期
7 石修權(quán);王增珍;;多因子降維法在評價代謝酶基因-基因-環(huán)境交互作用中的應(yīng)用[J];環(huán)境與健康雜志;2010年12期
8 丁劍濤,黃濤,李蘭英,范鈺,沈巖,吳冠蕓;FMR1基因在人胚胎組織中的選擇剪接表達(dá)[J];中國醫(yī)學(xué)科學(xué)院學(xué)報;1997年04期
9 孟超;;“瘋狂基因”:進(jìn)化的動力?[J];中國新聞周刊;2011年46期
10 李鈞濤;賈英民;;PCD型自適應(yīng)彈性網(wǎng)絡(luò)在微陣列分類中的應(yīng)用[J];智能系統(tǒng)學(xué)報;2010年03期
相關(guān)會議論文 前3條
1 任偉;閆桂英;;利用聚類算法來研究基因選擇問題[A];中國運籌學(xué)會第八屆學(xué)術(shù)交流會論文集[C];2006年
2 張春美;;守望生命,關(guān)注人的尊嚴(yán)——基因倫理的若干熱點問題[A];中國的遺傳學(xué)研究——中國遺傳學(xué)會第七次代表大會暨學(xué)術(shù)討論會論文摘要匯編[C];2003年
3 李卉卉;袁谷;;血管內(nèi)皮生長因子(VEGF)基因啟動子區(qū)G-四鏈體識別的研究[A];第六屆全國化學(xué)生物學(xué)學(xué)術(shù)會議論文摘要集[C];2009年
相關(guān)重要報紙文章 前2條
1 鄭詩亮;薛人望談基因與生命[N];東方早報;2011年
2 本報記者 章勇;基因選擇和飼養(yǎng)管理可改善羊肉顏色[N];中國畜牧獸醫(yī)報;2014年
相關(guān)博士學(xué)位論文 前1條
1 張紅燕;腫瘤信息基因選擇與分類方法研究[D];湖南農(nóng)業(yè)大學(xué);2015年
相關(guān)碩士學(xué)位論文 前7條
1 高紅超;基于聚類的基因選擇算法和DPC聚類算法研究[D];陜西師范大學(xué);2015年
2 周萍;基于頻度與聯(lián)合效應(yīng)的基因選擇[D];西安電子科技大學(xué);2009年
3 曹濤;基于聚類的混合基因選擇方法研究[D];湖南大學(xué);2011年
4 姬翔;基于SVM的多病類診斷基因選擇方法研究[D];西安電子科技大學(xué);2005年
5 吳希賢;基于優(yōu)化算法的基因選擇與癌癥分類[D];湖南大學(xué);2008年
6 劉申嶺;基于SVM的基因選擇[D];西安電子科技大學(xué);2004年
7 陸燕;基于啟發(fā)式聚類的混合特征基因選擇方法研究[D];湖南大學(xué);2010年
,本文編號:1692626
本文鏈接:http://sikaile.net/yixuelunwen/zlx/1692626.html