基于遺傳算法和加權(quán)極限學(xué)習(xí)機(jī)結(jié)合的乳腺癌亞型分類和基因選擇
[Abstract]:There are various ways to solve the problem of gene selection for breast cancer subtypes. In this paper, a packaging method is used to find the gene sets most closely related to the classification of breast cancer subtypes in the potential selection of characteristic gene set space. There are two problems: first, how to evaluate a gene set good or bad. Second, in what way to find the best set of genes. For the first problem, the solution of this paper is to use the gene data training model in the gene set. If the prediction accuracy of the model for breast cancer subtype classification is high, the data used by the model are good. This means that the gene set is better. The model chosen in this paper is the ultimate learning machine, because it is a new neural network model algorithm, and it has the characteristics of simplicity and extreme speed, which is very suitable for extensive and repeated training. For the second problem, there are many search optimization methods for us to use, such as random search, exhaustive, ant colony algorithm and so on. Genetic algorithm is used in this paper. Its good robustness and relatively simple maneuverability are the main reasons why we choose genetic algorithm. Through the combination of genetic algorithm and extreme learning machine, we have selected a set of 50 genes, which has the most important correlation to the classification of breast cancer subtype. At the same time, we also use other feature selection method-filter method. By analyzing the redundancy of gene set, SAM method and greedy algorithm based on similarity measure are used to filter out a large number of redundant genes, which reduces the search space and avoids the interference of many useless genes to the algorithm. We call this process genetic pre-screening. After that, for the problem and data, the genetic operation and various parameter settings for solving the problem in this paper are given. In the study of the problem, we encounter the imbalance of genetic data. Through analysis and research, we use a weighted extreme learning machine, and solve this problem in a cost-sensitive way. Finally, the results of our method are compared with other methods. First, we compare the prediction performance of different machine learning algorithms on our optimal gene set, which shows that our selected gene set is robust. It has more than 95% geometric average accuracy prediction performance for different learning algorithms. Then we compared the predictive performance of the gene sets screened by our method with those obtained by other methods. The prediction accuracy of our method is 96.53%, which is better than that of any other method. It is proved that our method is worth studying and extending.
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:R737.9;TP18
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉雅琴,王成,章魯;基于多代競(jìng)爭(zhēng)遺傳算法的數(shù)值函數(shù)優(yōu)化[J];上海第二醫(yī)科大學(xué)學(xué)報(bào);2005年08期
2 江金龍;朱亞軍;薛云燦;;基于變區(qū)域搜索的改進(jìn)遺傳算法研究[J];九江學(xué)院學(xué)報(bào)(自然科學(xué)版);2006年03期
3 林中營(yíng);虞科;程翼宇;沈朋;;遺傳算法優(yōu)化尿樣核苷毛細(xì)管電泳分析條件[J];藥物分析雜志;2007年03期
4 曹明勇;陳超敏;周凌宏;童蕾;;雙種群遺傳算法優(yōu)化射野方向及權(quán)重的研究[J];醫(yī)療衛(wèi)生裝備;2008年10期
5 蔣興波;許開云;吳耀民;;衛(wèi)勤最短回路問題的遺傳算法求解[J];解放軍醫(yī)院管理雜志;2010年03期
6 周琴;孔玉;;基于遺傳算法的醫(yī)用溶液測(cè)定[J];醫(yī)療衛(wèi)生裝備;2011年04期
7 劉繼清;;遺傳算法在裝備供應(yīng)優(yōu)化問題中的應(yīng)用[J];江漢大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期
8 喬樹清;;改進(jìn)后的遺傳算法在排課系統(tǒng)中的應(yīng)用研究[J];齊齊哈爾醫(yī)學(xué)院學(xué)報(bào);2007年16期
9 邢大地;吳效明;;基于改進(jìn)的遺傳算法求解腦電逆問題[J];中國(guó)組織工程研究與臨床康復(fù);2009年17期
10 杜海艦;伍瑞昌;王運(yùn)斗;;基于遺傳算法的帶有軟時(shí)間窗的衛(wèi)生車輛調(diào)度優(yōu)化研究[J];數(shù)理醫(yī)藥學(xué)雜志;2011年05期
相關(guān)會(huì)議論文 前10條
1 陳家照;廖海濤;張中位;羅寅生;;一種改進(jìn)的遺傳算法及其在路徑規(guī)劃中的應(yīng)用[A];2009系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2009年
2 李國(guó)云;劉穎;薛梅;鄔志敏;;遺傳算法在高溫空冷冷凝器優(yōu)化設(shè)計(jì)中的應(yīng)用[A];第五屆全國(guó)制冷空調(diào)新技術(shù)研討會(huì)論文集[C];2008年
3 王志軍;李守春;張爽;;改進(jìn)的遺傳算法在反演問題中的應(yīng)用[A];新世紀(jì) 新機(jī)遇 新挑戰(zhàn)——知識(shí)創(chuàng)新和高新技術(shù)產(chǎn)業(yè)發(fā)展(上冊(cè))[C];2001年
4 任燕翔;姜立;劉連民;從滋慶;;改進(jìn)遺傳算法在三維日照方案優(yōu)化中的應(yīng)用[A];工程三維模型與虛擬現(xiàn)實(shí)表現(xiàn)——第二屆工程建設(shè)計(jì)算機(jī)應(yīng)用創(chuàng)新論壇論文集[C];2009年
5 韓娟;;遺傳算法概述[A];第三屆河南省汽車工程科技學(xué)術(shù)研討會(huì)論文集[C];2006年
6 龐國(guó)仲;王元西;;基于遺傳算法控制步長(zhǎng)的定性仿真方法[A];'2000系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)交流會(huì)論文集[C];2000年
7 張忠華;楊淑瑩;;基于遺傳算法的聚類設(shè)計(jì)[A];全國(guó)第二屆信號(hào)處理與應(yīng)用學(xué)術(shù)會(huì)議?痆C];2008年
8 何翠紅;區(qū)益善;;遺傳算法及其在計(jì)算機(jī)編程中的應(yīng)用[A];1995年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議暨智能自動(dòng)化專業(yè)委員會(huì)成立大會(huì)論文集(下冊(cè))[C];1995年
9 靳開巖;張乃堯;;幾種實(shí)用遺傳算法及其比較[A];1996年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];1996年
10 王宏剛;曾建潮;李志宏;;攝動(dòng)遺傳算法[A];1996年中國(guó)智能自動(dòng)化學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];1996年
相關(guān)重要報(bào)紙文章 前1條
1 林京;《神經(jīng)網(wǎng)絡(luò)和遺傳算法在水科學(xué)領(lǐng)域的應(yīng)用》將面市[N];中國(guó)水利報(bào);2002年
相關(guān)博士學(xué)位論文 前10條
1 Amjad Mahmood;半監(jiān)督進(jìn)化集成及其在網(wǎng)絡(luò)視頻分類中的應(yīng)用[D];西南交通大學(xué);2015年
2 李險(xiǎn)峰;基于改進(jìn)遺傳算法的汽車裝配生產(chǎn)線平衡問題研究[D];北京科技大學(xué);2017年
3 周輝仁;遞階遺傳算法理論及其應(yīng)用研究[D];天津大學(xué);2008年
4 郝國(guó)生;交互式遺傳算法中用戶的認(rèn)知規(guī)律及其應(yīng)用[D];中國(guó)礦業(yè)大學(xué);2009年
5 侯格賢;遺傳算法及其在跟蹤系統(tǒng)中的應(yīng)用研究[D];西安電子科技大學(xué);1998年
6 馬國(guó)田;遺傳算法及其在電磁工程中的應(yīng)用[D];西安電子科技大學(xué);1998年
7 唐文艷;結(jié)構(gòu)優(yōu)化中的遺傳算法研究和應(yīng)用[D];大連理工大學(xué);2002年
8 周激流;遺傳算法理論及其在水問題中應(yīng)用的研究[D];四川大學(xué);2000年
9 劉冀成;基于改進(jìn)遺傳算法的生物電磁成像與磁場(chǎng)聚焦應(yīng)用研究[D];四川大學(xué);2005年
10 袁麗華;基于物種進(jìn)化的遺傳算法研究[D];南京航空航天大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 張英俐;基于遺傳算法的作曲系統(tǒng)研究[D];山東師范大學(xué);2006年
2 鐘海萍;原對(duì)偶遺傳算法與蟻群算法的一種融合算法[D];暨南大學(xué);2013年
3 李志添;模糊遺傳算法與資源優(yōu)化配置的預(yù)測(cè)控制[D];華南理工大學(xué);2015年
4 王琳琳;新型雙層液壓轎運(yùn)車車廂的設(shè)計(jì)研究[D];上海工程技術(shù)大學(xué);2015年
5 李海全;基于遺傳算法的建筑體形系數(shù)及迎風(fēng)面積比優(yōu)化方法研究[D];華南理工大學(xué);2015年
6 彭騫;基于遺傳算法的山區(qū)高等級(jí)公路縱斷面智能優(yōu)化方法研究[D];昆明理工大學(xué);2015年
7 周玉林;基于小波分析和遺傳算法的配電網(wǎng)故障檢測(cè)[D];昆明理工大學(xué);2015年
8 郭頌;基于粗糙集和遺傳算法的數(shù)字管道生產(chǎn)管理系統(tǒng)研究[D];昆明理工大學(xué);2015年
9 吳南;數(shù)值逼近遺傳算法的研究應(yīng)用[D];華南理工大學(xué);2015年
10 于光帥;一類優(yōu)化算法的改進(jìn)研究與應(yīng)用[D];渤海大學(xué);2015年
,本文編號(hào):2131664
本文鏈接:http://sikaile.net/yixuelunwen/zlx/2131664.html