微陣列基因表達(dá)數(shù)據(jù)混合特征算法研究
本文選題:微陣列基因表達(dá) 切入點(diǎn):Filter法 出處:《沈陽工業(yè)大學(xué)》2017年碩士論文 論文類型:學(xué)位論文
【摘要】:DNA微陣列技術(shù)是由生物學(xué),融微電子學(xué)、計(jì)算機(jī)科學(xué)和廣電化學(xué)為一體,在原來核酸雜交的基礎(chǔ)上發(fā)展起來的一項(xiàng)新技術(shù),在醫(yī)學(xué)和生物學(xué)的研究中得到了高度重視。近幾年來,隨著大規(guī)模高通量微陣列技術(shù)的快速發(fā)展,在一次實(shí)驗(yàn)中獲得成千上萬個(gè)基因的表達(dá)水平成為現(xiàn)實(shí)。這種高新的技術(shù)為基因表達(dá)數(shù)據(jù)的搜集提供了便利,從一次實(shí)驗(yàn)獲得大量的反應(yīng)基因產(chǎn)物mRNA豐度的數(shù)據(jù),通過微陣列技術(shù)得到的反應(yīng)mRNA豐度的數(shù)據(jù)通常稱為微陣列基因表達(dá)數(shù)據(jù),簡(jiǎn)稱微陣列。自上個(gè)世紀(jì)90年代以來微陣列技術(shù)逐步形成,對(duì)生物領(lǐng)域產(chǎn)生深遠(yuǎn)影響,它的出現(xiàn)使基因活性的檢測(cè)成為可能,將微陣列技術(shù)應(yīng)用病理診斷分析的實(shí)驗(yàn)便由此開始。此后,在經(jīng)歷了20多年的不斷發(fā)展,將生物醫(yī)學(xué),計(jì)算機(jī)等領(lǐng)域?qū)⑵淙诤稀H缃?微陣列技術(shù)不斷完善,成為生物信息學(xué)中熱門話題,為人類探索生物信息提供了新的篇章。由于微陣列的維數(shù)高,噪聲大,及冗余性強(qiáng)等特性,這種特征給基因選擇的實(shí)驗(yàn)帶來了挑戰(zhàn);本文提出一種面向高維微陣列數(shù)據(jù)的混合特征算法,根據(jù)信噪比方法,Lasso方法,Filter方法及Wrapper方法混合優(yōu)勢(shì)對(duì)微陣列基因表達(dá)數(shù)據(jù)分析,提出混合Relief-PSO方法對(duì)數(shù)據(jù)分析研究。本文首先回顧微陣列數(shù)據(jù)分析的一些方法,然后介紹集成系統(tǒng)學(xué)習(xí)的方法。最后是關(guān)于新的集成技術(shù)在微陣列數(shù)據(jù)上的應(yīng)用。主要工作如下:(1)微陣列算法的介紹,以及對(duì)于單獨(dú)的信噪比方法,Lasso方法,Filter方法,Wrapper方法的特征在微陣列的應(yīng)用。借于結(jié)合的信噪比和Lasso法、Filter法和Wrapper法混合。最后闡明本文的主要研究?jī)?nèi)容。(2)單個(gè)實(shí)驗(yàn)產(chǎn)生的微陣列數(shù)據(jù)難免會(huì)達(dá)不到理想狀態(tài),也會(huì)影響到數(shù)據(jù)學(xué)習(xí)訓(xùn)練分類器的效果和泛化能力,將多個(gè)實(shí)驗(yàn)的方法集成起來可以提高分類器泛化能力和實(shí)驗(yàn)數(shù)據(jù)的高效性,也更加接近基因表達(dá)數(shù)據(jù)的分析能力,在處理高維小樣本、高冗余、高噪聲的基因微陣列數(shù)據(jù)時(shí),無法采用傳統(tǒng)特征選擇方法進(jìn)行分析。本文針對(duì)該問題提出了一種結(jié)合Relief算法和粒子群優(yōu)化算法(Relief-PSO)的混合特征選擇方法,檢測(cè)這種算法對(duì)數(shù)據(jù)的分類效果,產(chǎn)生泛化能力更好的集成算法。
[Abstract]:DNA microarray technology is a new technology developed by combining biology, microelectronics, computer science and radio and television chemistry, based on the original nucleic acid hybridization. In recent years, with the rapid development of large-scale high-throughput microarray technology, In one experiment, the expression level of tens of thousands of genes became a reality. This new technique facilitated the collection of gene expression data, and obtained a large amount of mRNA abundance data from one experiment. The mRNA abundance response data obtained by microarray technology is commonly called microarray gene expression data, or microarray. Since -10s, microarray technology has been gradually formed, which has a profound impact on the biological field. It made it possible to detect gene activity, and the experiment of applying microarray technology to pathological diagnosis and analysis began. Then, after more than 20 years of continuous development, it fused biomedical, computer, and other fields. Microarray technology has become a hot topic in bioinformatics, which provides a new chapter for human beings to explore bioinformatics. In this paper, a hybrid feature algorithm for high-dimensional microarray data is proposed to analyze the gene expression data of microarrays according to the mixed advantages of the signal-to-noise ratio (SNR) method, Lasso method, filter method and Wrapper method. A hybrid Relief-PSO method for data analysis is proposed. Firstly, some methods of microarray data analysis are reviewed. Finally, the application of new integration technology in microarray data is introduced. The main work is as follows: introduction of microarray algorithm. And the application of the characteristics of the Lasso / filter method / wrapper method to the microarray. By combining the SNR method with the Lasso filter method and the Wrapper method. Finally, the main research content of this paper is elucidated. 2) A single experimental production. The raw microarray data will inevitably fail to reach the desired state, It can also affect the effect and generalization ability of data learning training classifier. Integrating several experimental methods can improve the generalization ability of classifier and the efficiency of experimental data, and it is also closer to the analysis ability of gene expression data. When processing high-dimensional, small-sample, high-redundancy, high-noise gene microarray data, Traditional feature selection method can not be used to analyze this problem. A hybrid feature selection method combining Relief algorithm and particle swarm optimization (PSO) algorithm is proposed in this paper to detect the effect of this algorithm on data classification. A better integration algorithm with better generalization ability is generated.
【學(xué)位授予單位】:沈陽工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP18
【相似文獻(xiàn)】
相關(guān)期刊論文 前6條
1 羅田;微陣列計(jì)劃(MICROARRAY PROJECT,μAP)[J];生物工程進(jìn)展;2001年03期
2 吳騁,王志勇,賀佳,賀憲民;SVMs在微陣列表達(dá)數(shù)據(jù)分析中的應(yīng)用[J];數(shù)理統(tǒng)計(jì)與管理;2005年04期
3 劉國(guó)棟;DNA芯片技術(shù)及其農(nóng)業(yè)應(yīng)用[J];科技導(dǎo)報(bào);2001年06期
4 宮改云,毛用才,高新波,劉三陽;基于模糊c-均值聚類的微陣列基因表達(dá)數(shù)據(jù)分析[J];西安電子科技大學(xué)學(xué)報(bào);2004年02期
5 李非;伯曉晨;王升啟;彭宇行;;一種具有高度可驗(yàn)證性的微陣列片間校準(zhǔn)算法[J];計(jì)算機(jī)工程與科學(xué);2010年08期
6 ;[J];;年期
相關(guān)會(huì)議論文 前7條
1 金玉霞;劉霞;葛加美;吳秀芳;宋勤浩;周赤燕;苗正友;;單核苷酸多態(tài)微陣列技術(shù)檢測(cè)Williams-Beuren綜合征微缺失[A];第九屆全國(guó)遺傳病診斷與產(chǎn)前診斷學(xué)術(shù)交流會(huì)暨產(chǎn)前診斷和醫(yī)學(xué)遺傳學(xué)新技術(shù)研討會(huì)論文集[C];2014年
2 周大文;管翌華;許淼;顏景斌;陳美玨;黃英;任兆瑞;;MLPA-微陣列技術(shù)在性染色體異常檢測(cè)中的應(yīng)用[A];中國(guó)遺傳學(xué)會(huì)第八次代表大會(huì)暨學(xué)術(shù)討論會(huì)論文摘要匯編(2004-2008)[C];2008年
3 孫迅;江明鋒;李校;張義正;;用cDNA微陣列技術(shù)快速篩選粗毛栓菌的表達(dá)基因[A];中國(guó)的遺傳學(xué)研究——中國(guó)遺傳學(xué)會(huì)第七次代表大會(huì)暨學(xué)術(shù)討論會(huì)論文摘要匯編[C];2003年
4 洪萍;朱培元;;微陣列技術(shù)在輸血醫(yī)學(xué)中的應(yīng)用及其研究進(jìn)展[A];中國(guó)輸血協(xié)會(huì)第四屆輸血大會(huì)論文集[C];2006年
5 張亮;程京;;cDNA微陣列技術(shù)中內(nèi)標(biāo)poly(A)+RNA的制備[A];中國(guó)生物工程學(xué)會(huì)第三次全國(guó)會(huì)員代表大會(huì)暨學(xué)術(shù)討論會(huì)論文摘要集[C];2001年
6 管翌華;熊燦;許淼;任兆瑞;黃英;;應(yīng)用MLPA-微陣列技術(shù)對(duì)環(huán)狀13號(hào)染色體的微小缺失鑒定[A];第八次全國(guó)醫(yī)學(xué)遺傳學(xué)學(xué)術(shù)會(huì)議(中華醫(yī)學(xué)會(huì)2009年醫(yī)學(xué)遺傳學(xué)年會(huì))論文摘要匯編[C];2009年
7 關(guān)新元;;比較基因組雜交技及微陣列技術(shù)在腫瘤研究中的應(yīng)用[A];第三屆“分子核醫(yī)學(xué)在腫瘤診斷與治療中的應(yīng)用與研究進(jìn)展”全國(guó)腫瘤分子標(biāo)志的研究與方法學(xué)進(jìn)展學(xué)術(shù)交流會(huì)資料匯編[C];2006年
相關(guān)博士學(xué)位論文 前4條
1 程志強(qiáng);小分子微陣列的動(dòng)力學(xué)藥物篩選技術(shù)[D];清華大學(xué);2015年
2 鄧曄;微陣列技術(shù)中生物信息的利用和挖掘[D];浙江大學(xué);2007年
3 周濤;基于細(xì)胞微陣列篩選泛素—蛋白酶體通路底物的研究[D];中國(guó)人民解放軍軍事醫(yī)學(xué)科學(xué)院;2007年
4 王明怡;微陣列數(shù)據(jù)挖掘技術(shù)的研究[D];浙江大學(xué);2004年
相關(guān)碩士學(xué)位論文 前8條
1 董文娟;微陣列基因表達(dá)數(shù)據(jù)混合特征算法研究[D];沈陽工業(yè)大學(xué);2017年
2 王濤;蛋白質(zhì)微陣列載體表面修飾方法效果比較及其應(yīng)用研究[D];天津醫(yī)科大學(xué);2011年
3 劉亭;微陣列制備及M.fulvus HW-1耐鹽相關(guān)基因表達(dá)譜分析[D];山東大學(xué);2007年
4 王成雄;基于統(tǒng)計(jì)分析的微陣列數(shù)據(jù)挖掘技術(shù)[D];電子科技大學(xué);2006年
5 劉艷;微陣列圖像自動(dòng)分析方法的研究[D];中國(guó)醫(yī)科大學(xué);2009年
6 李小燕;食物過敏原可視化檢測(cè)抗體微陣列的構(gòu)建[D];中國(guó)海洋大學(xué);2010年
7 孫顯赫;微陣列數(shù)據(jù)處理平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];南方醫(yī)科大學(xué);2011年
8 馬n,
本文編號(hào):1573794
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1573794.html