天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 基因論文 >

基因表達譜數(shù)據(jù)的特征選擇方法應(yīng)用策略研究

發(fā)布時間:2018-04-15 19:06

  本文選題:基因表達譜數(shù)據(jù) + 特征基因選擇; 參考:《第三軍醫(yī)大學(xué)》2016年碩士論文


【摘要】:研究背景:隨著分子生物學(xué)技術(shù)和基因微陣列的不斷發(fā)展,通過定量測量我們可以很容易獲取大量的基因表達譜數(shù)據(jù),而且得到的數(shù)據(jù)質(zhì)量也越來越高;虮磉_譜數(shù)據(jù)具有維數(shù)高,樣本小,且存在大量噪聲的特點。有研究學(xué)者針對基因表達譜數(shù)據(jù)的特點,利用統(tǒng)計學(xué)習(xí)和模式識別的方法來對數(shù)據(jù)進行有效的挖掘。目前最為常用的方法是對表達譜數(shù)據(jù)進行降維,選擇出具有代表性的信息基因,在保證具有較高分類精度的前提下同時提高學(xué)習(xí)算法的性能和效率。特征選擇通過剔除不相關(guān)和冗余的特征,而達到降低特征個數(shù),提高模型精確性,減少運行時間的目的。目前雖已有了大量的特征選擇算法,但如何針對基因表達譜數(shù)據(jù)結(jié)構(gòu)自身特點來選擇最優(yōu)的算法還存在著一定困難。因此本研究結(jié)合生物學(xué)和模式識別的相關(guān)知識,通過對一些常用的特征選擇算法進行比較,最終提出一種可供參考的選擇標(biāo)準(zhǔn)。研究方法:本研究中通過模擬不同特征數(shù)、樣本量、分類情況以及噪聲大小的數(shù)據(jù)集,選用了8個特征選擇算法,并在3種分類器中進行測試,以分類精確度和計算復(fù)雜度作為衡量指標(biāo)來對每一種方法的優(yōu)劣性進行評價。最后將其應(yīng)用到真實數(shù)據(jù)集中,并對每種方法的結(jié)果進行分析和比較,選擇出最佳的特征選擇方法。研究結(jié)果:對于不同特點的表達譜數(shù)據(jù)集分別使用三種類別的特征選擇方法來分析都能有效的降低特征維度,通過比較分析后我們發(fā)現(xiàn):SVM-RFE算法在特征數(shù)較少和樣本量較小的時候有很好的分類結(jié)果;Wrapper SVM算法在較少樣本量和較多PCR特征基因情況下的分類效果較好;Wrapper k-NN算法對具有較少特征數(shù)和較多的FCR特征基因數(shù)據(jù)集有較好的實用性;Relief F算法能很快的從高維數(shù)據(jù)集中獲得特征子集,該算法在特征數(shù)較多和樣本量較大的情況下效果好;mRMR算法同樣適合特征數(shù)較多的情況,并在信噪比較高的情況也有也有很好的效果。研究結(jié)論:對腫瘤的類別進行劃分并從中挖掘有生物學(xué)含義的知識時,信息基因的篩選是非常重要的步驟。對分類無關(guān)基因的排除可以進一步降低數(shù)據(jù)量或減少數(shù)據(jù)的維數(shù),從而提高分類器的性能。本文從已有的大量特征選擇算法中,選取了一些常用的方法并針對表達譜數(shù)據(jù)的不同特點來進行對比研究,最終建立方法應(yīng)用策略,為基因表達譜數(shù)據(jù)的分析提供了方法學(xué)上的指導(dǎo)。
[Abstract]:Background: with the development of molecular biology technology and gene microarray, it is easy to obtain a large amount of gene expression profile data by quantitative measurement, and the quality of the obtained data is getting higher and higher.The data of gene expression profile have the characteristics of high dimension, small sample and large amount of noise.According to the characteristics of gene expression profile data, some researchers use the methods of statistical learning and pattern recognition to mine the data effectively.At present, the most commonly used method is to reduce the dimension of the expression spectrum data, select the representative information gene, and improve the performance and efficiency of the learning algorithm under the premise of high classification accuracy.By eliminating irrelevant and redundant features, feature selection can reduce the number of features, improve the accuracy of the model and reduce the running time.Although there are a lot of feature selection algorithms, it is still difficult to select the optimal algorithm according to the characteristics of gene expression profile data structure.So this study combined with the knowledge of biology and pattern recognition, through the comparison of some commonly used feature selection algorithms, finally put forward a reference selection criteria.Research methods: in this study, eight feature selection algorithms were selected and tested in three classifiers by simulating data sets of different feature numbers, sample sizes, classification conditions and noise size.The classification accuracy and computational complexity are used to evaluate the advantages and disadvantages of each method.Finally, it is applied to the real data set, and the results of each method are analyzed and compared, and the best feature selection method is selected.The results showed that for the expression data sets with different characteristics, using three kinds of feature selection methods can effectively reduce the feature dimension.Through comparison and analysis, we find that the small number of features and the small sample size of the small number of features of the small number of features and small sample size of the small number of classification results of the wrapper SVM algorithm in the case of less sample size and more PCR feature genes, the classification effect is better than that of the wrapper k-NN algorithm.With fewer feature numbers and more FCR feature gene datasets, Relief F algorithm can quickly obtain feature subsets from high dimensional datasets.The algorithm has good performance in the case of more features and larger sample size. It is also suitable for the case of more features, and also has a good effect in the case of higher signal-to-noise ratio (SNR).Conclusion: the screening of information genes is a very important step in the classification of tumors and the mining of biological knowledge.The elimination of classification independent genes can further reduce the amount of data or reduce the dimension of data, thus improving the performance of the classifier.In this paper, we select some common methods from the existing feature selection algorithms, and compare and study the different characteristics of the expression spectrum data. Finally, we establish the application strategy of the method.It provides methodological guidance for the analysis of gene expression profile data.
【學(xué)位授予單位】:第三軍醫(yī)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:Q811.4

【相似文獻】

相關(guān)期刊論文 前10條

1 汪偉;;基于數(shù)據(jù)庫語言實現(xiàn)基因表達譜數(shù)據(jù)的單因素重復(fù)測量方差分析[J];中國醫(yī)療設(shè)備;2013年11期

2 劉玲;;基因表達譜數(shù)據(jù)分析技術(shù)[J];電腦與信息技術(shù);2010年06期

3 黃宏斌;梁芳;熊煒;李小玲;曾朝陽;李桂源;;生物信息技術(shù)加速開發(fā)舊藥新用途[J];生物化學(xué)與生物物理進展;2012年01期

4 張亮,張巖,周一鳴,安爽,果德安,周玉祥,曾令文,程京;用聚類法分析受抗真菌物質(zhì)處理后的酵母細胞全基因表達譜[J];生物化學(xué)與生物物理進展;2002年04期

5 潘海燕,朱軍,韓丹夫;分析基因表達譜數(shù)據(jù)的新方法(英文)[J];浙江大學(xué)學(xué)報(農(nóng)業(yè)與生命科學(xué)版);2004年05期

6 葛世麗,吳德昌;基因表達系列分析及其應(yīng)用[J];國外醫(yī)學(xué)(放射醫(yī)學(xué)核醫(yī)學(xué)分冊);1998年05期

7 葛芳;王年;郭秀麗;;一種改進的譜聚類算法及其在基因表達譜分析中的應(yīng)用[J];安徽大學(xué)學(xué)報(自然科學(xué)版);2012年05期

8 曹文君;李運明;陳長生;;基因表達譜富集分析方法研究進展[J];生物技術(shù)通訊;2008年06期

9 闞?;唐俊;蘇亮亮;;一種基于鄰域不定性信息和記分準(zhǔn)則相結(jié)合的腫瘤特征基因提取方法[J];安徽大學(xué)學(xué)報(自然科學(xué)版);2014年01期

10 嚴(yán)美娟;萬明輝;李春鵬;夏春林;;兩型星形膠質(zhì)細胞基因表達譜差異的初步觀察[J];南通大學(xué)學(xué)報(醫(yī)學(xué)版);2007年01期

相關(guān)會議論文 前10條

1 劉艷;李康;傅松濱;;基于小波分析理論的基因表達譜數(shù)據(jù)分析方法的研究[A];中國的遺傳學(xué)研究——中國遺傳學(xué)會第七次代表大會暨學(xué)術(shù)討論會論文摘要匯編[C];2003年

2 張巖;張亮;周一鳴;安爽;果德安;周玉祥;曾令文;程京;;抗真菌物質(zhì)與酵母細胞作用后全基因表達譜的聚類法分析[A];第九次全國生物物理大會學(xué)術(shù)會議論文摘要集[C];2002年

3 朱明珠;高磊;李霞;;酵母基因表達相關(guān)性與蛋白質(zhì)互作網(wǎng)絡(luò)距離分析[A];中國生物醫(yī)學(xué)工程進展——2007中國生物醫(yī)學(xué)工程聯(lián)合學(xué)術(shù)年會論文集(下冊)[C];2007年

4 高瑞蘭;陳小紅;林筱潔;錢煦岱;徐衛(wèi)紅;吳超群;;三七皂苷誘導(dǎo)造血細胞基因表達譜的研究[A];中國細胞生物學(xué)學(xué)會2005年學(xué)術(shù)大會、青年學(xué)術(shù)研討會論文摘要集[C];2005年

5 許沈華;牟瀚舟;顧琳慧;朱赤紅;劉祥麟;;用基因芯片篩選高轉(zhuǎn)移卵巢癌轉(zhuǎn)移相關(guān)的基因[A];中國細胞生物學(xué)學(xué)會醫(yī)學(xué)細胞生物學(xué)學(xué)術(shù)大會論文集[C];2006年

6 包雷;過濤;孫之榮;;挖掘基因與抗癌藥物間可能的生物學(xué)關(guān)聯(lián)[A];第九次全國生物物理大會學(xué)術(shù)會議論文摘要集[C];2002年

7 邱廣斌;郝冬梅;宮立國;李云慧;;腫瘤相關(guān)新基因MTLC的克隆及在腫瘤中的表達研究[A];第十屆全軍檢驗醫(yī)學(xué)學(xué)術(shù)會議論文匯編[C];2005年

8 高瑞蘭;陳小紅;林筱潔;錢煦岱;徐衛(wèi)紅;吳超群;;三七皂苷誘導(dǎo)造血細胞基因表達譜的研究[A];第八屆全國中西醫(yī)結(jié)合血液病學(xué)術(shù)會議論文集[C];2007年

9 張幸國;虞朝暉;文思遠;;復(fù)方丹參注射液對血管內(nèi)皮細胞基因表達譜的影響研究[A];2006年浙江省藥品法規(guī)與臨床藥理學(xué)術(shù)研討會論文匯編[C];2006年

10 高瑞蘭;林筱潔;陳小紅;徐衛(wèi)紅;錢煦岱;吳超群;;三七皂苷誘導(dǎo)造血細胞基因表達譜的研究[A];2007年浙江省血液病學(xué)術(shù)年會論文匯編[C];2007年

相關(guān)重要報紙文章 前10條

1 記者 衣曉峰 通訊員 李小蓮;探尋“證”的基因表達譜[N];中國中醫(yī)藥報;2009年

2 曉明;抑制一基因 “老”鼠換新膚[N];中國醫(yī)藥報;2007年

3 記者 張曄 通訊員 周偉;我學(xué)者發(fā)現(xiàn)多基因表達譜[N];科技日報;2014年

4 ;聚類分析在自身免疫病基因表達譜研究中的初步應(yīng)用[N];中國醫(yī)藥報;2003年

5 吳煜 楊宇飛 楊煥明;抗腫瘤藥研究新思路[N];中藥報;2000年

6 周艷萍;尋求腫瘤個體化治療方案[N];健康報;2006年

7 趙紹華;給孩子減肥必須“餓一餓”[N];健康時報;2007年

8 解放軍總醫(yī)院全軍腎臟病研究所教授 吳鏑邋王繼榮 劉泉 整理;推進腎病科研的四大利器[N];健康報;2008年

9 江蘇省中醫(yī)院轉(zhuǎn)化醫(yī)學(xué)中心 賴仁勝;腫瘤基因組 突破在云端[N];健康報;2011年

10 記者 張學(xué)全 張建松;我人類功能基因研究獲重要進展[N];新華每日電訊;2000年

相關(guān)博士學(xué)位論文 前10條

1 王翔;小麥溫光反應(yīng)的分子生物學(xué)研究[D];中國農(nóng)業(yè)科學(xué)院;2014年

2 牛月;NCA1在擬南芥感受鈉鹽脅迫過程中功能的研究[D];蘭州大學(xué);2012年

3 王作昭;長白山林蛙蛙卵Onconase基因的克隆表達及其抗人乳腺癌作用研究[D];吉林大學(xué);2016年

4 周運;基于生物網(wǎng)絡(luò)的大鼠再生肝細胞基因表達譜數(shù)據(jù)分析[D];河南師范大學(xué);2016年

5 張文慧;白樺BPERF11基因響應(yīng)高鹽干旱脅迫的調(diào)控機理研究[D];東北林業(yè)大學(xué);2016年

6 張偉溪;楊樹抗逆轉(zhuǎn)錄因子基因遺傳轉(zhuǎn)化與功能驗證[D];中國林業(yè)科學(xué)研究院;2014年

7 李伍舉;基于基因表達譜的樣本分型與分類研究[D];中國人民解放軍軍事醫(yī)學(xué)科學(xué)院;2003年

8 梁欣偉;人臍靜脈內(nèi)皮細胞基因表達譜分析[D];第一軍醫(yī)大學(xué);2006年

9 藺會云;一條新的轉(zhuǎn)移相關(guān)基因mag-1的研究[D];中國人民解放軍軍事醫(yī)學(xué)科學(xué)院;2006年

10 楊志林;惡性膠質(zhì)瘤相關(guān)新基因的篩選、克隆及其特性研究[D];第一軍醫(yī)大學(xué);2001年

相關(guān)碩士學(xué)位論文 前10條

1 趙月敏;CMFT體外抑瘤活性及對腫瘤細胞基因表達譜的影響[D];河北大學(xué);2015年

2 江月;家蠶TGF-β家族成員dpp和daw基因的功能研究[D];蘇州大學(xué);2015年

3 弓春玲;Hela細胞與人子宮內(nèi)膜基質(zhì)細胞中miRNA Let-7及其靶基因的關(guān)系研究[D];內(nèi)蒙古大學(xué);2015年

4 羅影濤;腺苷酸環(huán)化酶3基因敲除小鼠主要嗅覺表皮基因表達譜分析[D];河北大學(xué);2015年

5 甘斌;基于稀疏性理論的腫瘤基因表達譜分類[D];曲阜師范大學(xué);2015年

6 喬玲波;StOSM基因及其耐旱功能研究[D];寧夏大學(xué);2015年

7 趙學(xué)軍;家蠅CCTζ基因的cDNA克隆、表達及表達模式研究[D];貴陽醫(yī)學(xué)院;2015年

8 文正勇;鱖魚生長性狀數(shù)字基因表達譜分析[D];華中農(nóng)業(yè)大學(xué);2015年

9 李曉賓;Fancd2os基因在小鼠不同組織中的表達譜分析及其真核表達載體的構(gòu)建與鑒定[D];山西醫(yī)科大學(xué);2015年

10 陳輝;CIK誘導(dǎo)過程中TCR的表達變化及靶向TCR的基因編輯研究[D];廣東藥學(xué)院;2015年



本文編號:1755392

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/1755392.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c050b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
午夜小视频成人免费看| 亚洲国产一级片在线观看| 国产精品一区二区三区欧美| 欧美日韩亚洲国产av| 日韩精品一区二区三区四区| 99久久免费中文字幕| 丰满人妻一二三区av| 日韩18一区二区三区| 国产精品伦一区二区三区四季| 午夜小视频成人免费看| 日本女优一区二区三区免费| 风韵人妻丰满熟妇老熟女av| 婷婷一区二区三区四区| 99秋霞在线观看视频| 日韩精品一级片免费看| 欧美大胆美女a级视频| 妻子的新妈妈中文字幕| 久久99热成人网不卡| 激情国产白嫩美女在线观看| 99视频精品免费视频| 国产传媒欧美日韩成人精品| 国产女性精品一区二区三区 | 色欧美一区二区三区在线| 熟妇人妻av中文字幕老熟妇| 日韩1区二区三区麻豆| 国产精品日本女优在线观看| 亚洲精品成人午夜久久| 亚洲熟女一区二区三四区| 99久久精品免费精品国产| 亚洲综合激情另类专区老铁性| 国产精品福利一级久久| 黄片美女在线免费观看| 亚洲中文在线观看小视频| 成人精品国产亚洲av久久| 99久只有精品免费视频播放| 亚洲精品一区二区三区免| 日韩欧美精品一区二区三区| 深夜视频成人在线观看 | 久久黄片免费播放大全| 日韩高清一区二区三区四区 | 日本本亚洲三级在线播放|