融合數(shù)據(jù)內(nèi)部結(jié)構(gòu)信息的貝葉斯標志基因篩選
發(fā)布時間:2017-04-12 15:18
本文關(guān)鍵詞:融合數(shù)據(jù)內(nèi)部結(jié)構(gòu)信息的貝葉斯標志基因篩選,由筆耕文化傳播整理發(fā)布。
【摘要】:高通量的“組學”數(shù)據(jù)中蘊含著與疾病相關(guān)的生物標志物,為深入研究疾病的發(fā)生發(fā)展機制帶來了前所未有的機遇。但是,如何從高維高通量的組學數(shù)據(jù)中發(fā)現(xiàn)生物標志物是生物數(shù)據(jù)分析的重點和難點。本研究針對目前生物標志物篩選中通用的過濾式(如方差分析、秩和檢驗等)和封裝式(如LASSO,支持向量機等)等方法的局限和不足,提出了一個在廣義線性模型框架下通過集成數(shù)據(jù)內(nèi)部結(jié)構(gòu)信息來篩選標記基因的策略。模型篩選效果評價通過模擬實驗進行,并采用析因設(shè)計方差分析從樣本容量、總體陽性率、信噪比、基因間關(guān)聯(lián)強度以及致病基因效應強度五個方面對模型進行影響因素分析。結(jié)果顯示,五個影響因素中,變異貢獻大小依次為:信噪比樣本容量總體陽性率基因間關(guān)聯(lián)程度效應強度。先驗信息的設(shè)置也會對貝葉斯變量選擇模型的篩選效果產(chǎn)生影響。我們利用高斯圖模型和最大相關(guān)系數(shù)法提取數(shù)據(jù)的內(nèi)部結(jié)構(gòu)特征作為模型的先驗信息,為了探討不同內(nèi)部結(jié)構(gòu)信息對模型篩選準確性的影響,我們針對這兩種數(shù)據(jù)挖掘方法各設(shè)置了三類共6種內(nèi)部結(jié)構(gòu)形式,也通過模擬實驗考察其篩選效果。結(jié)果顯示,這幾種內(nèi)部結(jié)構(gòu)形式與模型融合后篩選效果比較理想,其中,高斯圖模型提取的偏相關(guān)系數(shù)矩陣與最大相關(guān)系數(shù)法提取的最大相關(guān)系數(shù)等級矩陣與模型融合的篩選效果最好。因此,我們認為高斯圖模型與最大相關(guān)系數(shù)法提取的內(nèi)部結(jié)構(gòu)信息均能在一定程度上反映數(shù)據(jù)的內(nèi)部結(jié)構(gòu)特征,并建議在利用高斯圖模型時,可采用未離散化的內(nèi)部結(jié)構(gòu)形式與本研究篩選模型進行融合;而在利用最大相關(guān)系數(shù)法時,則最好采用離散化的內(nèi)部結(jié)構(gòu)形式進行融合。在模擬實驗得出的結(jié)論基礎(chǔ)上,以乳腺癌基因數(shù)據(jù)為例進行實證研究。利用融合偏相關(guān)系數(shù)矩陣和最大相關(guān)系數(shù)等級矩陣的模型進行基因篩選,并列出了后驗概率最高的前15個基因。通過文獻查驗,確證其中一些基因與乳腺癌具有一定的生物學聯(lián)系。
【關(guān)鍵詞】:貝葉斯變量選擇 基因篩選 高斯圖模型 最大相關(guān)系數(shù)
【學位授予單位】:重慶醫(yī)科大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:Q811.4;R3416
【目錄】:
- 英漢縮略語名詞對照5-6
- 中文摘要6-8
- 英文摘要8-10
- 1 前言10-13
- 1.1 研究背景10
- 1.2 貝葉斯變量選擇方法在基因篩選中的應用10-11
- 1.3 基因表達數(shù)據(jù)的內(nèi)部結(jié)構(gòu)信息11-13
- 1.4 研究內(nèi)容13
- 2 融合內(nèi)部結(jié)構(gòu)的貝葉斯變量選擇模型13-24
- 2.1 廣義線性模型下的貝葉斯變量選擇策略13-14
- 2.2 基因關(guān)系圖的構(gòu)建以及數(shù)據(jù)的模擬14-19
- 2.3 模型篩選效果比較及影響因素分析19-24
- 3 當前數(shù)據(jù)內(nèi)部結(jié)構(gòu)信息的提取及其與BVS方法的融合24-38
- 3.1 兩種高維數(shù)據(jù)挖掘方法介紹25-27
- 3.2 內(nèi)部結(jié)構(gòu)信息的提取27-29
- 3.3 模擬實驗29-38
- 4 實證研究38-41
- 4.1 分析步驟38-39
- 4.2 篩選結(jié)果39-41
- 結(jié)論41-44
- 參考文獻44-47
- 文獻綜述47-53
- 參考文獻50-53
- 致謝53-54
- 碩士期間發(fā)表的論文54
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前1條
1 陳大業(yè),王秀文;華北幾次中強地震前太原臺地傾斜異常特征[J];內(nèi)陸地震;1991年02期
本文關(guān)鍵詞:融合數(shù)據(jù)內(nèi)部結(jié)構(gòu)信息的貝葉斯標志基因篩選,由筆耕文化傳播整理發(fā)布。
,本文編號:301571
本文鏈接:http://sikaile.net/yixuelunwen/binglixuelunwen/301571.html
最近更新
教材專著