基于拓展的隱馬爾可夫模型的大規(guī)模相依多重檢驗
發(fā)布時間:2022-10-15 21:06
大規(guī)模多重檢驗的問題產生于許多科學研究領域。例如,在全基因組關聯分析(GWAS)中,通常需要進行數以萬計的檢驗以尋找與復雜疾病或性狀相關聯的單核苷酸多態(tài)性(SNPs)。一些其它的例子包括:神經影像數據分析[72]、微陣列數據分析[51,52]、空間數據分析[82]等等。到目前為止,一些多重檢驗方法已經被廣泛地應用于眾多科學領域。然而,在大規(guī)模多重檢驗中仍然存在一些棘手的問題需要解決。首先,日益產生的“高通量”數據的分析通常需要我們同時進行數以萬計的檢驗;趥鹘y的控制準則(例如FWER)的多重檢驗方法過于保守。其次,多重檢驗中的檢驗之間通常存在著復雜的相依性。例如,在GWAS中,由于相鄰的基因位點在減數分裂過程中傾向于分離到同一個配子中,因此相鄰的檢驗之間存在著復雜的相依結構。最后,多重檢驗方法忽略協變量效應的影響往往會導致檢驗功效的損失。例如,在大規(guī)模兩樣本推斷中,合適地利用稀疏性信息可以顯著地提高檢驗功效。為了解決上述問題,我們提出了一類基于拓展的隱馬爾可夫模型的大規(guī)模多重檢驗方法。理論結果表明:這些新的多重檢驗方法可以將偽發(fā)現率(FDR)控制在預設的顯著性水平α,并且在所有的FD...
【文章頁數】:110 頁
【學位級別】:博士
【文章目錄】:
摘要
英文摘要
第一章 序言
1.1 背景介紹
1.1.1 FWER控制準則
1.1.2 FDR控制準則
1.1.3 FNR和ETP
1.2 基于FWER的多重檢驗方法
1.2.1 Bonferroni方法
1.2.2 Sidak方法
1.2.3 Holm方法
1.3 基于FDR的多重檢驗方法
1.3.1 BH方法
1.3.2 Lfdr方法
1.3.3 LIS方法
1.4 本文內容和結構安排
第二章 基于因子隱馬爾可夫模型的大規(guī)模多重檢驗
2.1 引言
2.2 統計模型和方法
2.2.1 基于因子隱馬爾可夫模型的協變量調整的多重檢驗
2.2.2 協變量調整的多重檢驗問題和加權分類問題之間的關系
2.2.3 基于因子隱馬爾可夫模型的CALIS方法
2.2.4 計算CALIS值的向前-向后算法
2.2.5 估計因子隱馬爾可夫模型參數的EM算法
2.3 理論證明
2.3.1 定理2.2.3的證明
2.3.2 定理2.2.4的證明
2.3.3 定理2.2.5的證明
2.4 模擬研究
2.4.1 因子隱馬爾可夫模型的相依結構
2.4.2 更真實的SNP相依結構
2.5 實際數據分析
第三章 基于笛卡爾隱馬爾可夫模型的可重復性分析
3.1 引言
3.2 統計模型和方法
3.2.1 可重復性分析的框架
3.2.2 笛卡爾隱馬爾可夫模型
3.2.3 可重復性分析的repLIS方法
3.2.4 計算repLIS值的向前-向后算法
3.2.5 計算笛卡爾隱馬爾可夫模型參數的EM算法
3.3 模擬研究
3.3.1 基于確定模型的模擬
3.3.2 基于基因型數據的模擬
3.4 實際數據分析
3.4.1 尋找基因多效性中的應用
3.4.2 尋找可重復性關聯中的應用
第四章 基于半連接的隱馬爾可夫模型的兩樣本推斷
4.1 引言
4.2 統計模型和方法
4.2.1 半連接的隱馬爾可夫模型
4.2.2 神諭的COALIS方法
4.2.3 數據驅動的COALIS方法
4.3 理論證明
4.3.1 定理4.2.1的證明
4.3.2 定理4.2.2的證明
4.3.3 定理4.2.3的證明
4.4 模擬研究
4.4.1 模擬研究一
4.4.2 模擬研究二
4.5 實際數據分析
第五章 總結與展望
參考文獻
附錄
致謝
在學期間公開發(fā)表論文情況
本文編號:3692040
【文章頁數】:110 頁
【學位級別】:博士
【文章目錄】:
摘要
英文摘要
第一章 序言
1.1 背景介紹
1.1.1 FWER控制準則
1.1.2 FDR控制準則
1.1.3 FNR和ETP
1.2 基于FWER的多重檢驗方法
1.2.1 Bonferroni方法
1.2.2 Sidak方法
1.2.3 Holm方法
1.3 基于FDR的多重檢驗方法
1.3.1 BH方法
1.3.2 Lfdr方法
1.3.3 LIS方法
1.4 本文內容和結構安排
第二章 基于因子隱馬爾可夫模型的大規(guī)模多重檢驗
2.1 引言
2.2 統計模型和方法
2.2.1 基于因子隱馬爾可夫模型的協變量調整的多重檢驗
2.2.2 協變量調整的多重檢驗問題和加權分類問題之間的關系
2.2.3 基于因子隱馬爾可夫模型的CALIS方法
2.2.4 計算CALIS值的向前-向后算法
2.2.5 估計因子隱馬爾可夫模型參數的EM算法
2.3 理論證明
2.3.1 定理2.2.3的證明
2.3.2 定理2.2.4的證明
2.3.3 定理2.2.5的證明
2.4 模擬研究
2.4.1 因子隱馬爾可夫模型的相依結構
2.4.2 更真實的SNP相依結構
2.5 實際數據分析
第三章 基于笛卡爾隱馬爾可夫模型的可重復性分析
3.1 引言
3.2 統計模型和方法
3.2.1 可重復性分析的框架
3.2.2 笛卡爾隱馬爾可夫模型
3.2.3 可重復性分析的repLIS方法
3.2.4 計算repLIS值的向前-向后算法
3.2.5 計算笛卡爾隱馬爾可夫模型參數的EM算法
3.3 模擬研究
3.3.1 基于確定模型的模擬
3.3.2 基于基因型數據的模擬
3.4 實際數據分析
3.4.1 尋找基因多效性中的應用
3.4.2 尋找可重復性關聯中的應用
第四章 基于半連接的隱馬爾可夫模型的兩樣本推斷
4.1 引言
4.2 統計模型和方法
4.2.1 半連接的隱馬爾可夫模型
4.2.2 神諭的COALIS方法
4.2.3 數據驅動的COALIS方法
4.3 理論證明
4.3.1 定理4.2.1的證明
4.3.2 定理4.2.2的證明
4.3.3 定理4.2.3的證明
4.4 模擬研究
4.4.1 模擬研究一
4.4.2 模擬研究二
4.5 實際數據分析
第五章 總結與展望
參考文獻
附錄
致謝
在學期間公開發(fā)表論文情況
本文編號:3692040
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3692040.html