大樣本非標記定量蛋白質(zhì)組學數(shù)據(jù)前處理方法研究
發(fā)布時間:2023-04-05 02:00
基于大樣本非標記定量蛋白質(zhì)組學數(shù)據(jù)的特征,和蛋白質(zhì)組學領域相較于轉錄組學,代謝組學領域數(shù)據(jù)前處理方法的“滯后性”,并從快速增長的、由精準醫(yī)學為代表的諸多高速發(fā)展領域產(chǎn)生的大樣本量實驗數(shù)據(jù)處理的需求出發(fā),本研究開發(fā)了針對大樣本非標記定量蛋白質(zhì)組學數(shù)據(jù)前處理的R工具包preprocessor。通過對其他組學領域數(shù)據(jù)前處理方法的篩選,preprocessor特別集成了適用于大樣本,尤其是臨床大樣本非標記定量蛋白質(zhì)組學數(shù)據(jù)的前處理方法,如EigenMS、QC-RLSC、missForest等,并致力于解決大樣本量及臨床樣本高異質(zhì)性帶來的數(shù)據(jù)偏差問題和非標記定量方法帶來的數(shù)據(jù)缺失問題,同時工具包中也包括一些蛋白質(zhì)組學數(shù)據(jù)經(jīng)典前處理方法作為保守選擇或方便對比。本工具包包含完整的大樣本非標記定量蛋白質(zhì)組學數(shù)據(jù)前處理流程,包括數(shù)據(jù)讀取、清洗、評估、校正、缺失值填補和前處理方法對比等,并生成報告,從而輔助研究者選取合適的前處理方法以解決大樣本非標記定量蛋白質(zhì)組學分析面臨的特有問題。
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【文章目錄】:
內(nèi)容摘要
ABSTRACT
第一章 引言
第一節(jié) 非標記定量蛋白質(zhì)組學技術的研究進展
第二節(jié) 非標記定量蛋白質(zhì)組學數(shù)據(jù)前處理的研究進展
一 數(shù)據(jù)校正
二 缺失值填補
三 臨床大樣本非標記定量蛋白質(zhì)組學數(shù)據(jù)前處理工具
第二章 前處理方法及效果評估方法
第一節(jié) 數(shù)據(jù)校正方法
一 不校正
二 分位數(shù)校正
三 上四分位數(shù)校正
四 方差穩(wěn)定校正
五 替代變量分析校正
六 EigenMS
七 QC-RLSC
第二節(jié) 數(shù)據(jù)校正效果評估方法
一 樣本豐度總和
二 變異系數(shù)
三 合并組內(nèi)變異系數(shù)
四 合并組內(nèi)估計方差
五 合并組內(nèi)絕對中位差
六 質(zhì)控樣本相關性系數(shù)
七 聚類分析
八 數(shù)據(jù)分布
九 統(tǒng)計檢驗結果
第三節(jié) 缺失值填補方法
一 不填補缺失值
二 數(shù)據(jù)統(tǒng)計量填補
三 k近鄰填補
四 鏈式方程多重填補
五 基于隨機森林的迭代填補
第四節(jié) 缺失值填補效果評估方法
第三章 實驗結果及分析
第一節(jié) 數(shù)據(jù)來源
第二節(jié) 數(shù)據(jù)評估
一 總體趨勢
二 缺失模式
三 變異分析及相關性分析
四 聚類分析
第三節(jié) 數(shù)據(jù)校正結果評估
一 總體趨勢箱線圖
二 樣本總豐度分布箱線圖
三 質(zhì)控樣本變異系數(shù)與相關系數(shù)
四 聚類分析
五 密度圖
六 平均組內(nèi)變異參數(shù)
第四節(jié) 缺失值填補結果評估
一 總體趨勢箱線圖
二 質(zhì)控樣本變異系數(shù)與相關系數(shù)
三 聚類分析
四 密度圖
第五節(jié) 數(shù)據(jù)前處理對后續(xù)分析的影響
一 p值分布變化
二 差異基因
第六節(jié) 填補與校正順序
第四章 結論與討論
參考文獻
附錄
附錄一 preprocessor的安裝
附錄二 preprocessor的使用
后記
致謝
本文編號:3782501
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【文章目錄】:
內(nèi)容摘要
ABSTRACT
第一章 引言
第一節(jié) 非標記定量蛋白質(zhì)組學技術的研究進展
第二節(jié) 非標記定量蛋白質(zhì)組學數(shù)據(jù)前處理的研究進展
一 數(shù)據(jù)校正
二 缺失值填補
三 臨床大樣本非標記定量蛋白質(zhì)組學數(shù)據(jù)前處理工具
第二章 前處理方法及效果評估方法
第一節(jié) 數(shù)據(jù)校正方法
一 不校正
二 分位數(shù)校正
三 上四分位數(shù)校正
四 方差穩(wěn)定校正
五 替代變量分析校正
六 EigenMS
七 QC-RLSC
第二節(jié) 數(shù)據(jù)校正效果評估方法
一 樣本豐度總和
二 變異系數(shù)
三 合并組內(nèi)變異系數(shù)
四 合并組內(nèi)估計方差
五 合并組內(nèi)絕對中位差
六 質(zhì)控樣本相關性系數(shù)
七 聚類分析
八 數(shù)據(jù)分布
九 統(tǒng)計檢驗結果
第三節(jié) 缺失值填補方法
一 不填補缺失值
二 數(shù)據(jù)統(tǒng)計量填補
三 k近鄰填補
四 鏈式方程多重填補
五 基于隨機森林的迭代填補
第四節(jié) 缺失值填補效果評估方法
第三章 實驗結果及分析
第一節(jié) 數(shù)據(jù)來源
第二節(jié) 數(shù)據(jù)評估
一 總體趨勢
二 缺失模式
三 變異分析及相關性分析
四 聚類分析
第三節(jié) 數(shù)據(jù)校正結果評估
一 總體趨勢箱線圖
二 樣本總豐度分布箱線圖
三 質(zhì)控樣本變異系數(shù)與相關系數(shù)
四 聚類分析
五 密度圖
六 平均組內(nèi)變異參數(shù)
第四節(jié) 缺失值填補結果評估
一 總體趨勢箱線圖
二 質(zhì)控樣本變異系數(shù)與相關系數(shù)
三 聚類分析
四 密度圖
第五節(jié) 數(shù)據(jù)前處理對后續(xù)分析的影響
一 p值分布變化
二 差異基因
第六節(jié) 填補與校正順序
第四章 結論與討論
參考文獻
附錄
附錄一 preprocessor的安裝
附錄二 preprocessor的使用
后記
致謝
本文編號:3782501
本文鏈接:http://sikaile.net/shoufeilunwen/mpalunwen/3782501.html
最近更新
教材專著