代謝組學數(shù)據(jù)清洗中的缺失值處理和變量分類方法
發(fā)布時間:2024-02-22 20:39
數(shù)據(jù)清洗是代謝組學進行數(shù)據(jù)分析之前的重要步驟,合理的數(shù)據(jù)清洗步驟可以讓后續(xù)的數(shù)據(jù)分析工作更完善更有效的進行。在本文中就數(shù)據(jù)清洗中的缺失值處理和變量分類兩個問題提出了新的方法:1.深入探討了質(zhì)譜數(shù)據(jù)中的缺失值模式,并提出了一種新的方法來生成模擬的質(zhì)譜缺失數(shù)據(jù)集,相對現(xiàn)有的生成方法更加簡單快捷,也更加貼合現(xiàn)實;提出了一種新的缺失值填補方法:在KNN過程中利用了分組信息以及左截斷正態(tài)分布的特點,首先填補非隨機缺失,接著使用自適應KNN來進行填補。在模擬代謝組學分析結(jié)果中說明,使用此經(jīng)過改進的KNN方法可以有效的完成缺失值填補,同時也有助于后續(xù)的分析。2.提出了一種新的變量分類方法:D-C方法,這一變量分類方法主要從兩個方向出發(fā)完成變量分類:自變量與因變量的相關(guān)性,變量之間的相關(guān)性。將變量分為三類:獨特變量、共性變量和冗余變量。D-C方法主要使用Diffreg方法和CMELR-CSIS方法、主成分分析、相關(guān)性分析來完成變量分類工作。同時將此變量分類方法應用于多源數(shù)據(jù)數(shù)據(jù)處理的數(shù)據(jù)清洗步驟,可以有效地處理高維數(shù)據(jù)。通過模擬數(shù)據(jù)和實際數(shù)據(jù)檢驗證明使用此方法有助于后續(xù)的建模等程序。在基于質(zhì)譜的代謝組...
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 代謝組學簡述
1.2 代謝組學數(shù)據(jù)清洗
1.2.1 缺失值填補
1.2.2 多源數(shù)據(jù)融合
1.3 論文結(jié)構(gòu)
參考文獻
第二章 缺失值處理方法研究
2.1 引言
2.2 缺失值的研究進展
2.3 缺失值的數(shù)據(jù)模擬方法
2.4 缺失值填補KNN方法
2.5 改進的KNN方法
2.6 數(shù)值分析
2.7 本章小結(jié)
參考文獻
第三章 基于變量分類的多源數(shù)據(jù)融合
3.1 引言
3.2 多源數(shù)據(jù)融合的研究進展
3.3 基于變量分類的數(shù)據(jù)融合
3.3.1 diffreg檢驗
3.3.2 CMELR-CSIS方法
3.3.3 D-C方法
3.4 模擬數(shù)據(jù)實驗
3.5 真實代謝組學數(shù)據(jù)實驗
3.6 本章小結(jié)
參考文獻
第四章 代謝物數(shù)據(jù)管理系統(tǒng)實現(xiàn)
4.1 引言
4.2 系統(tǒng)的框架設(shè)計
4.3 數(shù)據(jù)庫表單設(shè)計
4.3.1 菌株信息表
4.3.2 粗提物信息表
4.3.3 化合物信息表
4.3.4 送測信息表
4.4 功能模塊設(shè)計
4.4.1 用戶控制部分
4.4.2 數(shù)據(jù)庫操作部分
4.5 系統(tǒng)實現(xiàn)
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文總結(jié)
5.2 研究展望
攻讀碩士期間的研究成果
致謝
本文編號:3907232
【文章頁數(shù)】:76 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 代謝組學簡述
1.2 代謝組學數(shù)據(jù)清洗
1.2.1 缺失值填補
1.2.2 多源數(shù)據(jù)融合
1.3 論文結(jié)構(gòu)
參考文獻
第二章 缺失值處理方法研究
2.1 引言
2.2 缺失值的研究進展
2.3 缺失值的數(shù)據(jù)模擬方法
2.4 缺失值填補KNN方法
2.5 改進的KNN方法
2.6 數(shù)值分析
2.7 本章小結(jié)
參考文獻
第三章 基于變量分類的多源數(shù)據(jù)融合
3.1 引言
3.2 多源數(shù)據(jù)融合的研究進展
3.3 基于變量分類的數(shù)據(jù)融合
3.3.1 diffreg檢驗
3.3.2 CMELR-CSIS方法
3.3.3 D-C方法
3.4 模擬數(shù)據(jù)實驗
3.5 真實代謝組學數(shù)據(jù)實驗
3.6 本章小結(jié)
參考文獻
第四章 代謝物數(shù)據(jù)管理系統(tǒng)實現(xiàn)
4.1 引言
4.2 系統(tǒng)的框架設(shè)計
4.3 數(shù)據(jù)庫表單設(shè)計
4.3.1 菌株信息表
4.3.2 粗提物信息表
4.3.3 化合物信息表
4.3.4 送測信息表
4.4 功能模塊設(shè)計
4.4.1 用戶控制部分
4.4.2 數(shù)據(jù)庫操作部分
4.5 系統(tǒng)實現(xiàn)
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 論文總結(jié)
5.2 研究展望
攻讀碩士期間的研究成果
致謝
本文編號:3907232
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3907232.html
最近更新
教材專著