離散輸入加性模型的構(gòu)建及其基因組學(xué)的應(yīng)用
發(fā)布時間:2023-10-02 04:02
離散型數(shù)據(jù)包括標(biāo)稱型與計數(shù)型數(shù)據(jù),是數(shù)據(jù)科學(xué)與人工智能領(lǐng)域中重要的數(shù)據(jù)類型。離散型數(shù)據(jù)作為輸入構(gòu)建回歸模型,面臨著將離散輸入值映射到連續(xù)輸出值上的問題。本研究基于Rademacher復(fù)雜度對離散值輸入下高斯通用加性模型的誤差泛化界進行了推導(dǎo),在理論上探索了該類模型的估計方法與表現(xiàn)能力。此外,本研究還將高斯通用加性模型應(yīng)用于全基因組數(shù)據(jù)中,為選擇性育種提供了一種新的解決方案。本文主要闡述了以下三個方面的工作內(nèi)容:(1)本文在Rademacher復(fù)雜度的基礎(chǔ)上對離散值輸入下高斯通用加性模型的誤差泛化界進行了推導(dǎo)。在全基因組選擇研究中,由于輸入數(shù)據(jù)為離散值,模型假設(shè)空間的復(fù)雜度直接影響模型的泛化誤差大小。為此本文分別推導(dǎo)了高斯通用加性模型中均值和方差的Rademacher復(fù)雜度上界,并以二項分布的輸入數(shù)據(jù)為例得到了在分類和回歸問題中較為緊致的誤差泛化界。(2)本文闡述了針對小樣本數(shù)據(jù)集高斯通用加性模型的改進及權(quán)重求解過程。本文將輸出數(shù)據(jù)分布函數(shù)中的均值和方差均參數(shù)化以構(gòu)建高斯通用加性模型,并將分布函數(shù)連乘得到損失函數(shù)。求得損失函數(shù)最小值時均值和方差的權(quán)重,并通過添加Bagging集成學(xué)習(xí)方法...
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.1.1 課題研究意義
1.1.2 全基因組數(shù)據(jù)的離散特征
1.1.3 模型復(fù)雜度研究
1.2 國內(nèi)外研究現(xiàn)狀及分析
1.3 本文主要研究內(nèi)容及論文結(jié)構(gòu)安排
2 離散型輸入的模型估計
2.1 模型估計
2.1.1 預(yù)測誤差與經(jīng)驗誤差
2.1.2 誤差的方差偏差分解
2.2 Rademacher復(fù)雜度估計
2.3 離散型輸入的模型復(fù)雜度估計
2.3.1 均值的Rademacher復(fù)雜度理論推導(dǎo)
2.3.2 方差的Rademacher復(fù)雜度理論推導(dǎo)
2.3.3 仿真實驗
2.4 本章小結(jié)
3 高斯通用加性模型的構(gòu)建
3.1 通用加性模型
3.2 高斯通用加性模型
3.3 Bagging集成方法
3.4 高斯通用加性模型的求解
3.5 本章小結(jié)
4 全基因組數(shù)據(jù)集的數(shù)據(jù)預(yù)處理
4.1 數(shù)據(jù)的采集與培養(yǎng)
4.2 數(shù)據(jù)的預(yù)處理
4.2.1 基因分型
4.2.2 缺失值填補
4.3 生物群體的種群結(jié)構(gòu)分析
4.4 數(shù)據(jù)特征分析
4.5 本章小結(jié)
5 GGAM在全基因組學(xué)數(shù)據(jù)上的應(yīng)用
5.1 基于關(guān)聯(lián)分析的一次特征降維
5.1.1 假設(shè)檢驗
5.1.2 Matrix eQTL算法
5.2 基于模型復(fù)雜度的二次特征降維
5.2.1 AIC信息準則
5.2.2 基于脊回歸的前向選擇法特征降維
5.3 實驗結(jié)果分析
5.3.1 均值擬合結(jié)果對比
5.3.2 方差擬合結(jié)果
5.4 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文情況
致謝
本文編號:3850058
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景及意義
1.1.1 課題研究意義
1.1.2 全基因組數(shù)據(jù)的離散特征
1.1.3 模型復(fù)雜度研究
1.2 國內(nèi)外研究現(xiàn)狀及分析
1.3 本文主要研究內(nèi)容及論文結(jié)構(gòu)安排
2 離散型輸入的模型估計
2.1 模型估計
2.1.1 預(yù)測誤差與經(jīng)驗誤差
2.1.2 誤差的方差偏差分解
2.2 Rademacher復(fù)雜度估計
2.3 離散型輸入的模型復(fù)雜度估計
2.3.1 均值的Rademacher復(fù)雜度理論推導(dǎo)
2.3.2 方差的Rademacher復(fù)雜度理論推導(dǎo)
2.3.3 仿真實驗
2.4 本章小結(jié)
3 高斯通用加性模型的構(gòu)建
3.1 通用加性模型
3.2 高斯通用加性模型
3.3 Bagging集成方法
3.4 高斯通用加性模型的求解
3.5 本章小結(jié)
4 全基因組數(shù)據(jù)集的數(shù)據(jù)預(yù)處理
4.1 數(shù)據(jù)的采集與培養(yǎng)
4.2 數(shù)據(jù)的預(yù)處理
4.2.1 基因分型
4.2.2 缺失值填補
4.3 生物群體的種群結(jié)構(gòu)分析
4.4 數(shù)據(jù)特征分析
4.5 本章小結(jié)
5 GGAM在全基因組學(xué)數(shù)據(jù)上的應(yīng)用
5.1 基于關(guān)聯(lián)分析的一次特征降維
5.1.1 假設(shè)檢驗
5.1.2 Matrix eQTL算法
5.2 基于模型復(fù)雜度的二次特征降維
5.2.1 AIC信息準則
5.2.2 基于脊回歸的前向選擇法特征降維
5.3 實驗結(jié)果分析
5.3.1 均值擬合結(jié)果對比
5.3.2 方差擬合結(jié)果
5.4 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文情況
致謝
本文編號:3850058
本文鏈接:http://sikaile.net/projectlw/swxlw/3850058.html
最近更新
教材專著