復(fù)雜疾病是跨組學(xué)生物標(biāo)記聯(lián)合作用的結(jié)果,但也絕不是它們之間的簡(jiǎn)單疊加和堆積,這些不同層面的組學(xué)標(biāo)記,往往有基因組→轉(zhuǎn)錄組→蛋白組→代謝組→表型組的生物信息流時(shí)間的先后順序,研究需遵循該連續(xù)譜的順序,連續(xù)譜間相互錯(cuò)綜,交織成一個(gè)組學(xué)生物網(wǎng)絡(luò)系統(tǒng),正是這個(gè)網(wǎng)絡(luò)系統(tǒng)控制著疾病的發(fā)生、發(fā)展和轉(zhuǎn)歸進(jìn)程。復(fù)雜疾病的多層面組學(xué)標(biāo)記具備“高維”、“網(wǎng)絡(luò)性”特性,傳統(tǒng)的組學(xué)標(biāo)記篩選策略和方法多數(shù)忽略了這兩個(gè)特性,勢(shì)必?fù)p失信息,甚至導(dǎo)致錯(cuò)誤結(jié)果的出現(xiàn)。同時(shí),生物分子之間的關(guān)系呈現(xiàn)出不同的非線性模式,簡(jiǎn)單的線性相關(guān)不足以刻畫(huà)。本研究在網(wǎng)絡(luò)醫(yī)學(xué)框架下,首先引入點(diǎn)互信息用于表征組學(xué)交互網(wǎng)絡(luò)中的“邊效應(yīng)”,并借助二維核密度方法估計(jì)、度量點(diǎn)互信息的取值,進(jìn)而構(gòu)建融組學(xué)交互網(wǎng)絡(luò)的“點(diǎn)效應(yīng)”、“邊效應(yīng)”為一體的組學(xué)交互網(wǎng)絡(luò)回歸模型,即點(diǎn)互信息組學(xué)網(wǎng)絡(luò)回歸模型。統(tǒng)計(jì)模擬用于評(píng)價(jià)該模型在不同的樣本含量、不同的“邊效應(yīng)”模式,及其不同網(wǎng)絡(luò)結(jié)構(gòu)下I類錯(cuò)誤率的穩(wěn)定性和檢驗(yàn)效能,來(lái)自GEO數(shù)據(jù)庫(kù)的187例吸煙者的基因表達(dá)數(shù)據(jù)用來(lái)進(jìn)一步驗(yàn)證該模型的實(shí)用性。方法生物分子之間存在復(fù)雜的相互調(diào)控關(guān)系,統(tǒng)計(jì)學(xué)中常用的簡(jiǎn)單線性相關(guān),難以刻畫(huà)這種復(fù)雜的調(diào)控關(guān)系,點(diǎn)互信息不僅可以度量?jī)蓚(gè)變量之間的線性相關(guān)關(guān)系,同時(shí)也可以度量出兩變量間的非線性相關(guān)關(guān)系。本研究首先引入點(diǎn)互信息,來(lái)表征組學(xué)生物網(wǎng)絡(luò)中不同網(wǎng)絡(luò)節(jié)點(diǎn)之間的相關(guān)關(guān)系,即網(wǎng)絡(luò)的“邊效應(yīng)”,并利用二維核密度估計(jì)的方法,來(lái)估計(jì)兩個(gè)組學(xué)網(wǎng)絡(luò)節(jié)點(diǎn)間的點(diǎn)互信息值。進(jìn)一步在logistic回歸模型框架下,構(gòu)建基于點(diǎn)互信息的組學(xué)網(wǎng)絡(luò)回歸模型,來(lái)識(shí)別整個(gè)組學(xué)交互網(wǎng)絡(luò)、網(wǎng)絡(luò)某特定組學(xué)標(biāo)記節(jié)點(diǎn)或網(wǎng)絡(luò)節(jié)點(diǎn)生物分子間的相互關(guān)系,如基因表達(dá)網(wǎng)絡(luò)中的調(diào)控關(guān)系等,檢驗(yàn)它們與復(fù)雜疾病的發(fā)生是否有關(guān)。本研究設(shè)計(jì)了兩個(gè)模擬方案用,以評(píng)價(jià)模型的有效性和科學(xué)性:1.組學(xué)交互網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)固定不變,即每次模擬時(shí),樣本間網(wǎng)絡(luò)差異節(jié)點(diǎn)和差異邊都是固定不變的;2.隨機(jī)指定樣本間網(wǎng)絡(luò)差異節(jié)點(diǎn)和差異邊。在每個(gè)模擬方案下分別考慮兩種不同的模擬情景:(1)網(wǎng)絡(luò)中節(jié)點(diǎn)間的相關(guān)性是簡(jiǎn)單線性相關(guān);(2)網(wǎng)絡(luò)中節(jié)點(diǎn)之間的相關(guān)性是非線性相關(guān)。進(jìn)一步,在每個(gè)模擬情景下設(shè)置四種網(wǎng)絡(luò)差異情況:①網(wǎng)絡(luò)中只有節(jié)點(diǎn)存在差異;②網(wǎng)絡(luò)中只有邊存在差異;③網(wǎng)絡(luò)中節(jié)點(diǎn)和邊都有差異,且差異的邊與差異節(jié)點(diǎn)相連;④網(wǎng)絡(luò)中節(jié)點(diǎn)和邊都有差異,但差異邊與差異節(jié)點(diǎn)不相連。這一系列的模擬,可從多角度評(píng)估本研究所構(gòu)建的基于點(diǎn)互信息的組學(xué)網(wǎng)絡(luò)回歸模型,與生物信息學(xué)中常用的基于積距項(xiàng)的網(wǎng)絡(luò)回歸模型相比,在I類錯(cuò)誤率控制表現(xiàn)和檢驗(yàn)效能方面的科學(xué)性和有效性。結(jié)果根據(jù)研究的模擬結(jié)果顯示:1.在兩節(jié)點(diǎn)間的關(guān)系為線性時(shí),兩模型在不同情形下都能較好地控制I類錯(cuò)誤率,且穩(wěn)定在所設(shè)定的0.05左右。在差異節(jié)點(diǎn)的識(shí)別上,點(diǎn)互信息組學(xué)網(wǎng)絡(luò)回歸模型與積距項(xiàng)組學(xué)網(wǎng)絡(luò)回歸模型具有類似的檢驗(yàn)效能,但與積距項(xiàng)組學(xué)網(wǎng)絡(luò)回歸模型相比,點(diǎn)互信息組學(xué)網(wǎng)絡(luò)回歸模型在差異邊的識(shí)別上相對(duì)較弱;2.在兩節(jié)點(diǎn)間的相關(guān)性為非線性情況下,積距項(xiàng)組學(xué)網(wǎng)絡(luò)回歸模型在差異節(jié)點(diǎn)的識(shí)別上具有較低的效能,在差異邊的識(shí)別上,積距項(xiàng)組學(xué)網(wǎng)絡(luò)回歸模型幾乎無(wú)法識(shí)別出差異邊,而點(diǎn)互信息組學(xué)網(wǎng)絡(luò)回歸模型能夠較好的識(shí)別出差異邊,且同樣具有很好的I類錯(cuò)誤率的控制表現(xiàn)。將兩個(gè)模型應(yīng)用于187例吸煙者的基因表達(dá)數(shù)據(jù),點(diǎn)互信息組學(xué)網(wǎng)絡(luò)回歸模型識(shí)別出了三個(gè)基因位點(diǎn)(AKT2、BAD和JAK3),積距項(xiàng)組學(xué)網(wǎng)絡(luò)回歸模型識(shí)別出來(lái)的二個(gè)基因位點(diǎn)(BAD和JAK3)。與此同時(shí),點(diǎn)互信息組學(xué)網(wǎng)絡(luò)回歸模型識(shí)別出了四條條差異邊(RAF1-MAP2K1、ERBB2-TGFA、CASP9-AKT2、PIK3CD-EML4),積距項(xiàng)組學(xué)網(wǎng)絡(luò)回歸模型未能夠識(shí)別出差異邊。文獻(xiàn)檢索發(fā)現(xiàn),這些識(shí)別出來(lái)的差異節(jié)點(diǎn)和差異邊,具有很好的生物學(xué)解釋,進(jìn)一步說(shuō)明本研究提出模型具有很強(qiáng)的實(shí)用性。結(jié)論點(diǎn)互信息能夠較好的提取組學(xué)交互網(wǎng)絡(luò)中不同模式的“邊效應(yīng)”,在不同的模擬情形設(shè)置之下,點(diǎn)互信息組學(xué)網(wǎng)絡(luò)回歸模型均具有很好的I類錯(cuò)誤率控制表現(xiàn),無(wú)論組學(xué)生物網(wǎng)絡(luò)中節(jié)點(diǎn)間存在線性或者非線性相關(guān)關(guān)系,點(diǎn)互信息組學(xué)網(wǎng)絡(luò)回歸模型能夠較好地識(shí)別出差異節(jié)點(diǎn)和差異邊,且對(duì)于不同的網(wǎng)絡(luò)結(jié)構(gòu),點(diǎn)互信息組學(xué)網(wǎng)絡(luò)回歸模型的識(shí)別能力穩(wěn)健性較好。
【學(xué)位單位】:山東大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:R-05
【部分圖文】:
可采用傳統(tǒng)的Wald檢驗(yàn)方法對(duì)其統(tǒng)計(jì)顯著性進(jìn)行假設(shè)檢驗(yàn)。??模擬??為了能夠使統(tǒng)計(jì)模擬更加貼近真實(shí)組學(xué)交互網(wǎng)絡(luò)結(jié)構(gòu),本研究依托K庫(kù)中包含26個(gè)組學(xué)節(jié)點(diǎn)和37條網(wǎng)絡(luò)邊的胰島素抵抗通路的網(wǎng)絡(luò)拓?fù)錇楫a(chǎn)生模擬數(shù)據(jù)的基準(zhǔn)N絡(luò)結(jié)構(gòu)(見(jiàn)圖1),在不同樣本量(《=300、40、600、1000)和不同節(jié)點(diǎn)間相關(guān)性模式(線性相關(guān)、非線性相關(guān))情況模型的I類錯(cuò)誤率的控制表現(xiàn)和檢驗(yàn)效能,每次模擬設(shè)置均重復(fù)1000到本研宄所構(gòu)建的基于點(diǎn)互信息的組學(xué)生物網(wǎng)絡(luò)回歸模型的主要特點(diǎn)互信息表征和度量組學(xué)生物網(wǎng)絡(luò)的邊效應(yīng),故本研宄選取生物信息學(xué)用的積距項(xiàng)組學(xué)生物卩彳絡(luò)回歸模型作為參照,來(lái)詮釋點(diǎn)互信息組學(xué)網(wǎng)型模型的優(yōu)劣,積距項(xiàng)組學(xué)N絡(luò)回歸模型首先使用簡(jiǎn)單線性相關(guān)來(lái)代間的連接強(qiáng)度和交互效應(yīng),進(jìn)而構(gòu)建組學(xué)生物網(wǎng)絡(luò)回歸模型。??IMCMXt)??
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳文慧;余思敏;賀杰;張子豪;李軍成;;基于2種回歸模型的大學(xué)生校園貸原因分析及對(duì)策探討[J];高師理科學(xué)刊;2018年11期
2 張莎;趙紅;;分層回歸與經(jīng)典回歸模型比較研究:以顧客資產(chǎn)驅(qū)動(dòng)因素與忠誠(chéng)意向的關(guān)系為例[J];數(shù)學(xué)的實(shí)踐與認(rèn)識(shí);2010年08期
3 胡暖;非運(yùn)動(dòng)回歸模型預(yù)測(cè)大學(xué)生最大攝氧量[J];山西師大體育學(xué)院學(xué)報(bào);2004年04期
4 姜寶法;《Logistic回歸模型—方法與應(yīng)用》[J];預(yù)防醫(yī)學(xué)文獻(xiàn)信息;2002年05期
5 潘正義;用EXCEL解回歸問(wèn)題[J];天津農(nóng)學(xué)院學(xué)報(bào);1997年02期
6 田俊;;Cox回歸模型及其參數(shù)估計(jì)[J];福建醫(yī)學(xué)院學(xué)報(bào);1987年02期
7 陳孝源;沈錦花;;新安江流域5—9月間汛期雨量預(yù)報(bào)的混合回歸模型[J];應(yīng)用概率統(tǒng)計(jì);1987年04期
8 ;衛(wèi)生統(tǒng)計(jì)[J];中國(guó)婦幼衛(wèi)生雜志;1988年03期
9 馮可君 ,鄧瑞玲 ,張緒軍;一種多元單調(diào)回歸模型及其在地圖制圖中運(yùn)用的一例[J];測(cè)繪學(xué)報(bào);1988年03期
10 馬勤;建立最優(yōu)營(yíng)運(yùn)回歸模型[J];黑龍江財(cái)專學(xué)報(bào);1988年03期
相關(guān)博士學(xué)位論文 前10條
1 康慧敏;基于隨機(jī)回歸模型的基因組選擇“一步”法研究[D];中國(guó)農(nóng)業(yè)大學(xué);2017年
2 陳凱;基于深度學(xué)習(xí)和回歸模型的視覺(jué)目標(biāo)跟蹤算法研究[D];華中科技大學(xué);2018年
3 左珊珊;Meta-回歸模型的統(tǒng)計(jì)診斷方法研究[D];云南財(cái)經(jīng)大學(xué);2018年
4 吳鑑洪;時(shí)間序列中回歸模型的診斷檢驗(yàn)[D];華東師范大學(xué);2007年
5 于揚(yáng);混頻數(shù)據(jù)回歸模型的建模理論、分析技術(shù)研究[D];東北財(cái)經(jīng)大學(xué);2016年
6 張仕光;噪聲特性的回歸模型及其在短期風(fēng)速預(yù)報(bào)中的應(yīng)用[D];河北師范大學(xué);2014年
7 陳永偉;似無(wú)關(guān)回歸模型及其應(yīng)用研究[D];華中科技大學(xué);2008年
8 田茂再;回歸模型的診斷理論與應(yīng)用[D];南開(kāi)大學(xué);2001年
9 孟瑞鋒;基于不同超聲信號(hào)變換的食品溶液濃度檢測(cè)研究[D];浙江大學(xué);2012年
10 包姣;基于深度神經(jīng)網(wǎng)絡(luò)的回歸模型及其應(yīng)用研究[D];電子科技大學(xué);2017年
相關(guān)碩士學(xué)位論文 前10條
1 李凱;基于拓展T過(guò)程回歸模型的若干穩(wěn)健估計(jì)方法[D];中國(guó)科學(xué)技術(shù)大學(xué);2019年
2 林偉強(qiáng);組學(xué)交互網(wǎng)絡(luò)回歸模型的構(gòu)建策略與方法研究[D];山東大學(xué);2019年
3 傅婷;邊際回歸模型的改進(jìn)二次推斷函數(shù)估計(jì)[D];蘇州大學(xué);2018年
4 謝杰;SGL門檻回歸模型及其在股票分析中的應(yīng)用[D];暨南大學(xué);2018年
5 吳丹;基于可加回歸模型的AQI時(shí)序特征分析[D];內(nèi)蒙古大學(xué);2018年
6 于媛媛;logistic回歸模型在流行病學(xué)病因分析中的偏性及其改進(jìn)策略研究[D];山東大學(xué);2018年
7 丁改云;金融發(fā)展減緩多維貧困的門檻特征和空間溢出效應(yīng)研究[D];西北大學(xué);2018年
8 齊樂(lè);基于MCMC方法的參數(shù)生存回歸模型的貝葉斯估計(jì)[D];大連理工大學(xué);2018年
9 繆繼華;基于支持向量回歸模型的序列采樣方法研究[D];華中科技大學(xué);2017年
10 張?zhí)?基于累積Logistic回歸模型的霧霾天氣概率估計(jì)研究[D];華北電力大學(xué)(北京);2018年
本文編號(hào):
2867285
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2867285.html