利用隱馬爾科夫模型探測(cè)復(fù)雜疾病臨界點(diǎn)
發(fā)布時(shí)間:2020-07-22 19:11
【摘要】:探測(cè)復(fù)雜疾病臨界點(diǎn)對(duì)疾病早期診斷至關(guān)重要,本文利用多個(gè)樣本與單個(gè)樣本分別提出了兩種基于隱馬爾科夫模型的挖掘復(fù)雜疾病臨界點(diǎn)的算法,構(gòu)建了兩種綜合不一致性指標(biāo),以挖掘健康期到疾病爆發(fā)之間的臨界狀態(tài).為驗(yàn)證算法的有效性,將兩種指標(biāo)分別應(yīng)用在仿真網(wǎng)絡(luò)數(shù)據(jù),肺部急性損傷數(shù)據(jù)、乳腺癌數(shù)據(jù)中,并在疾病惡化前,成功探測(cè)并及時(shí)發(fā)出預(yù)警信號(hào),另外,兩個(gè)實(shí)際數(shù)據(jù)集的結(jié)果均通過(guò)留一法、生存分析、KEGG功能得到驗(yàn)證.第一章,緒論.該章主要介紹論文的背景,論述了復(fù)雜疾病的復(fù)雜性與危害性,探討了探索復(fù)雜疾病臨界點(diǎn)的必要性.并且介紹了在過(guò)去的研究中幾種探索復(fù)雜疾病臨界點(diǎn)的方法或算法.第二章,預(yù)備知識(shí).在該章中介紹了隱馬爾科夫模型的幾個(gè)重要步驟,臨界點(diǎn)分岔理論與構(gòu)造個(gè)體特異性網(wǎng)絡(luò)的方法,以上皆是本文的算法基礎(chǔ).第三章,算法設(shè)計(jì).在該章中敘述了兩種挖掘復(fù)雜疾病臨界點(diǎn)的算法的算法步驟,一種算法是結(jié)合了臨界分岔理論,構(gòu)建了一種基于多樣本的指標(biāo);另一種算法結(jié)合了個(gè)體特異性網(wǎng)絡(luò)的性質(zhì),構(gòu)建了一種基于單樣本的指標(biāo).兩種指標(biāo)均能夠在疾病臨界狀態(tài)時(shí)發(fā)出預(yù)警信號(hào).第四章,仿真實(shí)驗(yàn).在該章中構(gòu)建了一個(gè)具有9個(gè)節(jié)點(diǎn)的仿真網(wǎng)絡(luò),首先對(duì)臨界點(diǎn)分岔理論、個(gè)體特異性網(wǎng)絡(luò)的性質(zhì)在仿真數(shù)據(jù)中進(jìn)行驗(yàn)證,然后分別將兩種指標(biāo)應(yīng)用在仿真網(wǎng)絡(luò)數(shù)據(jù)上,均在系統(tǒng)參數(shù)→0時(shí)發(fā)出預(yù)警信號(hào),成功挖掘出其臨界狀態(tài).第五章,實(shí)際應(yīng)用.在該章中我們將兩種指標(biāo)應(yīng)用至小鼠肺部損傷數(shù)據(jù)與人類(lèi)乳腺癌數(shù)據(jù)中,均得到一致的結(jié)論:小鼠暴露在光氣后的第4小時(shí)到第8小時(shí)進(jìn)入臨界狀態(tài),而乳腺癌在狀態(tài)IIB到IIIA期間進(jìn)入臨界狀態(tài).為驗(yàn)證結(jié)果,本文進(jìn)行了留一法交叉檢驗(yàn),驗(yàn)證了結(jié)果的穩(wěn)定性.另外,我們分析了在所探測(cè)的臨界點(diǎn)中表達(dá)最具有顯著差異基因:結(jié)合生存分析,發(fā)現(xiàn)ABCA10、ADAM33、BAI3等基因?qū)θ橄侔┯酗@著影響;結(jié)合功能分析,發(fā)現(xiàn)這些所在的通路與疾病有密切的聯(lián)系.
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:R-05;O211.62
【圖文】:
圖 3-1: 基于多樣本的綜合不一致性指標(biāo)構(gòu)建方法其中Δ , ( 1) = , ( 1) , ( 2) (3-1那么, 當(dāng)Δ , ( 1) > 那么認(rèn)為該邊發(fā)生顯著改變,PCC Thresh認(rèn)為是正常狀態(tài)下Δ 波動(dòng)范圍的最大值. 不妨記針對(duì)第i 個(gè)基因而言共有m 個(gè)相鄰的基因, 其中有n 的邊發(fā)生了顯著改變, 那么改變邊數(shù)比例 ( 1) /m . 并以所有基因改變邊數(shù)比例作為觀測(cè)序列, 即 1= ( 1( 1) , 2( 1) , . . . , ( 1)) (3-2步驟四:訓(xùn)練HMM模型利用t=1, 2, …, T-1的觀測(cè)序列作為學(xué)習(xí)樣本, 利用上文隱馬爾科夫模型訓(xùn)練方法所述得到HMM 模型 1=( 1, 1, 1) .步驟五:計(jì)算不一致性指標(biāo)
步驟三:訓(xùn)練HMM模型以T-1時(shí)刻以前實(shí)驗(yàn)樣本所有的基因?qū)ψ鳛橛?xùn)練樣本, 即在T-1時(shí)刻時(shí)候以觀測(cè)序列 1= { 1, 2,, ..., 1}訓(xùn)練模型, 并認(rèn)為這些樣本均處于W0狀態(tài), 利用隱馬爾科夫模型的訓(xùn)練步驟(見(jiàn)本文2.2.2章節(jié)), 得到T-1時(shí)刻的隱馬爾科夫模型 1( 1, 1, 1) .步驟四:計(jì)算不一致性指標(biāo)對(duì)實(shí)驗(yàn)樣本進(jìn)行以下操作:用訓(xùn)練得到的 T 1, 計(jì)算實(shí)驗(yàn)組在T時(shí)刻觀測(cè)序列為 的不一致性指標(biāo) case(T). 同理對(duì)對(duì)照樣本進(jìn)行步驟二到四,得到對(duì)照樣本在T時(shí)刻各個(gè)樣本的 control(T).步驟五:計(jì)算基于單樣本的綜合不一致性指標(biāo)在該步中, 計(jì)算基于單樣本的疾病指標(biāo) *( ): *( ) = case(T) control(T) (3-6以 *( )作為基于單樣本的綜合不一致性指標(biāo). 如果I*(T)發(fā)生急劇上升的話, 則認(rèn)為T(mén)為臨界點(diǎn). 否則進(jìn)入下一個(gè)時(shí)間點(diǎn), 回到步驟二.
即Pc為該微分方程一個(gè)分岔點(diǎn). 通過(guò)上文方程, 可以得到如圖4-1的網(wǎng)絡(luò)結(jié)構(gòu), 在該圖中, 紅色線代表正向調(diào)節(jié)作用, 例如隨著節(jié)點(diǎn)1的濃度提高, 影響節(jié)點(diǎn)2的濃度同時(shí)升高.而綠色線代表反向調(diào)節(jié)作用, 例如節(jié)點(diǎn)1的濃度的提高, 那么會(huì)使節(jié)點(diǎn)3的濃度降低. 當(dāng)兩個(gè)節(jié)點(diǎn)之間不存在方向線時(shí), 則說(shuō)明該兩點(diǎn)濃度并無(wú)直接的關(guān)系.4.2 多樣本綜合不一致性指標(biāo)在仿真數(shù)據(jù)中的應(yīng)用多樣本綜合不一致性指標(biāo)是基于臨界分岔理論的基礎(chǔ)上所構(gòu)建的
本文編號(hào):2766234
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類(lèi)號(hào)】:R-05;O211.62
【圖文】:
圖 3-1: 基于多樣本的綜合不一致性指標(biāo)構(gòu)建方法其中Δ , ( 1) = , ( 1) , ( 2) (3-1那么, 當(dāng)Δ , ( 1) > 那么認(rèn)為該邊發(fā)生顯著改變,PCC Thresh認(rèn)為是正常狀態(tài)下Δ 波動(dòng)范圍的最大值. 不妨記針對(duì)第i 個(gè)基因而言共有m 個(gè)相鄰的基因, 其中有n 的邊發(fā)生了顯著改變, 那么改變邊數(shù)比例 ( 1) /m . 并以所有基因改變邊數(shù)比例作為觀測(cè)序列, 即 1= ( 1( 1) , 2( 1) , . . . , ( 1)) (3-2步驟四:訓(xùn)練HMM模型利用t=1, 2, …, T-1的觀測(cè)序列作為學(xué)習(xí)樣本, 利用上文隱馬爾科夫模型訓(xùn)練方法所述得到HMM 模型 1=( 1, 1, 1) .步驟五:計(jì)算不一致性指標(biāo)
步驟三:訓(xùn)練HMM模型以T-1時(shí)刻以前實(shí)驗(yàn)樣本所有的基因?qū)ψ鳛橛?xùn)練樣本, 即在T-1時(shí)刻時(shí)候以觀測(cè)序列 1= { 1, 2,, ..., 1}訓(xùn)練模型, 并認(rèn)為這些樣本均處于W0狀態(tài), 利用隱馬爾科夫模型的訓(xùn)練步驟(見(jiàn)本文2.2.2章節(jié)), 得到T-1時(shí)刻的隱馬爾科夫模型 1( 1, 1, 1) .步驟四:計(jì)算不一致性指標(biāo)對(duì)實(shí)驗(yàn)樣本進(jìn)行以下操作:用訓(xùn)練得到的 T 1, 計(jì)算實(shí)驗(yàn)組在T時(shí)刻觀測(cè)序列為 的不一致性指標(biāo) case(T). 同理對(duì)對(duì)照樣本進(jìn)行步驟二到四,得到對(duì)照樣本在T時(shí)刻各個(gè)樣本的 control(T).步驟五:計(jì)算基于單樣本的綜合不一致性指標(biāo)在該步中, 計(jì)算基于單樣本的疾病指標(biāo) *( ): *( ) = case(T) control(T) (3-6以 *( )作為基于單樣本的綜合不一致性指標(biāo). 如果I*(T)發(fā)生急劇上升的話, 則認(rèn)為T(mén)為臨界點(diǎn). 否則進(jìn)入下一個(gè)時(shí)間點(diǎn), 回到步驟二.
即Pc為該微分方程一個(gè)分岔點(diǎn). 通過(guò)上文方程, 可以得到如圖4-1的網(wǎng)絡(luò)結(jié)構(gòu), 在該圖中, 紅色線代表正向調(diào)節(jié)作用, 例如隨著節(jié)點(diǎn)1的濃度提高, 影響節(jié)點(diǎn)2的濃度同時(shí)升高.而綠色線代表反向調(diào)節(jié)作用, 例如節(jié)點(diǎn)1的濃度的提高, 那么會(huì)使節(jié)點(diǎn)3的濃度降低. 當(dāng)兩個(gè)節(jié)點(diǎn)之間不存在方向線時(shí), 則說(shuō)明該兩點(diǎn)濃度并無(wú)直接的關(guān)系.4.2 多樣本綜合不一致性指標(biāo)在仿真數(shù)據(jù)中的應(yīng)用多樣本綜合不一致性指標(biāo)是基于臨界分岔理論的基礎(chǔ)上所構(gòu)建的
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 王靜;吳鶯;余小燕;蔣雙紅;胡麗超;周紅;;鈣信號(hào)在PAR2激動(dòng)劑促進(jìn)SW620細(xì)胞增殖中的作用[J];江蘇醫(yī)藥;2013年13期
本文編號(hào):2766234
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2766234.html
最近更新
教材專(zhuān)著