基于分層貝葉斯網(wǎng)絡(luò)的醫(yī)務(wù)人員健康風(fēng)險(xiǎn)評估研究
發(fā)布時(shí)間:2021-08-17 04:21
健康體檢數(shù)據(jù)是健康醫(yī)療大數(shù)據(jù)中最主要的數(shù)據(jù)來源和數(shù)據(jù)類型之一。在大數(shù)據(jù)時(shí)代到來的今天,醫(yī)療系統(tǒng)中已經(jīng)積累了大量的各行業(yè)體檢記錄,通過體檢數(shù)據(jù)進(jìn)行健康風(fēng)險(xiǎn)評估以提供健康管理方案具有重要意義。本文探討的對體檢記錄數(shù)據(jù)的分析方法將為健康管理提供更精準(zhǔn)的依據(jù)。為了評估體檢者的健康風(fēng)險(xiǎn)并提供健康管理方案,常用的方法是基于概率估計(jì)的風(fēng)險(xiǎn)度量方法,即根據(jù)體檢者已知的個(gè)人信息推斷各體檢項(xiàng)目的異常概率。貝葉斯網(wǎng)絡(luò)作為一種概率圖模型,可以基于健康體檢數(shù)據(jù)來訓(xùn)練發(fā)掘不同信息變量間的關(guān)聯(lián)關(guān)系并進(jìn)行后驗(yàn)概率推斷,因此本文基于貝葉斯網(wǎng)絡(luò)模型來評估體檢者的健康風(fēng)險(xiǎn)。本文將刻畫體檢記錄數(shù)據(jù)的的貝葉斯網(wǎng)絡(luò)劃分為“基本信息層”及“體檢項(xiàng)目層”兩個(gè)層次,并設(shè)計(jì)了一種由含有缺失值的體檢數(shù)據(jù)驅(qū)動(dòng)的帶約束分層貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法:首先基于半樸素貝葉斯算法(TAN)學(xué)習(xí)基本信息層內(nèi)部的連接,并限制層間連接的方向(稱為“分層TAN型約束”);然后采用集成方法(Bagging)學(xué)習(xí)網(wǎng)絡(luò)整體結(jié)構(gòu)(包含體檢項(xiàng)目層內(nèi)部連接及兩層間連接),即采用自助采樣獲得結(jié)點(diǎn)連接的置信度,其中基學(xué)習(xí)算法為結(jié)構(gòu)EM算法;為了進(jìn)一步提高模型的泛化能力,在Ba...
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.2:?“尾到尾”形態(tài)圖,又稱為“同父結(jié)構(gòu)”(common?parent)
?山東大學(xué)碩士學(xué)位論文???這將帶來X與F的條件獨(dú)立性:??P{X,Y\Z)=?=?P(X?\?Z)P{Y?\?Z).?(2.11)??& ̄ ̄? ̄ ̄<E)??圖2.2:?“尾到尾”形態(tài)圖,又稱為“同父結(jié)構(gòu)”(common?parent)。以變量Z??為條件,X與:K此時(shí)是條件獨(dú)立的。??(2)?“頭到尾”形態(tài)見圖2.3,?X,Z,Y按照順序依次排列,這個(gè)圖的聯(lián)合概率密??度表示為??P(X,?Y,?Z)?=?P{X)P{Z?|?X)P(Y?|?Z).?(2.12)??此時(shí)會(huì)發(fā)現(xiàn)當(dāng)Z為已知條件時(shí),X和K的相關(guān)性被切斷:??,?7、?P(X,?Y,?Z)?P(X)P(Z?|?X)P(Y?|?Z)??P(X,Y\Z)=?p{z)?=?W)???=P(Y?1?Z)?=?P(X?1?Z)P(F?1?Z).?(2.13)??? ̄ ̄<£) ̄ ̄<r)??圖2.3:?“頭到尾”形態(tài)圖,又稱為“順序結(jié)構(gòu)”。以變量Z為條件,X與y??此時(shí)也是條件獨(dú)立的。這說明Z的存在并沒有沿著連接方向?qū)⒁蕾囆杂桑??傳遞向y,反而將依賴性切斷。??(3)?“頭到頭”形態(tài)見圖2.4,?Z是X,y共同的子結(jié)點(diǎn)。這個(gè)圖的聯(lián)合概率密度??也容易寫出:??P(X,?y,?Z)?=?P(X)P(Y)P(Z?I?X,?Y).?(2.14)??然而,將此代入尸(X,y?I?z)中不再能得到條件獨(dú)立性定義,因此這種形態(tài)??下一般不能推出條件獨(dú)立。雖然X和y這時(shí)顯然是(無條件)獨(dú)立的,但??在以Z為條件時(shí)非條件獨(dú)立。??如果拓展到任意一個(gè)有向無環(huán)圖,聯(lián)合概率分布的條件獨(dú)立性可以由d-劃??分(d-separation)直接判斷,其中d表示有向(direc
?山東大學(xué)碩士學(xué)位論文???? ̄ ̄<£> ̄ ̄???圖2.4:?“頭到頭”形態(tài)圖,以己知的變量值z為條件時(shí),文中己顯示x與y??并不是條件獨(dú)立的。然而,如果不考慮結(jié)點(diǎn)z時(shí),x與y是獨(dú)立的,因?yàn)楦??據(jù)式(2.14)可知?p(x,y)?=?=??P(X)P(Y)〇??連接路徑是否被某些結(jié)點(diǎn)所阻隔(blocked)。d-劃分的具體描述可參考Bishop^3]??(2006)〇??2.2.2結(jié)構(gòu)學(xué)習(xí)??貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)是從給定的數(shù)據(jù)集中挖掘合理的貝葉斯網(wǎng)絡(luò)拓?fù)浣Y(jié)??構(gòu)的過程。通常有兩類結(jié)構(gòu)學(xué)習(xí)方法:“基于約束”(constraint-based)的方法和??“基于評分”(score-based)的方法。??“基于約束”方法篩查變量間的條件獨(dú)立性并直接匯總成為完整網(wǎng)絡(luò),例如??TAN構(gòu)建時(shí)使用條件互信息判定。常用的算法有SGS算法(Spirtes?et?al._,??2000)、PC算法(Spirtes?&?Meek。常常,?1995)等。這種方法高度依賴于單次條件獨(dú)??立性檢驗(yàn)的結(jié)果,即如果其中某個(gè)檢驗(yàn)給出了有偏差的結(jié)果,就可能會(huì)影響整??個(gè)貝葉斯網(wǎng)絡(luò)的構(gòu)建;同時(shí)這些檢驗(yàn)通常只能關(guān)注局部信息,缺少對多變量相??關(guān)關(guān)系的處理能力,因而本文中僅將約束作為結(jié)構(gòu)學(xué)習(xí)中的一個(gè)步驟。??本節(jié)中將重點(diǎn)介紹“基于評分”的方法。該方法設(shè)計(jì)評分函數(shù)(score?func???tion)?來衡量網(wǎng)絡(luò)結(jié)構(gòu)擬合給定數(shù)據(jù)集的程度。網(wǎng)絡(luò)結(jié)構(gòu)空間是由各種不同的連??接組合構(gòu)成,當(dāng)構(gòu)成網(wǎng)絡(luò)的變量數(shù)量為K時(shí),其數(shù)量級達(dá)到2G(P)。因此,在結(jié)構(gòu)??空間中尋找最優(yōu)網(wǎng)絡(luò)是一個(gè)A/"P-難(A^P-hard)問題(Chickering間,1996)
本文編號:3347046
【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:70 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.2:?“尾到尾”形態(tài)圖,又稱為“同父結(jié)構(gòu)”(common?parent)
?山東大學(xué)碩士學(xué)位論文???這將帶來X與F的條件獨(dú)立性:??P{X,Y\Z)=?=?P(X?\?Z)P{Y?\?Z).?(2.11)??& ̄ ̄? ̄ ̄<E)??圖2.2:?“尾到尾”形態(tài)圖,又稱為“同父結(jié)構(gòu)”(common?parent)。以變量Z??為條件,X與:K此時(shí)是條件獨(dú)立的。??(2)?“頭到尾”形態(tài)見圖2.3,?X,Z,Y按照順序依次排列,這個(gè)圖的聯(lián)合概率密??度表示為??P(X,?Y,?Z)?=?P{X)P{Z?|?X)P(Y?|?Z).?(2.12)??此時(shí)會(huì)發(fā)現(xiàn)當(dāng)Z為已知條件時(shí),X和K的相關(guān)性被切斷:??,?7、?P(X,?Y,?Z)?P(X)P(Z?|?X)P(Y?|?Z)??P(X,Y\Z)=?p{z)?=?W)???=P(Y?1?Z)?=?P(X?1?Z)P(F?1?Z).?(2.13)??? ̄ ̄<£) ̄ ̄<r)??圖2.3:?“頭到尾”形態(tài)圖,又稱為“順序結(jié)構(gòu)”。以變量Z為條件,X與y??此時(shí)也是條件獨(dú)立的。這說明Z的存在并沒有沿著連接方向?qū)⒁蕾囆杂桑??傳遞向y,反而將依賴性切斷。??(3)?“頭到頭”形態(tài)見圖2.4,?Z是X,y共同的子結(jié)點(diǎn)。這個(gè)圖的聯(lián)合概率密度??也容易寫出:??P(X,?y,?Z)?=?P(X)P(Y)P(Z?I?X,?Y).?(2.14)??然而,將此代入尸(X,y?I?z)中不再能得到條件獨(dú)立性定義,因此這種形態(tài)??下一般不能推出條件獨(dú)立。雖然X和y這時(shí)顯然是(無條件)獨(dú)立的,但??在以Z為條件時(shí)非條件獨(dú)立。??如果拓展到任意一個(gè)有向無環(huán)圖,聯(lián)合概率分布的條件獨(dú)立性可以由d-劃??分(d-separation)直接判斷,其中d表示有向(direc
?山東大學(xué)碩士學(xué)位論文???? ̄ ̄<£> ̄ ̄???圖2.4:?“頭到頭”形態(tài)圖,以己知的變量值z為條件時(shí),文中己顯示x與y??并不是條件獨(dú)立的。然而,如果不考慮結(jié)點(diǎn)z時(shí),x與y是獨(dú)立的,因?yàn)楦??據(jù)式(2.14)可知?p(x,y)?=?=??P(X)P(Y)〇??連接路徑是否被某些結(jié)點(diǎn)所阻隔(blocked)。d-劃分的具體描述可參考Bishop^3]??(2006)〇??2.2.2結(jié)構(gòu)學(xué)習(xí)??貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)學(xué)習(xí)是從給定的數(shù)據(jù)集中挖掘合理的貝葉斯網(wǎng)絡(luò)拓?fù)浣Y(jié)??構(gòu)的過程。通常有兩類結(jié)構(gòu)學(xué)習(xí)方法:“基于約束”(constraint-based)的方法和??“基于評分”(score-based)的方法。??“基于約束”方法篩查變量間的條件獨(dú)立性并直接匯總成為完整網(wǎng)絡(luò),例如??TAN構(gòu)建時(shí)使用條件互信息判定。常用的算法有SGS算法(Spirtes?et?al._,??2000)、PC算法(Spirtes?&?Meek。常常,?1995)等。這種方法高度依賴于單次條件獨(dú)??立性檢驗(yàn)的結(jié)果,即如果其中某個(gè)檢驗(yàn)給出了有偏差的結(jié)果,就可能會(huì)影響整??個(gè)貝葉斯網(wǎng)絡(luò)的構(gòu)建;同時(shí)這些檢驗(yàn)通常只能關(guān)注局部信息,缺少對多變量相??關(guān)關(guān)系的處理能力,因而本文中僅將約束作為結(jié)構(gòu)學(xué)習(xí)中的一個(gè)步驟。??本節(jié)中將重點(diǎn)介紹“基于評分”的方法。該方法設(shè)計(jì)評分函數(shù)(score?func???tion)?來衡量網(wǎng)絡(luò)結(jié)構(gòu)擬合給定數(shù)據(jù)集的程度。網(wǎng)絡(luò)結(jié)構(gòu)空間是由各種不同的連??接組合構(gòu)成,當(dāng)構(gòu)成網(wǎng)絡(luò)的變量數(shù)量為K時(shí),其數(shù)量級達(dá)到2G(P)。因此,在結(jié)構(gòu)??空間中尋找最優(yōu)網(wǎng)絡(luò)是一個(gè)A/"P-難(A^P-hard)問題(Chickering間,1996)
本文編號:3347046
本文鏈接:http://sikaile.net/shoufeilunwen/mpalunwen/3347046.html
最近更新
教材專著