基于自助法的貝葉斯網(wǎng)結(jié)構(gòu)學(xué)習(xí)
發(fā)布時(shí)間:2021-08-12 22:16
貝葉斯網(wǎng)是描述隨機(jī)變量間關(guān)系的一種模型,它以有向無圈圖(DAG)表示隨機(jī)變量的條件獨(dú)立關(guān)系,以條件概率表示隨機(jī)變量依賴關(guān)系的強(qiáng)度。目前,貝葉斯網(wǎng)被廣泛地應(yīng)用于因果推斷、機(jī)器學(xué)習(xí)、心理學(xué)等領(lǐng)域。研究貝葉斯網(wǎng)的非常重要的問題之一是結(jié)構(gòu)學(xué)習(xí),也就是從觀測數(shù)據(jù)出發(fā)探求變量間的條件獨(dú)立關(guān)系。本文基于自助法給出高斯貝葉斯網(wǎng)的結(jié)構(gòu)學(xué)習(xí)算法。該算法第一步,先得到B個(gè)Bootstrap樣本;第二步,利用結(jié)構(gòu)學(xué)習(xí)算法得到B個(gè)DAG,并求得B個(gè)DAG對應(yīng)貝葉斯網(wǎng)的極大似然估計(jì);第三步,搜索一個(gè)DAG,使其對應(yīng)的貝葉斯網(wǎng)的極大似然估計(jì),與B個(gè)極大似然估計(jì)平均的懲罰Kullback-Leibler(KL)距離最近。其中在第三步,我們以B個(gè)DAG中出現(xiàn)的邊作為候選邊搜索DAG,這樣可以大大提高搜索的速度。本文通過模擬實(shí)驗(yàn)發(fā)現(xiàn),自助法可以大大提高結(jié)構(gòu)學(xué)習(xí)的效果。我們與PC算法、GES算法、GDS算法、GDSM算法進(jìn)行了比較分析,模擬結(jié)果顯示自助法表現(xiàn)最好。我們分析了39個(gè)基因的表達(dá)數(shù)據(jù),探索了基因之間的關(guān)系。
【文章來源】:長春工業(yè)大學(xué)吉林省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
2,3是三個(gè)等價(jià)的DAG再來看一個(gè)例子
第4章模擬實(shí)驗(yàn)24采用ges算法還是采用pc算法,對于閾值f的不同取值和兩種初值方式,得到的CPDAG的結(jié)構(gòu)海明距離和DAG的結(jié)構(gòu)海明距離均明顯小于ges和pc的結(jié)構(gòu)海明距離。并且閾值f較小時(shí),與真實(shí)圖的結(jié)構(gòu)海明距離也較小,例如gesb10、gesbR10和pcb10、pcbR10。對于兩種初值方式,隨機(jī)DAG的初值,對f的選取依賴更小一些。圖4.1a=20,=100時(shí)24種算法的箱線圖(CPDAG)圖4.1b=20,=100時(shí)24種算法的箱線圖(DAG)
第4章模擬實(shí)驗(yàn)24采用ges算法還是采用pc算法,對于閾值f的不同取值和兩種初值方式,得到的CPDAG的結(jié)構(gòu)海明距離和DAG的結(jié)構(gòu)海明距離均明顯小于ges和pc的結(jié)構(gòu)海明距離。并且閾值f較小時(shí),與真實(shí)圖的結(jié)構(gòu)海明距離也較小,例如gesb10、gesbR10和pcb10、pcbR10。對于兩種初值方式,隨機(jī)DAG的初值,對f的選取依賴更小一些。圖4.1a=20,=100時(shí)24種算法的箱線圖(CPDAG)圖4.1b=20,=100時(shí)24種算法的箱線圖(DAG)
【參考文獻(xiàn)】:
期刊論文
[1]基于bootstrap方法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法在構(gòu)建基因調(diào)控網(wǎng)絡(luò)中的應(yīng)用[J]. 李海龍,侯艷,柯朝甫,李康. 中國衛(wèi)生統(tǒng)計(jì). 2015(02)
碩士論文
[1]基于重抽樣方法的含缺失數(shù)據(jù)圖模型的模型選擇[D]. 秦銘.長春工業(yè)大學(xué) 2019
本文編號:3339176
【文章來源】:長春工業(yè)大學(xué)吉林省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
2,3是三個(gè)等價(jià)的DAG再來看一個(gè)例子
第4章模擬實(shí)驗(yàn)24采用ges算法還是采用pc算法,對于閾值f的不同取值和兩種初值方式,得到的CPDAG的結(jié)構(gòu)海明距離和DAG的結(jié)構(gòu)海明距離均明顯小于ges和pc的結(jié)構(gòu)海明距離。并且閾值f較小時(shí),與真實(shí)圖的結(jié)構(gòu)海明距離也較小,例如gesb10、gesbR10和pcb10、pcbR10。對于兩種初值方式,隨機(jī)DAG的初值,對f的選取依賴更小一些。圖4.1a=20,=100時(shí)24種算法的箱線圖(CPDAG)圖4.1b=20,=100時(shí)24種算法的箱線圖(DAG)
第4章模擬實(shí)驗(yàn)24采用ges算法還是采用pc算法,對于閾值f的不同取值和兩種初值方式,得到的CPDAG的結(jié)構(gòu)海明距離和DAG的結(jié)構(gòu)海明距離均明顯小于ges和pc的結(jié)構(gòu)海明距離。并且閾值f較小時(shí),與真實(shí)圖的結(jié)構(gòu)海明距離也較小,例如gesb10、gesbR10和pcb10、pcbR10。對于兩種初值方式,隨機(jī)DAG的初值,對f的選取依賴更小一些。圖4.1a=20,=100時(shí)24種算法的箱線圖(CPDAG)圖4.1b=20,=100時(shí)24種算法的箱線圖(DAG)
【參考文獻(xiàn)】:
期刊論文
[1]基于bootstrap方法的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法在構(gòu)建基因調(diào)控網(wǎng)絡(luò)中的應(yīng)用[J]. 李海龍,侯艷,柯朝甫,李康. 中國衛(wèi)生統(tǒng)計(jì). 2015(02)
碩士論文
[1]基于重抽樣方法的含缺失數(shù)據(jù)圖模型的模型選擇[D]. 秦銘.長春工業(yè)大學(xué) 2019
本文編號:3339176
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3339176.html
最近更新
教材專著