廣義線性模型的錯(cuò)誤發(fā)現(xiàn)率研究
發(fā)布時(shí)間:2021-07-26 13:23
廣義線性模型是由Nelder和Wedderburn于1972年提出的一個(gè)重要模型,它放松了線性模型要求響應(yīng)變量是高斯分布的條件,在實(shí)際問題中應(yīng)用更為廣泛.該模型將響應(yīng)變量的分布推廣到指數(shù)分布族,可以處理響應(yīng)變量為離散型和連續(xù)型的回歸問題.特別是離散型隨機(jī)變量,廣義線性模型因此對(duì)處理生物、醫(yī)學(xué)等領(lǐng)域中常見的屬性數(shù)據(jù)、計(jì)數(shù)數(shù)據(jù)有著重要意義.同時(shí)隨著科學(xué)技術(shù)的快速發(fā)展,人們需要處理的數(shù)據(jù)愈發(fā)復(fù)雜,維度也越來越高,如何高效的從數(shù)據(jù)中獲取信息日趨重要.因此,變量選擇作為統(tǒng)計(jì)建模的重要手段得到了長(zhǎng)足的發(fā)展.基于廣義線性模型的廣泛應(yīng)用和變量選擇問題的重要性,本文考慮廣義線性模型中,回歸參數(shù)多重假設(shè)檢驗(yàn)的FDR控制問題,本質(zhì)上也是變量選擇的FDR控制問題.研究目標(biāo)是在有效進(jìn)行變量選擇的同時(shí),保證不會(huì)選入過多的不重要變量.受Barber和Candes(2015)于線性模型下提出的knockoff方法啟發(fā),提出GLM-knockoff方法.GLM-knockoff方法的主要思想是通過模仿原相關(guān)矩陣的協(xié)方差結(jié)構(gòu),對(duì)每個(gè)變量構(gòu)造一個(gè)knockoff變量作為控制變量,從而控制變量選擇的FDR.本文首先從理論上證...
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:42 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
L.iSgisti}回歸中不重要變量P值的分布
圖3-4例3.2不同信號(hào)強(qiáng)度對(duì)GLM-knockoff方法FDR和Pow的影響??Figure?3-4?The?effect?of?varying?the?amplitude?to?the?FDR?and?the?Pow?of?the?GLM-knockoff?for??Example?3.2??果.固定信號(hào)強(qiáng)度A?=?1.0和模型稀疏程度fc?=?5,取不同的變纛顏關(guān)水平p時(shí)的模??擬結(jié)果見圍3-6.在圈3-4到3-6中4?GLM-knockoff?和GLM-knockoff+分別___(2-6)式??和(2-7)式所代表的兩種方法.??由圖3-4至圖3-6可知,在上述所有情況下,GLM-knockoff+均可以成功將FDR控??制在預(yù)先給定的水乎20%.而GLM-knockoff不能嚴(yán)格控制FDR,這與第2.3節(jié)的理論??結(jié)果一致,即GLM-knockoff只可以控制近似FDR.至于該方法的Pow,由面可知,Pois???son?模型中信號(hào)強(qiáng)度越小,模型越稀疏,變量之間相關(guān)性越小,?方法的?Pow?越大,即該??-23?-??
本文編號(hào):3303646
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:42 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
L.iSgisti}回歸中不重要變量P值的分布
圖3-4例3.2不同信號(hào)強(qiáng)度對(duì)GLM-knockoff方法FDR和Pow的影響??Figure?3-4?The?effect?of?varying?the?amplitude?to?the?FDR?and?the?Pow?of?the?GLM-knockoff?for??Example?3.2??果.固定信號(hào)強(qiáng)度A?=?1.0和模型稀疏程度fc?=?5,取不同的變纛顏關(guān)水平p時(shí)的模??擬結(jié)果見圍3-6.在圈3-4到3-6中4?GLM-knockoff?和GLM-knockoff+分別___(2-6)式??和(2-7)式所代表的兩種方法.??由圖3-4至圖3-6可知,在上述所有情況下,GLM-knockoff+均可以成功將FDR控??制在預(yù)先給定的水乎20%.而GLM-knockoff不能嚴(yán)格控制FDR,這與第2.3節(jié)的理論??結(jié)果一致,即GLM-knockoff只可以控制近似FDR.至于該方法的Pow,由面可知,Pois???son?模型中信號(hào)強(qiáng)度越小,模型越稀疏,變量之間相關(guān)性越小,?方法的?Pow?越大,即該??-23?-??
本文編號(hào):3303646
本文鏈接:http://sikaile.net/kejilunwen/yysx/3303646.html
最近更新
教材專著