懲罰函數(shù)在基因關(guān)聯(lián)分析中的應(yīng)用研究
發(fā)布時(shí)間:2021-07-07 10:06
隨著互聯(lián)網(wǎng)和計(jì)算機(jī)的迅猛發(fā)展,各領(lǐng)域都產(chǎn)生了海量的數(shù)據(jù),如生物學(xué)、計(jì)算機(jī)科學(xué)、金融學(xué)等諸多領(lǐng)域都存在種類繁多的復(fù)雜數(shù)據(jù),因此,需要從大量的數(shù)據(jù)中提取有價(jià)值的信息進(jìn)行分析。近年來,變量選擇成為了統(tǒng)計(jì)學(xué)的研究熱點(diǎn),尤其是懲罰項(xiàng)正則化方法,其特征是通過懲罰函數(shù)進(jìn)行變量選擇,能夠處理高維且存在共線性的數(shù)據(jù)。本文主要研究懲罰函數(shù)的變量選擇的改進(jìn)方法和在基因關(guān)聯(lián)分析中的應(yīng)用,在原有的懲罰函數(shù)模型的基礎(chǔ)上考慮變量之間的網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系,并將懲罰項(xiàng)正則化用于多因變量回歸模型。本文的內(nèi)容可分為兩個(gè)部分,具體內(nèi)容如下:1、在原有的懲罰函數(shù)模型上加入網(wǎng)絡(luò)懲罰項(xiàng)本文中在單個(gè)變量選擇的模型上,考慮了變量之間的網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系。通過對(duì)四種不同類型的數(shù)據(jù)進(jìn)行模擬研究,并以前列腺癌基因表達(dá)譜數(shù)據(jù)進(jìn)行實(shí)例驗(yàn)證,分別比較基于網(wǎng)絡(luò)結(jié)構(gòu)的懲罰函數(shù)的變量選擇模型和基于懲罰函數(shù)的變量選擇模型的優(yōu)劣性,結(jié)果表明:基于網(wǎng)絡(luò)結(jié)構(gòu)的懲罰函數(shù)模型較原有的懲罰函數(shù)模型更具有優(yōu)越性和穩(wěn)定性,尤其是基于MCP懲罰函數(shù)的網(wǎng)絡(luò)結(jié)構(gòu)模型有較高的預(yù)測能力,對(duì)于發(fā)現(xiàn)患有前列腺癌的病人有很大的幫助。2、將懲罰函數(shù)的變量選擇方法應(yīng)用于多因變量回歸模型(1)本文詳細(xì)介...
【文章來源】:福建農(nóng)林大學(xué)福建省
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-1稀疏偏最小乘法的交叉驗(yàn)證均方差預(yù)測誤差圖??
始預(yù)測變量的線性組合來實(shí)現(xiàn)變量選擇和預(yù)測。??借助R語言的SPLS包實(shí)現(xiàn)稀疏偏最小二乘方法的基因關(guān)聯(lián)分析,采用除一??法的交叉驗(yàn)證均方差預(yù)測誤差得到圖4-1:??CV?MSPE?Plot??。9邏?,吖,??08?159?-??。71?M?--??s?〇.5?-?m??134'??04?-??126?-??〇3|:i?mm?-??0?2?4.??|??011::?I?1。9?七:._??r-r-?i?■?■?■?■■?i??123456789?10??K??圖4-1稀疏偏最小乘法的交叉驗(yàn)證均方差預(yù)測誤差圖??其中橫坐標(biāo)表示成分個(gè)數(shù),縱坐標(biāo)表示閾值參數(shù)'的范圍為[0,1]。??由圖4-1得到:當(dāng)尤=1,?4=0.9時(shí),可以得到最小均方差預(yù)測誤差。將參??數(shù)代入,選出了?11個(gè)顯著變量,具體見表4-3:??38??
【參考文獻(xiàn)】:
期刊論文
[1]基于Logistic回歸懲罰函數(shù)的疾病診斷[J]. 莊虹莉,李立婷,林雨婷,溫永仙. 中國衛(wèi)生統(tǒng)計(jì). 2017(01)
[2]多個(gè)相關(guān)數(shù)量性狀主基因的聯(lián)合分析方法[J]. 肖靜,胡治球,湯在祥,隋炯明,李欣,徐辰武. 中國農(nóng)業(yè)科學(xué). 2005(09)
本文編號(hào):3269436
【文章來源】:福建農(nóng)林大學(xué)福建省
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-1稀疏偏最小乘法的交叉驗(yàn)證均方差預(yù)測誤差圖??
始預(yù)測變量的線性組合來實(shí)現(xiàn)變量選擇和預(yù)測。??借助R語言的SPLS包實(shí)現(xiàn)稀疏偏最小二乘方法的基因關(guān)聯(lián)分析,采用除一??法的交叉驗(yàn)證均方差預(yù)測誤差得到圖4-1:??CV?MSPE?Plot??。9邏?,吖,??08?159?-??。71?M?--??s?〇.5?-?m??134'??04?-??126?-??〇3|:i?mm?-??0?2?4.??|??011::?I?1。9?七:._??r-r-?i?■?■?■?■■?i??123456789?10??K??圖4-1稀疏偏最小乘法的交叉驗(yàn)證均方差預(yù)測誤差圖??其中橫坐標(biāo)表示成分個(gè)數(shù),縱坐標(biāo)表示閾值參數(shù)'的范圍為[0,1]。??由圖4-1得到:當(dāng)尤=1,?4=0.9時(shí),可以得到最小均方差預(yù)測誤差。將參??數(shù)代入,選出了?11個(gè)顯著變量,具體見表4-3:??38??
【參考文獻(xiàn)】:
期刊論文
[1]基于Logistic回歸懲罰函數(shù)的疾病診斷[J]. 莊虹莉,李立婷,林雨婷,溫永仙. 中國衛(wèi)生統(tǒng)計(jì). 2017(01)
[2]多個(gè)相關(guān)數(shù)量性狀主基因的聯(lián)合分析方法[J]. 肖靜,胡治球,湯在祥,隋炯明,李欣,徐辰武. 中國農(nóng)業(yè)科學(xué). 2005(09)
本文編號(hào):3269436
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3269436.html
最近更新
教材專著