基于LASSO的肝癌預(yù)后風(fēng)險(xiǎn)基因的數(shù)據(jù)挖掘分析
發(fā)布時(shí)間:2022-12-23 22:46
目前,肝癌是我國(guó)乃至世界各國(guó)常見(jiàn)的惡性腫瘤之一,死亡率極高,嚴(yán)重地危害著人們的生命健康,更是給廣大家庭帶來(lái)了極大的經(jīng)濟(jì)和精神壓力。由于傳統(tǒng)藥物治療具有很大的局限性,難以達(dá)到預(yù)期的治療效果。靶向基因治療是一種新的治療肝癌途徑,這種方法更具有針對(duì)性,因而具有較好的療效前景,但是靶向基因治療需要選擇合適的基因,也就是從復(fù)雜的基因數(shù)據(jù)中挖掘出合適的基因標(biāo)志物。本文首先利用10折交叉驗(yàn)證的LASSO回歸分析方法對(duì)肝癌病人的基因數(shù)據(jù)進(jìn)行降維處理,進(jìn)而篩選出26個(gè)基因標(biāo)志物;然后利用這26個(gè)基因標(biāo)志物構(gòu)建了預(yù)后模型,并且分別在訓(xùn)練集和驗(yàn)證集上進(jìn)行了實(shí)驗(yàn),結(jié)果表明該模型性能良好;最后對(duì)這26個(gè)基因標(biāo)志物進(jìn)行了在線基因功能分析,通過(guò)查證相關(guān)文獻(xiàn)表明:本文挖掘的基因標(biāo)志物對(duì)于后續(xù)的肝癌臨床治療研究有一定的參考價(jià)值。
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 數(shù)據(jù)挖掘的簡(jiǎn)介
1.1.1 數(shù)據(jù)挖掘的發(fā)展背景
1.1.2 數(shù)據(jù)挖掘簡(jiǎn)要流程
1.1.3 數(shù)據(jù)挖掘重要算法介紹與發(fā)展趨勢(shì)
1.2 數(shù)據(jù)挖掘在生物信息領(lǐng)域內(nèi)的應(yīng)用
1.2.1 生物信息學(xué)簡(jiǎn)介
1.2.2 基因芯片技術(shù)的意義
1.2.3 基因表達(dá)譜的數(shù)學(xué)模型解釋
1.2.4 利用基因表達(dá)譜進(jìn)行數(shù)據(jù)挖掘的研究進(jìn)展
1.2.5 預(yù)后基因標(biāo)志物的研究進(jìn)展
1.3 本文研究目的和意義
1.4 本文研究的內(nèi)容以及組織結(jié)構(gòu)
第二章 相關(guān)方法的研究
2.1 理論方法
2.1.1 最小二乘法
2.1.2 嶺回歸
2.1.3 LASSO回歸
2.1.4 Cox回歸模型
2.1.5 檢驗(yàn)假設(shè)
2.2 技術(shù)方法
2.3 本章小結(jié)
第三章 數(shù)據(jù)挖掘方法的實(shí)現(xiàn)
3.1 數(shù)據(jù)準(zhǔn)備
3.2 實(shí)現(xiàn)步驟
3.2.1 基因差異表達(dá)分析
3.2.2 Cox回歸分析
3.2.3 嶺回歸分析
3.2.4 基于k折交叉驗(yàn)證的LASSO回歸分析
3.3 預(yù)后指數(shù)的構(gòu)建
3.3.1 嶺回歸與LASSO回歸的比較
3.4 本章小結(jié)
第四章 結(jié)果驗(yàn)證與分析
4.1 結(jié)果驗(yàn)證
4.1.1 在驗(yàn)證集樣本上的驗(yàn)證
4.1.2 基于臨床變量的驗(yàn)證
4.1.3 基于GDC數(shù)據(jù)集的驗(yàn)證
4.2 預(yù)后基因功能分析
4.2.1 基于David的功能分析
4.2.2 基于STRING的功能分析
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 主要結(jié)論
5.2 研究展望
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]術(shù)前CEA、CA153水平在乳腺癌患者中預(yù)測(cè)預(yù)后的價(jià)值[J]. 何秀玉,馮增鵬,李杰. 中國(guó)現(xiàn)代醫(yī)生. 2019(02)
[2]基于癌癥基因組圖譜構(gòu)建胃癌預(yù)后評(píng)估模型[J]. 王舉,竇忠霞,姜洪偉,王永強(qiáng),高小平,張勇. 天津醫(yī)藥. 2018(12)
[3]胃癌基因標(biāo)志物調(diào)控網(wǎng)絡(luò)模型的初步建立[J]. 李璐. 中國(guó)腫瘤. 2017(08)
[4]基于前綴項(xiàng)集的Apriori算法改進(jìn)[J]. 于守健,周羿陽(yáng). 計(jì)算機(jī)應(yīng)用與軟件. 2017(02)
[5]基于SVM的嵌入式特征基因選擇方法研究[J]. 張世芝,張明錦. 計(jì)算機(jī)與應(yīng)用化學(xué). 2016(01)
[6]大數(shù)據(jù)背景下醫(yī)學(xué)數(shù)據(jù)挖掘的研究進(jìn)展及應(yīng)用[J]. 秦文哲,陳進(jìn),董力. 中國(guó)胸心血管外科臨床雜志. 2016(01)
[7]數(shù)據(jù)挖掘及其在醫(yī)學(xué)信息中的應(yīng)用[J]. 石曉敬. 醫(yī)學(xué)信息學(xué)雜志. 2013(05)
[8]基于SVM和平均影響值的人腫瘤信息基因提取[J]. 李凌波,張靜,陳丹. 生物信息學(xué). 2013(01)
[9]數(shù)據(jù)挖掘的研究進(jìn)展及在臨床醫(yī)學(xué)中的應(yīng)用[J]. 周攀,王開正. 國(guó)際檢驗(yàn)醫(yī)學(xué)雜志. 2012(10)
[10]遺傳算法研究綜述[J]. 葛繼科,邱玉輝,吳春明,蒲國(guó)林. 計(jì)算機(jī)應(yīng)用研究. 2008(10)
碩士論文
[1]基于機(jī)器學(xué)習(xí)和智能優(yōu)化的腫瘤基因表達(dá)數(shù)據(jù)挖掘研究[D]. 高凌云.皖南醫(yī)學(xué)院 2018
本文編號(hào):3725554
【文章頁(yè)數(shù)】:57 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 數(shù)據(jù)挖掘的簡(jiǎn)介
1.1.1 數(shù)據(jù)挖掘的發(fā)展背景
1.1.2 數(shù)據(jù)挖掘簡(jiǎn)要流程
1.1.3 數(shù)據(jù)挖掘重要算法介紹與發(fā)展趨勢(shì)
1.2 數(shù)據(jù)挖掘在生物信息領(lǐng)域內(nèi)的應(yīng)用
1.2.1 生物信息學(xué)簡(jiǎn)介
1.2.2 基因芯片技術(shù)的意義
1.2.3 基因表達(dá)譜的數(shù)學(xué)模型解釋
1.2.4 利用基因表達(dá)譜進(jìn)行數(shù)據(jù)挖掘的研究進(jìn)展
1.2.5 預(yù)后基因標(biāo)志物的研究進(jìn)展
1.3 本文研究目的和意義
1.4 本文研究的內(nèi)容以及組織結(jié)構(gòu)
第二章 相關(guān)方法的研究
2.1 理論方法
2.1.1 最小二乘法
2.1.2 嶺回歸
2.1.3 LASSO回歸
2.1.4 Cox回歸模型
2.1.5 檢驗(yàn)假設(shè)
2.2 技術(shù)方法
2.3 本章小結(jié)
第三章 數(shù)據(jù)挖掘方法的實(shí)現(xiàn)
3.1 數(shù)據(jù)準(zhǔn)備
3.2 實(shí)現(xiàn)步驟
3.2.1 基因差異表達(dá)分析
3.2.2 Cox回歸分析
3.2.3 嶺回歸分析
3.2.4 基于k折交叉驗(yàn)證的LASSO回歸分析
3.3 預(yù)后指數(shù)的構(gòu)建
3.3.1 嶺回歸與LASSO回歸的比較
3.4 本章小結(jié)
第四章 結(jié)果驗(yàn)證與分析
4.1 結(jié)果驗(yàn)證
4.1.1 在驗(yàn)證集樣本上的驗(yàn)證
4.1.2 基于臨床變量的驗(yàn)證
4.1.3 基于GDC數(shù)據(jù)集的驗(yàn)證
4.2 預(yù)后基因功能分析
4.2.1 基于David的功能分析
4.2.2 基于STRING的功能分析
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 主要結(jié)論
5.2 研究展望
參考文獻(xiàn)
在學(xué)期間的研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]術(shù)前CEA、CA153水平在乳腺癌患者中預(yù)測(cè)預(yù)后的價(jià)值[J]. 何秀玉,馮增鵬,李杰. 中國(guó)現(xiàn)代醫(yī)生. 2019(02)
[2]基于癌癥基因組圖譜構(gòu)建胃癌預(yù)后評(píng)估模型[J]. 王舉,竇忠霞,姜洪偉,王永強(qiáng),高小平,張勇. 天津醫(yī)藥. 2018(12)
[3]胃癌基因標(biāo)志物調(diào)控網(wǎng)絡(luò)模型的初步建立[J]. 李璐. 中國(guó)腫瘤. 2017(08)
[4]基于前綴項(xiàng)集的Apriori算法改進(jìn)[J]. 于守健,周羿陽(yáng). 計(jì)算機(jī)應(yīng)用與軟件. 2017(02)
[5]基于SVM的嵌入式特征基因選擇方法研究[J]. 張世芝,張明錦. 計(jì)算機(jī)與應(yīng)用化學(xué). 2016(01)
[6]大數(shù)據(jù)背景下醫(yī)學(xué)數(shù)據(jù)挖掘的研究進(jìn)展及應(yīng)用[J]. 秦文哲,陳進(jìn),董力. 中國(guó)胸心血管外科臨床雜志. 2016(01)
[7]數(shù)據(jù)挖掘及其在醫(yī)學(xué)信息中的應(yīng)用[J]. 石曉敬. 醫(yī)學(xué)信息學(xué)雜志. 2013(05)
[8]基于SVM和平均影響值的人腫瘤信息基因提取[J]. 李凌波,張靜,陳丹. 生物信息學(xué). 2013(01)
[9]數(shù)據(jù)挖掘的研究進(jìn)展及在臨床醫(yī)學(xué)中的應(yīng)用[J]. 周攀,王開正. 國(guó)際檢驗(yàn)醫(yī)學(xué)雜志. 2012(10)
[10]遺傳算法研究綜述[J]. 葛繼科,邱玉輝,吳春明,蒲國(guó)林. 計(jì)算機(jī)應(yīng)用研究. 2008(10)
碩士論文
[1]基于機(jī)器學(xué)習(xí)和智能優(yōu)化的腫瘤基因表達(dá)數(shù)據(jù)挖掘研究[D]. 高凌云.皖南醫(yī)學(xué)院 2018
本文編號(hào):3725554
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3725554.html
最近更新
教材專著