基于機器學習的肺癌預測方法的研究與實現(xiàn)
發(fā)布時間:2021-10-10 07:39
肺癌是呼吸系統(tǒng)最常見的一種惡性腫瘤。在我國,肺癌的發(fā)病率和死亡率都高居第一位。肺癌的早期缺乏典型癥狀,一旦發(fā)現(xiàn),患者大多處于中晚期且易伴隨遠處轉(zhuǎn)移,治療變得非常困難。肺癌死亡率較高的另一個原因是它預后較差,相當一部分患者會在治療后出現(xiàn)復發(fā),肺癌的早期診斷和預后分析在提高生存率方面具有重要意義。高通量測序技術(shù)的發(fā)展及分析方法的出現(xiàn),為肺癌的預測和治療帶來了新的方向。在腫瘤的形成過程中,需要多種基因參與并相互作用,通過高通量測序技術(shù)可得到肺癌的全基因表達數(shù)據(jù),利用分子學機制研究肺癌的發(fā)生和發(fā)展,可為肺癌的早期發(fā)現(xiàn)和預后診斷提供理論支持。本研究從TCGA(癌癥基因組圖譜)和GEO兩個公共數(shù)據(jù)庫中獲取數(shù)據(jù)集作為研究對象,建立了一套肺癌的“診斷+預測”系統(tǒng),該系統(tǒng)可以篩選出肺癌的易感基因,將其作為特征構(gòu)建出肺癌的診斷模型,并判斷出肺癌的亞型類型,同時,系統(tǒng)對肺癌患者的惡性程度及康復的可能性做出了預測,可達到較高的精度。針對肺癌的早期診斷,本研究提出了一套基于機器學習的肺癌易感基因篩選及亞型分類模型,首先從TCGA數(shù)據(jù)庫中獲取到肺癌的轉(zhuǎn)錄組數(shù)據(jù)及臨床信息,運用R語言,結(jié)合limma、EdgeR及D...
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:104 頁
【學位級別】:碩士
【部分圖文】:
圖2-1層次聚類過程??11??
山東大學碩士學位論文??恨節(jié)點??1??2?3??葉子節(jié)點??4?5??葉子節(jié)點?_?7'??6?7??葉子節(jié)點葉子節(jié)點??圖2-2決策樹樹狀結(jié)構(gòu)??決策樹利用圖2-2的樹狀結(jié)構(gòu)進行決策分類,每一個葉子節(jié)點是決策的結(jié)果,??每一個非葉子節(jié)點是根據(jù)特征判斷的條件,決策樹的構(gòu)建是一個逐漸分裂的過??程,采用自頂向下的遞歸方式,主要包括特征選擇、決策樹生成、剪枝三個步驟,??特征選擇即從眾多的特征中選擇一個特征作為當前節(jié)點分裂的標準,決策樹生成??過程以信息熵為衡量標準構(gòu)建一顆熵值下降最快的樹,根節(jié)點的熵值最大,到葉??子節(jié)點處熵值為0,剪枝是為了縮小樹狀結(jié)構(gòu)的規(guī)模,防止過擬合。??2.4.4集成機器學習??集成機器學習方法是指通過構(gòu)建多個學習器來完成學習任務1?1,通?梢垣@??得比最優(yōu)的單個學習器更好的預測結(jié)果。集成機器學習的訓練流程如圖2-3所示:??學習滟1?字習雅2?字習雅M??I?I?I??橫?sa?m2?描?SDN??圖2-3集成學習訓練流程??15??
山東大學碩士學位論文??恨節(jié)點??1??2?3??葉子節(jié)點??4?5??葉子節(jié)點?_?7'??6?7??葉子節(jié)點葉子節(jié)點??圖2-2決策樹樹狀結(jié)構(gòu)??決策樹利用圖2-2的樹狀結(jié)構(gòu)進行決策分類,每一個葉子節(jié)點是決策的結(jié)果,??每一個非葉子節(jié)點是根據(jù)特征判斷的條件,決策樹的構(gòu)建是一個逐漸分裂的過??程,采用自頂向下的遞歸方式,主要包括特征選擇、決策樹生成、剪枝三個步驟,??特征選擇即從眾多的特征中選擇一個特征作為當前節(jié)點分裂的標準,決策樹生成??過程以信息熵為衡量標準構(gòu)建一顆熵值下降最快的樹,根節(jié)點的熵值最大,到葉??子節(jié)點處熵值為0,剪枝是為了縮小樹狀結(jié)構(gòu)的規(guī)模,防止過擬合。??2.4.4集成機器學習??集成機器學習方法是指通過構(gòu)建多個學習器來完成學習任務1?1,通?梢垣@??得比最優(yōu)的單個學習器更好的預測結(jié)果。集成機器學習的訓練流程如圖2-3所示:??學習滟1?字習雅2?字習雅M??I?I?I??橫?sa?m2?描?SDN??圖2-3集成學習訓練流程??15??
【參考文獻】:
期刊論文
[1]血清外泌體miR-184在非小細胞肺癌中的表達水平及其診斷效能[J]. 王蕾,歐宗興. 蘭州大學學報(醫(yī)學版). 2018(03)
[2]非小細胞肺癌術(shù)后局部復發(fā)患者接受根治性放療的生存及預后因素[J]. LiMa,Bo Qiu,Jun Zhang,Qi-WenLi,BinWang,Xu-HuiZhang,Meng-YunQiang,Zhao-LinChen,Su-PingGuo,Hui Liu. 癌癥. 2018(04)
[3]肺癌診治水平的進展與提高[J]. 李為民,劉丹,盧鈾. 四川大學學報(醫(yī)學版). 2014(02)
[4]機器學習及其相關(guān)算法綜述[J]. 陳凱,朱鈺. 統(tǒng)計與信息論壇. 2007(05)
[5]黏著斑激酶的結(jié)構(gòu)與功能[J]. 袁一旻,姚真真,焦炳華. 生命的化學. 2006(05)
[6]肺癌早期發(fā)現(xiàn)有手段——熒光支氣管鏡技術(shù)[J]. 張蕾,王貴齊. 抗癌之窗. 2006(02)
碩士論文
[1]基于支持向量機的特征選擇算法研究[D]. 嚴康.大連理工大學 2010
本文編號:3427944
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:104 頁
【學位級別】:碩士
【部分圖文】:
圖2-1層次聚類過程??11??
山東大學碩士學位論文??恨節(jié)點??1??2?3??葉子節(jié)點??4?5??葉子節(jié)點?_?7'??6?7??葉子節(jié)點葉子節(jié)點??圖2-2決策樹樹狀結(jié)構(gòu)??決策樹利用圖2-2的樹狀結(jié)構(gòu)進行決策分類,每一個葉子節(jié)點是決策的結(jié)果,??每一個非葉子節(jié)點是根據(jù)特征判斷的條件,決策樹的構(gòu)建是一個逐漸分裂的過??程,采用自頂向下的遞歸方式,主要包括特征選擇、決策樹生成、剪枝三個步驟,??特征選擇即從眾多的特征中選擇一個特征作為當前節(jié)點分裂的標準,決策樹生成??過程以信息熵為衡量標準構(gòu)建一顆熵值下降最快的樹,根節(jié)點的熵值最大,到葉??子節(jié)點處熵值為0,剪枝是為了縮小樹狀結(jié)構(gòu)的規(guī)模,防止過擬合。??2.4.4集成機器學習??集成機器學習方法是指通過構(gòu)建多個學習器來完成學習任務1?1,通?梢垣@??得比最優(yōu)的單個學習器更好的預測結(jié)果。集成機器學習的訓練流程如圖2-3所示:??學習滟1?字習雅2?字習雅M??I?I?I??橫?sa?m2?描?SDN??圖2-3集成學習訓練流程??15??
山東大學碩士學位論文??恨節(jié)點??1??2?3??葉子節(jié)點??4?5??葉子節(jié)點?_?7'??6?7??葉子節(jié)點葉子節(jié)點??圖2-2決策樹樹狀結(jié)構(gòu)??決策樹利用圖2-2的樹狀結(jié)構(gòu)進行決策分類,每一個葉子節(jié)點是決策的結(jié)果,??每一個非葉子節(jié)點是根據(jù)特征判斷的條件,決策樹的構(gòu)建是一個逐漸分裂的過??程,采用自頂向下的遞歸方式,主要包括特征選擇、決策樹生成、剪枝三個步驟,??特征選擇即從眾多的特征中選擇一個特征作為當前節(jié)點分裂的標準,決策樹生成??過程以信息熵為衡量標準構(gòu)建一顆熵值下降最快的樹,根節(jié)點的熵值最大,到葉??子節(jié)點處熵值為0,剪枝是為了縮小樹狀結(jié)構(gòu)的規(guī)模,防止過擬合。??2.4.4集成機器學習??集成機器學習方法是指通過構(gòu)建多個學習器來完成學習任務1?1,通?梢垣@??得比最優(yōu)的單個學習器更好的預測結(jié)果。集成機器學習的訓練流程如圖2-3所示:??學習滟1?字習雅2?字習雅M??I?I?I??橫?sa?m2?描?SDN??圖2-3集成學習訓練流程??15??
【參考文獻】:
期刊論文
[1]血清外泌體miR-184在非小細胞肺癌中的表達水平及其診斷效能[J]. 王蕾,歐宗興. 蘭州大學學報(醫(yī)學版). 2018(03)
[2]非小細胞肺癌術(shù)后局部復發(fā)患者接受根治性放療的生存及預后因素[J]. LiMa,Bo Qiu,Jun Zhang,Qi-WenLi,BinWang,Xu-HuiZhang,Meng-YunQiang,Zhao-LinChen,Su-PingGuo,Hui Liu. 癌癥. 2018(04)
[3]肺癌診治水平的進展與提高[J]. 李為民,劉丹,盧鈾. 四川大學學報(醫(yī)學版). 2014(02)
[4]機器學習及其相關(guān)算法綜述[J]. 陳凱,朱鈺. 統(tǒng)計與信息論壇. 2007(05)
[5]黏著斑激酶的結(jié)構(gòu)與功能[J]. 袁一旻,姚真真,焦炳華. 生命的化學. 2006(05)
[6]肺癌早期發(fā)現(xiàn)有手段——熒光支氣管鏡技術(shù)[J]. 張蕾,王貴齊. 抗癌之窗. 2006(02)
碩士論文
[1]基于支持向量機的特征選擇算法研究[D]. 嚴康.大連理工大學 2010
本文編號:3427944
本文鏈接:http://sikaile.net/yixuelunwen/zlx/3427944.html
最近更新
教材專著