天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 基因論文 >

基于網(wǎng)絡(luò)分析和機(jī)器學(xué)習(xí)的肝癌中糖鏈相關(guān)基因篩選

發(fā)布時(shí)間:2021-11-13 10:23
  中國(guó)癌癥發(fā)病率和死亡率均較高,隨著二代測(cè)序的飛速發(fā)展,運(yùn)用生物統(tǒng)計(jì)學(xué)和計(jì)算機(jī)語(yǔ)言對(duì)生物學(xué)問(wèn)題的挖掘也變得如火如荼。因此,應(yīng)用生物信息學(xué)揭示并解決生物學(xué)問(wèn)題,在科學(xué)研究中扮有越來(lái)越重要的角色。糖鏈相關(guān)基因如糖基轉(zhuǎn)移酶、糖苷水解酶,已被證實(shí)與腫瘤的遷移、復(fù)發(fā)、抗化療藥物等密切相關(guān)。已有眾多針對(duì)癌癥發(fā)生發(fā)展的糖鏈相關(guān)基因及其功能對(duì)癌癥表型的影響與分子機(jī)制的研究。本課題組前期發(fā)現(xiàn)TCGA數(shù)據(jù)庫(kù)的RNA-seq數(shù)據(jù)顯示,在多種癌癥組織中,多種糖鏈相關(guān)基因的表達(dá)量都有顯著改變。基于以上發(fā)現(xiàn),本實(shí)驗(yàn)將聚焦于肝癌中差異表達(dá)的糖鏈相關(guān)基因,運(yùn)用機(jī)器學(xué)習(xí)和加權(quán)基因共表達(dá)網(wǎng)絡(luò)(WGCNA,Weighted Correlation Network Analysis)網(wǎng)絡(luò)進(jìn)行分析,旨在找到在癌癥的發(fā)生和發(fā)展中發(fā)揮著重要作用的糖鏈相關(guān)基因,及與其協(xié)同變化的其它基因,從更大的尺度去整體把握糖鏈相關(guān)基因的變化,進(jìn)一步找到關(guān)鍵基因(hub gene),并對(duì)其功能進(jìn)行生物信息分析。本課題選取TCGA和GTEx數(shù)據(jù)庫(kù)中糖鏈相關(guān)基因的肝癌表達(dá)譜,比較了三種機(jī)器學(xué)習(xí)模型(隨機(jī)森林,支持向量機(jī),邏輯回歸)預(yù)測(cè)癌癥發(fā)生的能力,發(fā)現(xiàn)... 

【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:64 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于網(wǎng)絡(luò)分析和機(jī)器學(xué)習(xí)的肝癌中糖鏈相關(guān)基因篩選


本論文的技術(shù)路線

森林,重要性,指數(shù),模型預(yù)測(cè)


樣本中有 4 個(gè)被誤判成癌癥樣本。這表明隨機(jī)森林模型強(qiáng)。本節(jié)研究表明隨機(jī)森林模型能對(duì)肝癌是否發(fā)生進(jìn)行預(yù)表 3-1 隨機(jī)森林模型預(yù)測(cè)混淆矩陣實(shí)情況 模型預(yù)測(cè)結(jié)果Cancer NCancer 92 Normal 4 探究隨機(jī)森林模型預(yù)測(cè)的準(zhǔn)確度和各基因的權(quán)重,本研和節(jié)點(diǎn)純度分析。左側(cè)表示隨機(jī)森林模型篩選基因得到的變量值受到輕微擾動(dòng)后的分類正確率和擾動(dòng)前分類正確率精度下降,平均精度的減少值,數(shù)值越大表明該基因在隨用越大(圖 3-2)。GBA、PYGB、NEU1、PLOD3 和 B4分最高的 5 個(gè)基因。右側(cè)表明 gini 指數(shù),代表節(jié)點(diǎn)純度越低。其中,PIGM、FUT2、B4GALNT1、GBA、EXTL1 個(gè)基因。

癌癥,森林,模型預(yù)測(cè),情況


樣本中有 4 個(gè)被誤判成癌癥樣本。這表明隨機(jī)森林模型強(qiáng)。本節(jié)研究表明隨機(jī)森林模型能對(duì)肝癌是否發(fā)生進(jìn)行預(yù)表 3-1 隨機(jī)森林模型預(yù)測(cè)混淆矩陣實(shí)情況 模型預(yù)測(cè)結(jié)果Cancer NCancer 92 Normal 4 探究隨機(jī)森林模型預(yù)測(cè)的準(zhǔn)確度和各基因的權(quán)重,本研和節(jié)點(diǎn)純度分析。左側(cè)表示隨機(jī)森林模型篩選基因得到的變量值受到輕微擾動(dòng)后的分類正確率和擾動(dòng)前分類正確率精度下降,平均精度的減少值,數(shù)值越大表明該基因在隨用越大(圖 3-2)。GBA、PYGB、NEU1、PLOD3 和 B4分最高的 5 個(gè)基因。右側(cè)表明 gini 指數(shù),代表節(jié)點(diǎn)純度越低。其中,PIGM、FUT2、B4GALNT1、GBA、EXTL1 個(gè)基因。

【參考文獻(xiàn)】:
期刊論文
[1]碳水化合物活性酶數(shù)據(jù)庫(kù)(CAZy)及其研究趨勢(shì)[J]. 王帥,陳冠軍,張懷強(qiáng),王祿山.  生物加工過(guò)程. 2014(01)
[2]原發(fā)性肝癌的診斷及治療進(jìn)展[J]. 吳孟超.  中國(guó)醫(yī)學(xué)科學(xué)院學(xué)報(bào). 2008(04)



本文編號(hào):3492849

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3492849.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶90bef***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com