基于網(wǎng)絡(luò)分析和機(jī)器學(xué)習(xí)的肝癌中糖鏈相關(guān)基因篩選

發(fā)布時(shí)間：2021-11-13 10:23

　　中國(guó)癌癥發(fā)病率和死亡率均較高,隨著二代測(cè)序的飛速發(fā)展,運(yùn)用生物統(tǒng)計(jì)學(xué)和計(jì)算機(jī)語(yǔ)言對(duì)生物學(xué)問(wèn)題的挖掘也變得如火如荼。因此,應(yīng)用生物信息學(xué)揭示并解決生物學(xué)問(wèn)題,在科學(xué)研究中扮有越來(lái)越重要的角色。糖鏈相關(guān)基因如糖基轉(zhuǎn)移酶、糖苷水解酶,已被證實(shí)與腫瘤的遷移、復(fù)發(fā)、抗化療藥物等密切相關(guān)。已有眾多針對(duì)癌癥發(fā)生發(fā)展的糖鏈相關(guān)基因及其功能對(duì)癌癥表型的影響與分子機(jī)制的研究。本課題組前期發(fā)現(xiàn)TCGA數(shù)據(jù)庫(kù)的RNA-seq數(shù)據(jù)顯示,在多種癌癥組織中,多種糖鏈相關(guān)基因的表達(dá)量都有顯著改變。基于以上發(fā)現(xiàn),本實(shí)驗(yàn)將聚焦于肝癌中差異表達(dá)的糖鏈相關(guān)基因,運(yùn)用機(jī)器學(xué)習(xí)和加權(quán)基因共表達(dá)網(wǎng)絡(luò)（WGCNA,Weighted Correlation Network Analysis）網(wǎng)絡(luò)進(jìn)行分析,旨在找到在癌癥的發(fā)生和發(fā)展中發(fā)揮著重要作用的糖鏈相關(guān)基因,及與其協(xié)同變化的其它基因,從更大的尺度去整體把握糖鏈相關(guān)基因的變化,進(jìn)一步找到關(guān)鍵基因（hub gene）,并對(duì)其功能進(jìn)行生物信息分析。本課題選取TCGA和GTEx數(shù)據(jù)庫(kù)中糖鏈相關(guān)基因的肝癌表達(dá)譜,比較了三種機(jī)器學(xué)習(xí)模型（隨機(jī)森林,支持向量機(jī),邏輯回歸）預(yù)測(cè)癌癥發(fā)生的能力,發(fā)現(xiàn)...

【文章來(lái)源】：哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁(yè)數(shù)】：64 頁(yè)

【學(xué)位級(jí)別】：碩士

【部分圖文】：

本論文的技術(shù)路線

森林,重要性,指數(shù),模型預(yù)測(cè)

樣本中有 4 個(gè)被誤判成癌癥樣本。這表明隨機(jī)森林模型強(qiáng)。本節(jié)研究表明隨機(jī)森林模型能對(duì)肝癌是否發(fā)生進(jìn)行預(yù)表 3-1 隨機(jī)森林模型預(yù)測(cè)混淆矩陣實(shí)情況模型預(yù)測(cè)結(jié)果Cancer NCancer 92 Normal 4 探究隨機(jī)森林模型預(yù)測(cè)的準(zhǔn)確度和各基因的權(quán)重，本研和節(jié)點(diǎn)純度分析。左側(cè)表示隨機(jī)森林模型篩選基因得到的變量值受到輕微擾動(dòng)后的分類正確率和擾動(dòng)前分類正確率精度下降，平均精度的減少值，數(shù)值越大表明該基因在隨用越大（圖 3-2）。GBA、PYGB、NEU1、PLOD3 和 B4分最高的 5 個(gè)基因。右側(cè)表明 gini 指數(shù)，代表節(jié)點(diǎn)純度越低。其中，PIGM、FUT2、B4GALNT1、GBA、EXTL1 個(gè)基因。

癌癥,森林,模型預(yù)測(cè),情況

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/jiyingongcheng/3492849.html

上一篇：Notch家族基因在日本三角渦蟲(chóng)中的功能研究
下一篇：水稻OsGBP轉(zhuǎn)錄因子家族基因的功能研究及雌雄配子不育基因MFS的定位與功能分析

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于網(wǎng)絡(luò)分析和機(jī)器學(xué)習(xí)的肝癌中糖鏈相關(guān)基因篩選