天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

對異質(zhì)性腫瘤樣本的基因表達(dá)數(shù)據(jù)反卷積計算方法的綜合評價

發(fā)布時間:2021-12-02 11:34
  根據(jù)世界衛(wèi)生組織(WHO)2018年的報告,癌癥是全球第二大死亡原因,在世界范圍內(nèi)至少導(dǎo)致960萬人的死亡。近年來,癌癥的發(fā)病率和死亡人數(shù)都在不斷增加。與此同時,在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域,隨著深度學(xué)習(xí)等新技術(shù)的不斷發(fā)展,人工智能算法已逐漸在生物信息學(xué)領(lǐng)域嶄露頭角。人們已經(jīng)迫不及待利用計算機(jī)技術(shù)來研究生命的現(xiàn)象和規(guī)律。癌癥是由一系列復(fù)雜的基因突變所引發(fā)的疾病,因而在基因?qū)用嫜芯堪┌Y對我們了解腫瘤的發(fā)生和發(fā)展機(jī)制,以及對癌癥進(jìn)行早期篩查、診斷和治療都具有重大的意義。本課題利用三種反卷積計算方法:NNLS、CIBERSORT和XGBoost,對Dream Challenges社區(qū)放出的最新RNA-seq人類基因表達(dá)數(shù)據(jù)集DS389、DS488進(jìn)行反卷積計算,得到不同細(xì)胞類型的構(gòu)成比例。通過對比計算結(jié)果和真實(shí)數(shù)據(jù)的相關(guān)性發(fā)現(xiàn),CIBERSORT方法的計算結(jié)果準(zhǔn)確度最高、XGBoost方法次之、NNLS方法最低。值得一提的是,這是XGBoost方法第一次用于基因表達(dá)數(shù)據(jù)的反卷積計算;谏疃葘W(xué)習(xí)技術(shù),我們開發(fā)了一款神經(jīng)網(wǎng)絡(luò)評價模型,可以為數(shù)據(jù)推薦反卷積計算方法。實(shí)驗(yàn)結(jié)果表明,這款基于深度學(xué)習(xí)的評... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:61 頁

【學(xué)位級別】:碩士

【部分圖文】:

對異質(zhì)性腫瘤樣本的基因表達(dá)數(shù)據(jù)反卷積計算方法的綜合評價


腫瘤反卷積方法論文的增長進(jìn)行反卷積的R包

交叉驗(yàn)證,訓(xùn)練集


數(shù)。測試集只用來評價模型,不用于學(xué)習(xí)模型參數(shù)和選擇參數(shù),整個過程只使用一次。但是如果數(shù)據(jù)量太小的話,那么分出的訓(xùn)練集太小,導(dǎo)致模型對數(shù)據(jù)集的學(xué)習(xí)不夠,出現(xiàn)欠擬合(Underfitting)問題。為了解決數(shù)據(jù)量太小的問題,就出現(xiàn)了交叉驗(yàn)證技術(shù)。交叉驗(yàn)證只將數(shù)據(jù)集分為訓(xùn)練集和測試集。然后再將訓(xùn)練集分為K份子集,每次將1份作為驗(yàn)證集,剩下的K-1份作為訓(xùn)練集,這樣循環(huán)K次,保證每一份都做過訓(xùn)練集,最后將平均每次的誤差和作為最后的誤差。這就是我們常用的K折交叉驗(yàn)證(K-foldCross-validation),如圖2-1所示。圖2-1K折交叉驗(yàn)證

過程圖,反卷積,過程


哈爾濱工業(yè)大學(xué)工程碩士學(xué)位論文-16-第3章反卷積計算方法3.1反卷積計算過程反卷積計算過程是卷積的逆問題。反卷積則是廣泛用于信號和圖像處理的卷積的逆過程。如今,在這機(jī)器學(xué)習(xí)和深度學(xué)習(xí)蓬勃發(fā)展的時代,卷積和反卷積也在其中扮演著重要角色。比如,卷積(Convolution)操作是深度學(xué)習(xí)最核心的技術(shù),起到一個提取特征的作用。在生物學(xué)中,反卷積計算方法也應(yīng)用在基因表達(dá)數(shù)據(jù)上。組織中的基因表達(dá)譜是細(xì)胞類型特異性基因表達(dá)特征與不同細(xì)胞類型的比例卷積的結(jié)果。反卷積計算方法則是通過利用基因表達(dá)特征矩陣來計算組織中未知的細(xì)胞比例。具體而言,反卷積方法將分離的細(xì)胞類型的表達(dá)譜和復(fù)雜組織的表達(dá)譜作為輸入,組織中每個基因的表達(dá)被建模為其在每種細(xì)胞類型中表達(dá)的線性組合,其中權(quán)重代表每種細(xì)胞類型的未知含量。在數(shù)學(xué)上,對基因數(shù)據(jù)反卷積表達(dá)計算是一個超定方程組(Over-determinedSystem)問題,其表達(dá)形式如公式(3-1)所示:=×(3-1)式中:m——組織中的基因表達(dá)數(shù)據(jù);S——基因表達(dá)特征矩陣;f——不同細(xì)胞類型比例。因?yàn)榉匠虜?shù)(基因的數(shù)量)遠(yuǎn)遠(yuǎn)超過未知數(shù)個數(shù)(組織中的細(xì)胞類型總數(shù)),并且矩陣S是列滿秩的,這個方程組并沒有精確解,我們只能通過一些優(yōu)化算法來求出它的近似解。反卷積計算過程如圖3-1所示。圖3-1反卷積計算過程[8]

【參考文獻(xiàn)】:
期刊論文
[1]基于基因表達(dá)譜預(yù)測腫瘤浸潤免疫細(xì)胞類型及比例的解卷積算法[J]. 裴晶晶,余彩裙,佘玉梅.  云南民族大學(xué)學(xué)報(自然科學(xué)版). 2019(04)
[2]2015年中國惡性腫瘤流行情況分析[J]. 鄭榮壽,孫可欣,張思維,曾紅梅,鄒小農(nóng),陳茹,顧秀瑛,魏文強(qiáng),赫捷.  中華腫瘤雜志. 2019 (01)
[3]肝癌小鼠脾臟免疫細(xì)胞的變化及其意義[J]. 李寶華,黃娜,陳海燕,張澍,王佩俊,楊軍,李宗芳.  現(xiàn)代腫瘤醫(yī)學(xué). 2018(13)
[4]基于深度學(xué)習(xí)的八類蛋白質(zhì)二級結(jié)構(gòu)預(yù)測算法[J]. 張蕾,李征,鄭逢斌,楊偉.  計算機(jī)應(yīng)用. 2017(05)
[5]基于深度學(xué)習(xí)和醫(yī)學(xué)圖像的癌癥計算機(jī)輔助診斷研究進(jìn)展[J]. 陳詩慧,劉維湘,秦璟,陳亮亮,賓果,周煜翔,汪天富,黃炳升.  生物醫(yī)學(xué)工程學(xué)雜志. 2017(02)



本文編號:3528351

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3528351.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6a276***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com