天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 基因論文 >

基于基因表達(dá)譜和DNA甲基化的癌癥分類預(yù)測(cè)

發(fā)布時(shí)間:2020-06-13 09:27
【摘要】:癌癥的分類預(yù)測(cè)是醫(yī)學(xué)的一個(gè)主要研究課題。越早發(fā)現(xiàn)癌癥,治愈的機(jī)率就越大,越晚發(fā)現(xiàn)癌癥,治愈的機(jī)率就越低。及早發(fā)現(xiàn)癌癥至關(guān)重要;谛畔W(xué)的癌癥分類預(yù)測(cè)在克服癌癥診斷形態(tài)學(xué)、影像學(xué)方法存在的諸多缺陷、對(duì)癌癥患者實(shí)現(xiàn)早期準(zhǔn)確診斷方面具有重大研究意義和實(shí)用價(jià)值。在基于信息學(xué)的癌癥分類預(yù)測(cè)中,目前研究癌癥分類預(yù)測(cè)主要是基于基因表達(dá)譜數(shù)據(jù)。由于TCGA數(shù)據(jù)庫(kù)癌癥種類豐富,樣本量大,不僅提供了容易和不受訪問限制的基因表達(dá)譜數(shù)據(jù),還提供了很多其他OMICS技術(shù)的數(shù)據(jù),因此本文提出基于基因表達(dá)譜和DNA甲基化的癌癥分類預(yù)測(cè)模型。我們推測(cè)甲基化和基因表達(dá)數(shù)據(jù)的結(jié)合可能會(huì)改變分類結(jié)果,得到重要的特征。因?yàn)樗媚P筒粌H會(huì)反映轉(zhuǎn)錄組的差異,還會(huì)反映表觀遺傳水平的差異。由于TCGA數(shù)據(jù)庫(kù)提供的基因表達(dá)譜和DNA甲基化數(shù)據(jù)具有高維度,小樣本,高噪音,正常樣本少等特點(diǎn),本文首先使用SMOTE方法使正常樣本數(shù)和癌癥樣本數(shù)達(dá)到平衡,然后采用十折交叉驗(yàn)證,每次對(duì)訓(xùn)練集使用最小冗余最大相關(guān)性(MRMR)方法做特征選擇,利用SVM訓(xùn)練得到分類模型,最后預(yù)測(cè)得到分類結(jié)果。本文基于基因表達(dá)譜和DNA甲基化,通過實(shí)驗(yàn)和對(duì)比研究探索數(shù)據(jù)集的融合、不平衡問題的處理、分類模型構(gòu)建。對(duì)TCGA乳腺癌的基因表達(dá)譜和DNA甲基化數(shù)據(jù)進(jìn)行分類預(yù)測(cè)研究,實(shí)驗(yàn)一結(jié)果驗(yàn)證了對(duì)極不平衡的數(shù)據(jù)集直接構(gòu)建分類器,會(huì)導(dǎo)致分類預(yù)測(cè)結(jié)果為100%的過擬合或0%的欠擬合。實(shí)驗(yàn)三為本文所提方法,結(jié)果顯示了使用10個(gè)特征就可以使各項(xiàng)評(píng)估指標(biāo)達(dá)到98%以上的分類預(yù)測(cè)結(jié)果。
【圖文】:

基因表達(dá)譜,分類過程,癌癥


逡逑通過上述對(duì)基因表達(dá)譜數(shù)據(jù)的介紹,一般基于基因表達(dá)譜的癌癥分類過程如逡逑下圖2.2所示:逡逑邐邐數(shù)據(jù)預(yù)處理逡逑特征基因選擇逡逑E邐邐逡逑m逡逑分類器設(shè)計(jì)逡逑分類性能評(píng)價(jià)逡逑樣本逡逑圖2.邋2基于基因表達(dá)譜的癌癥分類過程逡逑】0逡逑

特征選擇,基本過程,子集,停止準(zhǔn)則


逑價(jià)過程。要想選擇出最優(yōu)的特征子集,就需確定出來(lái)搜索的策略與評(píng)價(jià)的準(zhǔn)則。逡逑如下圖2.3的內(nèi)容是Dash等人[36]提出的特征選擇算法的基本過程:逡逑....-至埯數(shù)tj一-|子集生成卜邐-....{子集評(píng)價(jià)逡逑'邋2邋'逡逑;邐§邐 結(jié)果-驗(yàn)證逡逑、.?Z逡逑圖2.邋3特征選擇算法的基本過程逡逑特征選擇算法有四個(gè)主要步驟:1.產(chǎn)生特征子集,2.特征評(píng)價(jià)函數(shù),3.算法逡逑停止準(zhǔn)則,4.結(jié)果驗(yàn)證過程。算法的大體思路是,首先對(duì)原是數(shù)據(jù)特征集合根據(jù)逡逑搜索方法得到一個(gè)特征集合,,再使用停止準(zhǔn)則判斷子集是否優(yōu)秀。符合停止準(zhǔn)則逡逑便停止,如果不符合停止準(zhǔn)則,則重復(fù)前面兩個(gè)步驟繼續(xù)尋找滿足準(zhǔn)則的特征子逡逑集。逡逑對(duì)于特征子集的搜索就是產(chǎn)生特征子集的過程,那么搜索方案就是這一步驟逡逑的關(guān)鍵所在。搜索特征子集的過程有很多種,目前流行的搜索算法主要有三大逡逑類:完全式搜索策略、啟發(fā)式搜索策略、隨機(jī)式搜索策略[37]。逡逑特征評(píng)價(jià)函數(shù)的主要作用對(duì)產(chǎn)生的特征子集進(jìn)行評(píng)價(jià),判斷好壞。常見的評(píng)逡逑價(jià)函數(shù)有:相關(guān)性、距離、一致性、信息度量等[38]。相關(guān)性是指使用統(tǒng)計(jì)相關(guān)系逡逑數(shù)來(lái)衡量特征與類別之間的可分離性
【學(xué)位授予單位】:湖南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:R73;TP181

【參考文獻(xiàn)】

相關(guān)期刊論文 前4條

1 韓競(jìng)男;魯昊騁;梁靜;;DNA甲基化與癌癥[J];中國(guó)生物化學(xué)與分子生物學(xué)報(bào);2012年02期

2 聶偉霞;劉鵬程;鄒立秋;;惡性腫瘤的影像學(xué)研究進(jìn)展[J];中外醫(yī)療;2011年26期

3 于化龍;顧國(guó)昌;趙靖;劉海波;沈晶;;基于DNA微陣列數(shù)據(jù)的癌癥分類問題研究進(jìn)展[J];計(jì)算機(jī)科學(xué);2010年10期

4 何志巍,姚開泰;DNA微陣列(或芯片)技術(shù)原理及應(yīng)用[J];生物化學(xué)與生物物理進(jìn)展;1999年05期

相關(guān)博士學(xué)位論文 前2條

1 殷愛軍;DNA甲基化檢測(cè)在宮頸癌篩查中的應(yīng)用[D];山東大學(xué);2016年

2 張麗娟;微陣列基因表達(dá)數(shù)據(jù)分類問題中的屬性選擇技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年

相關(guān)碩士學(xué)位論文 前3條

1 李雨萍;改進(jìn)的特征選擇算法及其在miRNA與靶基因網(wǎng)絡(luò)分析上的應(yīng)用[D];吉林大學(xué);2017年

2 劉金勇;基因表達(dá)譜數(shù)據(jù)特征選擇與提取方法研究[D];中國(guó)計(jì)量學(xué)院;2014年

3 寧永鵬;高維小樣本數(shù)據(jù)的特征選擇研究及其穩(wěn)定性分析[D];廈門大學(xué);2014年



本文編號(hào):2710971

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2710971.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶71359***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
久久碰国产一区二区三区| 午夜国产成人福利视频| 日韩精品一区二区三区av在线| 欧洲一级片一区二区三区| 国产三级黄片在线免费看| 丁香七月啪啪激情综合| 中国美女草逼一级黄片视频| 亚洲熟女少妇精品一区二区三区| 国产免费一区二区不卡| 婷婷激情五月天丁香社区| 国产国产精品精品在线| 国产香蕉国产精品偷在线观看| 久久精品国产99精品亚洲| 国产精品免费精品一区二区| 久久精品免费视看国产成人| 欧美野外在线刺激在线观看| 偷自拍亚洲欧美一区二页| 色综合久久超碰色婷婷| 亚洲国产成人精品一区刚刚| 欧美日韩少妇精品专区性色| 在线观看免费视频你懂的 | 男人和女人黄 色大片| 国产成人午夜av一区二区| 国产精品欧美激情在线观看| 亚洲中文字幕在线综合视频| 人妻巨大乳一二三区麻豆| 欧美激情一区二区亚洲专区| 欧洲一级片一区二区三区| 国产精品香蕉一级免费| 国产一区一一一区麻豆| 国产免费操美女逼视频| 国产精品一区二区有码| 亚洲第一区欧美日韩在线| 免费观看潮喷到高潮大叫| 青青草草免费在线视频| 欧美精品日韩精品一区| 欧美丰满人妻少妇精品| 一区二区三区四区亚洲另类| 午夜精品麻豆视频91| 免费在线播放不卡视频| a久久天堂国产毛片精品|