天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 基因論文 >

基于基因表達(dá)數(shù)據(jù)的癌癥亞型分類研究

發(fā)布時(shí)間:2022-05-08 12:02
  隨著機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,生物信息學(xué)研究的不斷深入,利用基因表達(dá)序列中的數(shù)據(jù)對(duì)癌癥進(jìn)行亞型分類研究,已成為當(dāng)前的研究熱點(diǎn)之一。在分子生物學(xué)水平上,利用基因表達(dá)數(shù)據(jù)的分析從而對(duì)癌癥早期診斷提供輔導(dǎo)決策,這對(duì)于癌癥的正確、及時(shí)診斷,有著積極深遠(yuǎn)的意義。然而,基因表達(dá)數(shù)據(jù)有著其數(shù)據(jù)特點(diǎn),即:高維度、小樣本、分布不平衡等,這也對(duì)癌癥亞型的分類提出了挑戰(zhàn)。由于在基因表達(dá)數(shù)據(jù)中,存在著大量的冗余基因和噪聲數(shù)據(jù)。因此,面對(duì)著海量的基因表達(dá)數(shù)據(jù),如何對(duì)其進(jìn)行特征選擇,選出最具代表性的特征基因子集,是研究學(xué)者們的研究重點(diǎn)之一。此外,學(xué)者們還致力于尋找有效的分類方法。這兩方面的研究,目的都在于提高癌癥亞型的分類精度,為大數(shù)據(jù)醫(yī)療提供更精確的決策支持。本文主要基于樣本數(shù)據(jù)的特點(diǎn),通過(guò)學(xué)習(xí)和研究,設(shè)計(jì)快速、有效的特征選擇方法。通過(guò)特征選擇后的樣本數(shù)據(jù),進(jìn)行樣本分類預(yù)測(cè)研究。在分類階段,研究極限學(xué)習(xí)機(jī)算法的使用和擴(kuò)展,目的在于提高分類器的性能效果。本文主要完成了以下的工作:(1)由于基因的維數(shù)過(guò)高,本文提出了多維互信息(MMI)特征選擇方法。多維互信息特征選擇方法的算法原理在于篩選出最能表達(dá)癌癥分類的基因子集... 

【文章頁(yè)數(shù)】:75 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
學(xué)位論文數(shù)據(jù)集
摘要
ABSTRACT
第一章 緒論
    1.1 課題研究背景及意義
    1.2 基因表達(dá)數(shù)據(jù)
        1.2.1 基因表達(dá)數(shù)據(jù)的定義和獲取
        1.2.2 基因表達(dá)數(shù)據(jù)特性
    1.3 國(guó)內(nèi)外研究現(xiàn)狀
    1.4 論文的主要研究?jī)?nèi)容、創(chuàng)新點(diǎn)
    1.5 章節(jié)安排
第二章 理論基礎(chǔ)
    2.1 極限學(xué)習(xí)機(jī)
        2.1.1 人工神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
        2.1.2 極限學(xué)習(xí)機(jī)簡(jiǎn)介
        2.1.3 極限學(xué)習(xí)機(jī)的算法原理
        2.1.4 極限學(xué)習(xí)機(jī)的部分特性
    2.2 信息論知識(shí)基礎(chǔ)
        2.2.1 信息熵知識(shí)基礎(chǔ)
        2.2.2 聯(lián)合熵
        2.2.3 條件熵
        2.2.4 互信息
        2.2.5 各種熵之間的關(guān)系
        2.2.6 條件互信息
        2.2.7 聯(lián)合互信息
    2.3 特征選擇
        2.3.1 特征選擇的定義
        2.3.2 特征選擇過(guò)程
        2.3.3 特征選擇方法
        2.3.4 基于評(píng)價(jià)函數(shù)劃分的特征選擇方法
            2.3.4.1 Filter方法
            2.3.4.2 Wrapper方法
            2.3.4.3 Embedded方法
            2.3.4.4 混合方法
    2.4 集成學(xué)習(xí)
        2.4.1 集成學(xué)習(xí)概念
        2.4.2 AdaBoost算法
    2.5 本章小結(jié)
第三章 基于多維互信息的特征選擇方法
    3.1 引言
    3.2 基于基因表達(dá)數(shù)據(jù)的多維互信息(MMI)特征選擇方法
        3.2.1 基于互信息的基因表達(dá)數(shù)據(jù)特征選擇方法
        3.2.2 基于基因表達(dá)數(shù)據(jù)的多維互信息(MMI)特征選擇方法
    3.3 基于MMI-ELM的癌癥亞型分類算法
        3.3.1 算法分析
        3.3.2 多維互信息特征選擇算法描述
    3.4 實(shí)驗(yàn)和結(jié)果分析
        3.4.1 實(shí)驗(yàn)數(shù)據(jù)集
        3.4.2 數(shù)據(jù)預(yù)處理
        3.4.3 實(shí)驗(yàn)結(jié)果分析
    3.5 本章小結(jié)
第四章 基于AdaBoost-ELM的不平衡數(shù)據(jù)集分類方法
    4.1 引言
    4.2 基于AdaBoost-ELM的癌癥亞型分類算法
        4.2.1 算法設(shè)計(jì)分析
        4.2.2 AdaBoost-ELM分類算法描述
    4.3 實(shí)驗(yàn)數(shù)據(jù)集
    4.4 實(shí)驗(yàn)和結(jié)果分析
    4.5 本章小結(jié)
第五章 總結(jié)與展望
    5.1 論文內(nèi)容總結(jié)
    5.2 工作展望
參考文獻(xiàn)
致謝
研究成果及發(fā)表的學(xué)術(shù)論文
作者和導(dǎo)師簡(jiǎn)介
附錄


【參考文獻(xiàn)】:
期刊論文
[1]基于輸出不一致測(cè)度的極限學(xué)習(xí)機(jī)集成的基因表達(dá)數(shù)據(jù)分類[J]. 陸慧娟,安春霖,馬小平,鄭恩輝,楊小兵.  計(jì)算機(jī)學(xué)報(bào). 2013(02)
[2]特征選擇方法綜述[J]. 姚旭,王曉丹,張玉璽,權(quán)文.  控制與決策. 2012(02)
[3]基于最小聯(lián)合互信息虧損的最優(yōu)特征選擇算法[J]. 張逸石,陳傳波.  計(jì)算機(jī)科學(xué). 2011(12)
[4]特征選擇算法綜述[J]. 計(jì)智偉,胡珉,尹建新.  電子設(shè)計(jì)工程. 2011(09)
[5]一種快速的Wrapper式特征子集選擇新方法[J]. 葉吉祥,龔希齡.  長(zhǎng)沙理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2010(04)
[6]一種基于信息增益及遺傳算法的特征選擇算法[J]. 任江濤,孫婧昊,黃煥宇,印鑒.  計(jì)算機(jī)科學(xué). 2006(10)

博士論文
[1]基于智能優(yōu)化算法的腫瘤微陣列基因表達(dá)數(shù)據(jù)分類研究[D]. 劉亞杰.云南大學(xué) 2014



本文編號(hào):3651628

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3651628.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b97f4***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com