天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于多特征融合的高維膜蛋白數(shù)據(jù)分類預(yù)測(cè)研究

發(fā)布時(shí)間:2022-07-14 12:09
  膜蛋白作為蛋白質(zhì)功能的體現(xiàn)者和承擔(dān)者,在蛋白質(zhì)組學(xué)研究中占有重要地位。研究表明,某些疾病的產(chǎn)生與膜蛋白功能及結(jié)構(gòu)的改變有很大關(guān)系,因此,針對(duì)膜蛋白類型進(jìn)行精確的分類預(yù)測(cè)成為一項(xiàng)重要的研究課題。面對(duì)海量膜蛋白序列數(shù)據(jù),采用機(jī)器學(xué)習(xí)分類的方法,不僅節(jié)約時(shí)間、精力,而且能夠提高序列數(shù)據(jù)的利用率。在復(fù)雜的蛋白質(zhì)序列信息中,使用膜蛋白的物理化學(xué)性質(zhì),序列相關(guān)性以及序列進(jìn)化信息,提取有效的特征,是本文處理序列特征的主要方法。本文提出了一種膜蛋白序列特征融合的表達(dá)方法并針對(duì)高維特征進(jìn)行維度約減處理,最后使用多種分類器,引入集成分類思想開展實(shí)驗(yàn)對(duì)比,我們?nèi)〉昧饲把氐某晒?實(shí)驗(yàn)結(jié)果也充分表明融合表達(dá)方法的有效性。本文工作具體如下:(1)通過對(duì)膜蛋白的序列信息的分析,提出了融合四種特征抽取方法:偽氨基酸組成(40維)、二肽組成(400維)、氨基酸的屬性組(13維)和位置特異性分?jǐn)?shù)矩陣(400維)的方法,將原始的膜蛋白序列轉(zhuǎn)化為一個(gè)853維度的特征向量。該特征中包含了豐富的序列特征信息,為后續(xù)建立可靠的預(yù)測(cè)模型奠定了良好的基礎(chǔ)。(2)膜蛋白特征融合方法也同時(shí)帶來了信息冗余和維度災(zāi)難的問題。因此,本文使用兩種... 

【文章頁(yè)數(shù)】:50 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 研究背景及意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
    1.3 論文的主要工作及創(chuàng)新
    1.4 論文結(jié)構(gòu)
    1.5 本章小結(jié)
第二章 膜蛋白序列的特征提取和分類算法
    2.1 膜蛋白序列數(shù)據(jù)集
        2.1.1 數(shù)據(jù)集來源簡(jiǎn)介
        2.1.2 膜蛋白數(shù)據(jù)集的建立
    2.2 膜蛋白序列的特征提取算法
    2.3 膜蛋白分類算法
        2.3.1 基于統(tǒng)計(jì)的分類算法
        2.3.2 基于機(jī)器學(xué)習(xí)的算法
        2.3.3 分類模型的檢驗(yàn)
    2.4 本章小結(jié)
第三章 基于特征融合與降維的膜蛋白分類預(yù)測(cè)
    3.1 基于四種基本表達(dá)的特征融合
        3.1.1 偽氨基酸組成
        3.1.2 二肽組成
        3.1.3 特異性分?jǐn)?shù)矩陣
        3.1.4 氨基酸屬性組
    3.2 降維算法
        3.2.1 主成分分析
        3.2.2 線性判別分析
    3.3 基于特征融合與降維的膜蛋白分類預(yù)測(cè)實(shí)驗(yàn)
    3.4 本章小結(jié)
第四章 基于Stacking集成學(xué)習(xí)的膜蛋白預(yù)測(cè)
    4.1 Stacking集成學(xué)習(xí)的算法思想
    4.2 Stacking框架下的基分類器
        4.2.1 基分類器1—K近鄰算法
        4.2.2 基分類器2—支持向量機(jī)
        4.2.3 基分類器3—隨機(jī)森林
        4.2.4 基分類器4—神經(jīng)網(wǎng)絡(luò)
    4.3 Stacking框架下的元分類器
    4.4 基分類器與組合分類器實(shí)驗(yàn)結(jié)果
        4.4.1 組合策略中基分類器參數(shù)尋優(yōu)
        4.4.2 基分類器的實(shí)驗(yàn)結(jié)果
        4.4.3 Stacking集成分類器的實(shí)驗(yàn)結(jié)果
    4.5 本章小結(jié)
第五章 總結(jié)與展望
    5.1 本文工作總結(jié)
    5.2 下一步工作展望
參考文獻(xiàn)
致謝


【參考文獻(xiàn)】:
期刊論文
[1]SMR蛋白:一種跨膜蛋白演化研究的模式蛋白[J]. 趙永祥,程儒進(jìn),楊俊,謝浩.  生命科學(xué). 2017(02)
[2]囊泡相關(guān)膜蛋白8基因多態(tài)性與動(dòng)脈粥樣硬化性腦梗死相關(guān)性研究[J]. 宋冰鑫,夏健.  國(guó)際神經(jīng)病學(xué)神經(jīng)外科學(xué)雜志. 2017(01)
[3]基于神經(jīng)網(wǎng)絡(luò)集成方法預(yù)測(cè)膜蛋白類型[J]. 方海洋,趙靜,汪益川,宗福興.  后勤工程學(xué)院學(xué)報(bào). 2013(05)
[4]Bagging組合的不平衡數(shù)據(jù)分類方法[J]. 秦姣龍,王蔚.  計(jì)算機(jī)工程. 2011(14)
[5]HPLC和MALDI-TOF質(zhì)譜技術(shù)研究海兔口腔神經(jīng)節(jié)多肽組分與分布[J]. 吳韓志,陳東仕,馮麗劍,顏利,黃慧英,黃河清.  廈門大學(xué)學(xué)報(bào)(自然科學(xué)版). 2006(S1)
[6]基于加權(quán)支持向量機(jī)的膜蛋白類型預(yù)測(cè)中不平衡問題處理[J]. 劉國(guó)平,姚莉秀,楊杰,王猛.  上海交通大學(xué)學(xué)報(bào). 2005(10)

博士論文
[1]快速多極邊界元與有限元耦合分析結(jié)構(gòu)聲學(xué)敏感度的算法研究[D]. 陳磊磊.中國(guó)科學(xué)技術(shù)大學(xué) 2014
[2]高維生物數(shù)據(jù)的分類與預(yù)測(cè)研究[D]. 王彤.上海交通大學(xué) 2009

碩士論文
[1]基于多信息融合的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)方法研究[D]. 徐慧敏.浙江理工大學(xué) 2016
[2]水溶液中蛋白質(zhì)二級(jí)結(jié)構(gòu)紅外分析方法的建立及cAMP受體蛋白構(gòu)象研究[D]. 高錚亞.復(fù)旦大學(xué) 2012



本文編號(hào):3661100

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3661100.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8969f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com