基于信息熵與深度森林的蛋白質(zhì)亞細(xì)胞位置預(yù)測(cè)
發(fā)布時(shí)間:2021-02-04 15:40
蛋白質(zhì)的亞細(xì)胞位置信息能夠?yàn)槔斫馄渖飳W(xué)功能提供有力線索,在藥物設(shè)計(jì)、病理分析等領(lǐng)域的研究中有著重要作用。在后基因組時(shí)代的當(dāng)下,蛋白質(zhì)測(cè)序技術(shù)取得了長(zhǎng)足的發(fā)展。新發(fā)現(xiàn)蛋白質(zhì)的數(shù)量正以驚人的速度飛速增長(zhǎng)。如何快速準(zhǔn)確的獲取蛋白質(zhì)的亞細(xì)胞位置信息已經(jīng)成為了蛋白質(zhì)組學(xué)中的一項(xiàng)關(guān)鍵任務(wù),F(xiàn)有的蛋白質(zhì)亞細(xì)胞位置識(shí)別方法主要分為基于生物化學(xué)實(shí)驗(yàn)的方法和基于計(jì)算的方法。其中,基于生物化學(xué)實(shí)驗(yàn)的方法是目前獲取蛋白質(zhì)亞細(xì)胞位置信息的主要手段。但是由于時(shí)間成本巨大,此類方法已經(jīng)難以滿足人們?cè)谧R(shí)別效率方面的需求。與之相對(duì),基于計(jì)算方法的出現(xiàn)為高效解決海量蛋白質(zhì)序列的亞細(xì)胞位置識(shí)別問(wèn)題提供了可行方案。近年來(lái),人們對(duì)基于計(jì)算的蛋白質(zhì)亞細(xì)胞位置預(yù)測(cè)方法做出了大量的研究。然而,受制于特征提取技術(shù)以及分類算法的性能,相關(guān)方法的預(yù)測(cè)準(zhǔn)確率仍待提高。針對(duì)這一現(xiàn)狀,本文在信息熵與深度森林的基礎(chǔ)上對(duì)現(xiàn)有蛋白質(zhì)亞細(xì)胞位置預(yù)測(cè)技術(shù)進(jìn)行改進(jìn)。在蛋白質(zhì)特征提取方面,本文在分析了現(xiàn)有蛋白質(zhì)特征提取技術(shù)缺陷的基礎(chǔ)上,探究了基于信息熵的改進(jìn)方案的有效性。在分類算法的構(gòu)建方面,本文首先討論了深度森林對(duì)蛋白質(zhì)亞細(xì)胞位置預(yù)測(cè)問(wèn)題的適用性,隨后針...
【文章來(lái)源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)研究方法
2.1 蛋白質(zhì)亞細(xì)胞位置預(yù)測(cè)方法框架
2.2 蛋白質(zhì)序列信息特征表示方法
2.2.1 基于氨基酸組成信息的特征表示方法
2.2.2 基于氨基酸理化性質(zhì)的特征表示方法
2.3 蛋白質(zhì)進(jìn)化信息特征表示方法
2.3.1 位置特異性矩陣
2.3.2 基于PSSM的進(jìn)化信息特征表示方法
2.4 分類算法
2.4.1 SVM算法
2.4.2 隨機(jī)森林算法
2.4.3 集成算法
2.5 本章小結(jié)
第3章 基于信息熵與自協(xié)方差的蛋白質(zhì)特征表示
3.1 IE-MoACC-PFR方法
3.1.1 蛋白質(zhì)序列信息特征提取
3.1.2 蛋白質(zhì)進(jìn)化信息特征提取
3.2 數(shù)值實(shí)驗(yàn)及性能分析
3.2.1 數(shù)據(jù)集介紹
3.2.2 評(píng)價(jià)指標(biāo)
3.2.3 參數(shù)敏感性分析
3.2.4 對(duì)比方法介紹
3.2.5 實(shí)驗(yàn)結(jié)果分析
3.3 本章小結(jié)
第4章 基于特征選擇的深度森林改進(jìn)模型
4.1 深度森林
4.2 基于特征選擇的深度森林改進(jìn)模型
4.3 數(shù)值實(shí)驗(yàn)及性能分析
4.3.1 實(shí)驗(yàn)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果分析
4.4 本章小結(jié)
第5章 基于禁忌搜索的深度森林改進(jìn)模型
5.1 禁忌搜索
5.2 基于禁忌搜索的深度森林改進(jìn)模型
5.3 數(shù)值實(shí)驗(yàn)及性能分析
5.3.1 實(shí)驗(yàn)設(shè)置
5.3.2 實(shí)驗(yàn)結(jié)果分析
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 本文工作總結(jié)
6.2 未來(lái)工作展望
參考文獻(xiàn)
致謝
攻讀碩士期間發(fā)表的論文
【參考文獻(xiàn)】:
期刊論文
[1]基于n-gram頻率的語(yǔ)種識(shí)別改進(jìn)方法[J]. 郝洺,徐博,殷緒成,王方圓. 自動(dòng)化學(xué)報(bào). 2018(03)
[2]集成改進(jìn)KNN算法預(yù)測(cè)蛋白質(zhì)亞細(xì)胞定位[J]. 薛衛(wèi),王雄飛,趙南,楊榮麗,洪曉宇. 生物工程學(xué)報(bào). 2017(04)
[3]基于SVM-RFE算法的凋亡蛋白亞細(xì)胞定位預(yù)測(cè)[J]. 劉太崗,王春華. 計(jì)算機(jī)工程與應(yīng)用. 2017(10)
[4]基于氨基酸約化和統(tǒng)計(jì)特征的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)[J]. 楊紅,徐慧敏,嚴(yán)壽江,陳靜,耿麗麗,姚玉華. 生物信息學(xué). 2015(02)
[5]蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)研究綜述[J]. 喬善平,閆寶強(qiáng). 計(jì)算機(jī)應(yīng)用研究. 2014(02)
碩士論文
[1]蛋白質(zhì)亞細(xì)胞定位的序列編碼及預(yù)測(cè)方法研究[D]. 張麗.湖南大學(xué) 2010
本文編號(hào):3018548
【文章來(lái)源】:西南大學(xué)重慶市 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:67 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)研究方法
2.1 蛋白質(zhì)亞細(xì)胞位置預(yù)測(cè)方法框架
2.2 蛋白質(zhì)序列信息特征表示方法
2.2.1 基于氨基酸組成信息的特征表示方法
2.2.2 基于氨基酸理化性質(zhì)的特征表示方法
2.3 蛋白質(zhì)進(jìn)化信息特征表示方法
2.3.1 位置特異性矩陣
2.3.2 基于PSSM的進(jìn)化信息特征表示方法
2.4 分類算法
2.4.1 SVM算法
2.4.2 隨機(jī)森林算法
2.4.3 集成算法
2.5 本章小結(jié)
第3章 基于信息熵與自協(xié)方差的蛋白質(zhì)特征表示
3.1 IE-MoACC-PFR方法
3.1.1 蛋白質(zhì)序列信息特征提取
3.1.2 蛋白質(zhì)進(jìn)化信息特征提取
3.2 數(shù)值實(shí)驗(yàn)及性能分析
3.2.1 數(shù)據(jù)集介紹
3.2.2 評(píng)價(jià)指標(biāo)
3.2.3 參數(shù)敏感性分析
3.2.4 對(duì)比方法介紹
3.2.5 實(shí)驗(yàn)結(jié)果分析
3.3 本章小結(jié)
第4章 基于特征選擇的深度森林改進(jìn)模型
4.1 深度森林
4.2 基于特征選擇的深度森林改進(jìn)模型
4.3 數(shù)值實(shí)驗(yàn)及性能分析
4.3.1 實(shí)驗(yàn)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果分析
4.4 本章小結(jié)
第5章 基于禁忌搜索的深度森林改進(jìn)模型
5.1 禁忌搜索
5.2 基于禁忌搜索的深度森林改進(jìn)模型
5.3 數(shù)值實(shí)驗(yàn)及性能分析
5.3.1 實(shí)驗(yàn)設(shè)置
5.3.2 實(shí)驗(yàn)結(jié)果分析
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 本文工作總結(jié)
6.2 未來(lái)工作展望
參考文獻(xiàn)
致謝
攻讀碩士期間發(fā)表的論文
【參考文獻(xiàn)】:
期刊論文
[1]基于n-gram頻率的語(yǔ)種識(shí)別改進(jìn)方法[J]. 郝洺,徐博,殷緒成,王方圓. 自動(dòng)化學(xué)報(bào). 2018(03)
[2]集成改進(jìn)KNN算法預(yù)測(cè)蛋白質(zhì)亞細(xì)胞定位[J]. 薛衛(wèi),王雄飛,趙南,楊榮麗,洪曉宇. 生物工程學(xué)報(bào). 2017(04)
[3]基于SVM-RFE算法的凋亡蛋白亞細(xì)胞定位預(yù)測(cè)[J]. 劉太崗,王春華. 計(jì)算機(jī)工程與應(yīng)用. 2017(10)
[4]基于氨基酸約化和統(tǒng)計(jì)特征的蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)[J]. 楊紅,徐慧敏,嚴(yán)壽江,陳靜,耿麗麗,姚玉華. 生物信息學(xué). 2015(02)
[5]蛋白質(zhì)亞細(xì)胞定位預(yù)測(cè)研究綜述[J]. 喬善平,閆寶強(qiáng). 計(jì)算機(jī)應(yīng)用研究. 2014(02)
碩士論文
[1]蛋白質(zhì)亞細(xì)胞定位的序列編碼及預(yù)測(cè)方法研究[D]. 張麗.湖南大學(xué) 2010
本文編號(hào):3018548
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3018548.html
最近更新
教材專著