關(guān)鍵蛋白質(zhì)預(yù)測(cè)及蛋白質(zhì)變體表征算法研究

發(fā)布時(shí)間：2021-03-28 21:27

　　蛋白質(zhì)是生命過(guò)程的主要執(zhí)行者。關(guān)鍵蛋白質(zhì)作為維持細(xì)胞生命的重要組成部分,在生物學(xué)和藥物設(shè)計(jì)研究中發(fā)揮著重要作用。與基因變異相比,蛋白質(zhì)的分子結(jié)構(gòu)及狀態(tài)變化（即蛋白質(zhì)變體）與疾病的病理變化更相關(guān)。表征蛋白質(zhì)變體包括鑒定和定位蛋白質(zhì)中的主要結(jié)構(gòu)性變異（PSA）,對(duì)推進(jìn)醫(yī)學(xué)事業(yè)發(fā)展具有現(xiàn)實(shí)意義。本文著力于從蛋白質(zhì)組學(xué)領(lǐng)域中兩個(gè)重要研究方向進(jìn)行研究,主要?jiǎng)?chuàng)新點(diǎn)如下:隨著關(guān)鍵蛋白質(zhì)相關(guān)的大量生物學(xué)數(shù)據(jù)的產(chǎn)生,已經(jīng)提出越來(lái)越多的計(jì)算方法用于預(yù)測(cè)關(guān)鍵蛋白質(zhì)。與采用單種機(jī)器學(xué)習(xí)方法或集成多種機(jī)器學(xué)習(xí)方法的預(yù)測(cè)方法不同,本文設(shè)計(jì)出XGBFEMF預(yù)測(cè)框架用于預(yù)測(cè)關(guān)鍵蛋白質(zhì)。該框架包括SUB-EXPAND-SHRINK方法,該方法利用初始特征構(gòu)建復(fù)合特征并獲得用于關(guān)鍵蛋白質(zhì)預(yù)測(cè)更好的特征子集;還包括用于獲得更有效的預(yù)測(cè)模型的模型融合方法。本文使用酵母數(shù)據(jù)進(jìn)行實(shí)驗(yàn),通過(guò)接受者操作特性曲線（ROC）分析、準(zhǔn)確度分析和top分析來(lái)評(píng)估XGBFEMF框架的性能。同時(shí),本文還使用大腸桿菌數(shù)據(jù)進(jìn)行實(shí)驗(yàn),以驗(yàn)證該框架的通用性。實(shí)驗(yàn)結(jié)果表明,XGBFEMF框架可以有效地改進(jìn)多項(xiàng)關(guān)鍵性指標(biāo)。隨著質(zhì)譜技術(shù)的發(fā)展,使得基于自頂向...

【文章來(lái)源】：湖南師范大學(xué)湖南省 211工程院校

【文章頁(yè)數(shù)】：55 頁(yè)

【學(xué)位級(jí)別】：碩士

【部分圖文】：

圖２－１基于自頂向下質(zhì)譜技術(shù)表征蛋白質(zhì)變體的框架圖??

變體,蛋白質(zhì),自頂向下,質(zhì)譜

?關(guān)鍵蛋白質(zhì)預(yù)測(cè)及蛋白質(zhì)變體表征研究???２．２．１蛋白質(zhì)變體鑒定算法??當(dāng)前基于自頂向下質(zhì)譜技術(shù)的蛋白質(zhì)變體鑒定方法可分為兩大類：（１）擴(kuò)展蛋白質(zhì)變??體數(shù)據(jù)庫(kù)方法；（２）曹ＰＳＡ搜索方法，該方法可進(jìn)一步分為三大卷蛋白質(zhì)變體鑒定算??法的分類如圖２－２所示。??［?Ｐｒｏｔｅｏｆｏｒｍ?＾??ｉｄｅｎｔｉｆｉｃａｔｉｏｎ?ｍｅｔｈｏｄｓ??■?Ｉ?？??１?＇?，■丨?．??廣?Ｔｈｅ?ｅｘｐａｎｄｅｄ?｜?Ｔｈｅ?ｂｌｉｎｄ?ＰＳＡｓ??ｐｒｏｔｅｏｆｏｒｍ?ｄａｔａｂａｓｅ?Ｉ?ｓｅａｒｃｈ?ｍｅｔｈｏｄｓ??Ｌ?ｍｅｔｈｏｄｓ?）?ｒ?、?ｉ?，，?、??’?Ｓｐｅｃｔｒａｌ?＾?ｆ?Ｇｒａｐｈ?＾?Ｐｒｅｃｕｒｓｏｒ?ｉｏｎ＾??ａｌｉｇｎｍｅｎｔ－ｂａｓｅｄ?ｍｏｄｅｌ－ｂａｓｅｄ?ｉｎｄｅｐｅｎｄｅｎｃｅ??、ａｌｇｏｒｉｔｈｍｓ?Ｊ?ｖ?ａｌｇｏｒｉｔｈｍｓ?ｙ?ｖ?ａｌｇｏｒｉｔｈｍ?ｙ???１?Ｉ?＂￣￣１??ＰｒｏＳｉｇｈｔ，?ＭａｓｃｏｔＴＤ，｜｜?ＭＳ－ＴｏｐＤｏｗｎ＾］?（?｜??ＢＵＰＩＤ－ｔｏｐ－ｄｏｗｎ，?Ｍ＾ＡＩｉｇｎ＋，?ｐＴｏｐ，Ｔｃ）ｐＭＧ，??？ｇｌｅ，?ＭＳ－Ａ＇ｉｇｎ－Ｅ?ＭＳＰａｔｈＦｉｎｄｅｒ?Ｐ，ＩＴＡ??Ｍｅｔａ?Ｍｏｒｐｈｅｕｓ，?ＭＡＳＨ?Ｓｕｉｔｅ?Ｐｒｏ，??＾?ＴＤＰｏｒｔａｌ?ＪｌｊｏｐＰＩＱＳＰＥＣＴＲＵＭＪ?［?Ｊ?［?ｙ??圖２－２基于自頂向下質(zhì)譜技術(shù)的蛋白質(zhì)變體鑒定算法的分類??２．２．１．１擴(kuò)展蛋白質(zhì)變體數(shù)據(jù)庫(kù)方法??擴(kuò)展蛋白質(zhì)變體數(shù)據(jù)庫(kù)方法實(shí)質(zhì)上是根據(jù)數(shù)據(jù)庠中的注釋信息自動(dòng)枚舉所有可能的??蛋＿質(zhì)變

曲線,數(shù)據(jù)集,酵母,方法

１７）??在公式（３－１０）至公式（３－１７）中，ＩＦ表示真陽(yáng)性蛋白質(zhì)的數(shù)量；沖表示假陽(yáng)性蛋??白質(zhì)的數(shù)量Ｗ転真陰性蛋白質(zhì)的數(shù)量；所■叚陰性蛋麵勺數(shù)量。??３．４．２與現(xiàn)有方法比較??酵母數(shù)據(jù)集和大腸桿菌數(shù)據(jù)集均屬于不平衡數(shù)據(jù)集，本文按照數(shù)據(jù)集中關(guān)鍵蛋白質(zhì)與??非關(guān)鍵蛋白質(zhì)的原始比例將其分為１０份。選擇其中１份作為測(cè)試集，剩佘９份作為訓(xùn)練??集。謝ｉ程重復(fù)１０次，直到１０份中的任意１份都作為一次測(cè)試集，然后通過(guò)ＲＯＣ曲線??下面積（ＡｒｅａＵｎｄｅｒＣｕｒｖｅ，ＡＵＣ）顯不其性能。圖３－２和圖３－３分別顯不了基于酉孝母數(shù)據(jù)??集和大腸桿菌數(shù)據(jù)集ＸＧＢＦＥＭＦ和其他初始特征方法的ＲＯＣ曲線。??！?＝１１??。－?＝距＝??（［／／／???ＰｅＣ：〇〇７｜３３１??＼?ｆｉＶ?／?／???Ｐ＆Ｅ：?０．６８８４??／／／／?／，???ＸＧＢＦＥＭＦ：?０．７８２９??：ｖ??ｏ??Ｉ?Ｉ?Ｉ?Ｉ?Ｉ?Ｉ??０．０?０．２?０．４?０．６?０．８?１．０??Ｆａｌｓｅ?ｐｏｓｉｔｉｖｅ?ｒａｔｅ??圖３－２基于酵母數(shù)據(jù)集ＸＧＢＦＥＭＦ和其他初始特征方法的ＲＯＣ曲線??１６??

【參考文獻(xiàn)】：
期刊論文
[1]A Feature Selection Method for Prediction Essential Protein[J]. Jiancheng Zhong,Jianxin Wang,Wei Peng,Zhen Zhang,Min Li. Tsinghua Science and Technology. 2015(05)

本文編號(hào)：3106270

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3106270.html

上一篇：基于三維點(diǎn)云骨架提取的單木L系統(tǒng)規(guī)則構(gòu)造方法研究
下一篇：大數(shù)據(jù)背景下的關(guān)聯(lián)規(guī)則挖掘算法研究

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

關(guān)鍵蛋白質(zhì)預(yù)測(cè)及蛋白質(zhì)變體表征算法研究