基于隨機(jī)森林算法的關(guān)鍵蛋白識(shí)別方法研究

發(fā)布時(shí)間：2021-06-05 04:39

　　識(shí)別出生物體內(nèi)有用的蛋白質(zhì)對(duì)生物體進(jìn)化以及醫(yī)學(xué)領(lǐng)域都要極其重要的作用。當(dāng)前辨別蛋白質(zhì)重要性的方式有兩種。一是基于生物化學(xué)方法,但利用生物實(shí)驗(yàn)的方法來識(shí)別具有一定的缺陷,具體表現(xiàn)為:時(shí)間較長、費(fèi)用較高、以及不能處理數(shù)據(jù)量較大的問題等等。二是利用計(jì)算機(jī)為工具對(duì)生物進(jìn)行分析并以生物學(xué)的相關(guān)知識(shí)進(jìn)行解釋的一種方式。利用計(jì)算機(jī)識(shí)別蛋白重要性的方法大多是利用蛋白質(zhì)交互網(wǎng)絡(luò)（Protein Interaction Network）提取拓?fù)渲行男远攘刻卣鱽碜R(shí)別�？墒怯捎谝恍┫嚓P(guān)生物實(shí)驗(yàn)數(shù)據(jù)的殘缺和蛋白質(zhì)網(wǎng)絡(luò)自身的復(fù)雜性,一直沒有發(fā)現(xiàn)可以準(zhǔn)確區(qū)別關(guān)鍵蛋白質(zhì)和非關(guān)鍵蛋白質(zhì)的單一中心性度量特征,并且從目前的相關(guān)研究來看,關(guān)鍵蛋白質(zhì)和非關(guān)鍵蛋白質(zhì)間的區(qū)別不能由單一特征決定,應(yīng)該是由多種因素共同決定的。單一中心性度量往往不能有效識(shí)別關(guān)鍵蛋白質(zhì),需要融合多個(gè)拓?fù)渲行男远攘糠椒?突破傳統(tǒng)的利用排序進(jìn)行精細(xì)選擇的方式,建立機(jī)器學(xué)習(xí)模型進(jìn)行蛋白的分類和識(shí)別。隨機(jī)森林算法屬于集成類型的算法,可以集成多個(gè)單分類器即集成多棵決策樹的分類效果從而組成一個(gè)整體意義上的分類器。鑒于之前研究均是利用單一特征進(jìn)行分類識(shí)別,且由于隨機(jī)森...

【文章來源】：吉林農(nóng)業(yè)大學(xué)吉林省

【文章頁數(shù)】：36 頁

【學(xué)位級(jí)別】：碩士

【部分圖文】：

隨機(jī)森林原理圖

示意圖,不相連,中央位置,節(jié)點(diǎn)

度中心性示意圖

示意圖,示意圖,路徑,計(jì)算節(jié)點(diǎn)

：( )= ∑ ∑( , , )( . ), ≠ ≠ 點(diǎn) k 與 j 之間的最短路徑條數(shù)， ( 路徑條數(shù)。在計(jì)算節(jié)點(diǎn)之間的路徑點(diǎn)，介數(shù)中心性就是反應(yīng)某一節(jié)點(diǎn)的相關(guān)示例。節(jié)點(diǎn) 1 的 BC 值，+(2,1,4)(2,4)+(2,1,5)(2,5)+(3,1,2)(3,2)+(3,1,4(3,4(4,1,3)(4,3)+(4,1,5)(4,5)+(5,1,2)(5,2)+(5,1,3)(5,3) + + + + + + + + = 8 = 0， = 6， =0。比較結(jié)果1 在該網(wǎng)絡(luò)中最重要，如果去點(diǎn)節(jié)點(diǎn)

本文編號(hào)：3211454

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3211454.html

上一篇：基于機(jī)器視覺的工業(yè)機(jī)器人加工系統(tǒng)的實(shí)驗(yàn)研究
下一篇：基于深度學(xué)習(xí)的蛋白質(zhì)功能預(yù)測(cè)研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于隨機(jī)森林算法的關(guān)鍵蛋白識(shí)別方法研究