天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

基于基因本體降維的蛋白質(zhì)功能預(yù)測(cè)研究

發(fā)布時(shí)間:2024-05-06 20:33
  蛋白質(zhì)是活細(xì)胞生命活動(dòng)中最主要的載體,執(zhí)行著生物體內(nèi)各種重要功能。對(duì)蛋白質(zhì)功能進(jìn)行自動(dòng)標(biāo)注是生物信息學(xué)領(lǐng)域的關(guān)鍵問題,也是后基因組時(shí)代的核心問題之一。準(zhǔn)確全面地對(duì)蛋白質(zhì)進(jìn)行功能標(biāo)注,不僅能幫助人們正確理解生命機(jī)理,而且對(duì)疾病分析、藥物研發(fā)、農(nóng)作物促產(chǎn)等研究領(lǐng)域都有著極大的促進(jìn)作用;虮倔w(Gene Ontology,GO)是一種在蛋白質(zhì)功能預(yù)測(cè)中被廣泛使用的功能標(biāo)注數(shù)據(jù)庫。本體中包含多于45000個(gè)功能標(biāo)簽術(shù)語,但是一個(gè)蛋白質(zhì)僅被其中的幾個(gè)或者幾十個(gè)功能標(biāo)簽標(biāo)注,且這些標(biāo)簽間存在復(fù)雜的結(jié)構(gòu)關(guān)系,給蛋白質(zhì)功能預(yù)測(cè)工作帶來了巨大挑戰(zhàn)。本文結(jié)合基因本體建模及其降維學(xué)習(xí),進(jìn)行蛋白質(zhì)功能預(yù)測(cè)研究,主要工作如下:(1)提出一種基于基因本體圖哈希的蛋白質(zhì)功能預(yù)測(cè)方法(HashGO)。該方法首先利用基因本體圖結(jié)構(gòu)定義功能標(biāo)簽間的分類相似度,然后將該相似度結(jié)合到圖哈希技術(shù)中并優(yōu)化一系列哈希函數(shù),再以二進(jìn)制的形式編碼大規(guī)模的功能標(biāo)簽術(shù)語。其次,利用這些哈希函數(shù)將蛋白質(zhì)-功能標(biāo)簽關(guān)聯(lián)矩陣映射到低維哈?臻g,基于海明距離計(jì)算蛋白質(zhì)之間的語義相似度。最后,HashGO基于語義近鄰蛋白質(zhì)的功能預(yù)測(cè)蛋白質(zhì)功能。在...

【文章頁數(shù)】:73 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于基因本體降維的蛋白質(zhì)功能預(yù)測(cè)研究



圖1-1本文中蛋白質(zhì)功能預(yù)測(cè)動(dòng)機(jī)圖但是在巨大的功能標(biāo)簽空間中,一個(gè)蛋白質(zhì)僅被當(dāng)中的幾個(gè)或者幾十個(gè)標(biāo)注,大量的功能標(biāo)注信息是缺失的,這一現(xiàn)象給蛋白質(zhì)預(yù)測(cè)工作帶來一定的挑戰(zhàn)。而蛋白質(zhì)功能標(biāo)注信息對(duì)蛋白質(zhì)機(jī)理的解析,疾病機(jī)理分析與調(diào)控,相關(guān)藥物的研發(fā),生物能源開發(fā)等具有極大的指導(dǎo)作....


基于基因本體降維的蛋白質(zhì)功能預(yù)測(cè)研究



基因本體的層次結(jié)構(gòu)可以被用來顯著地提高蛋白質(zhì)功能預(yù)測(cè)的精度,F(xiàn)有的功能標(biāo)簽壓縮方法要不在壓縮前隱式地或部分地利用功能標(biāo)簽間的關(guān)聯(lián)關(guān)系,要不就是便于后期處理將基因本體的有向無環(huán)圖結(jié)構(gòu)變成無向結(jié)構(gòu)。鑒于此,這些方法不能很好地服從GO層次結(jié)構(gòu),導(dǎo)致預(yù)測(cè)性能受損。為了解決這些基于本體....


基于基因本體降維的蛋白質(zhì)功能預(yù)測(cè)研究



在統(tǒng)計(jì)差異性檢驗(yàn)中,涉及的p值是某方法相較于其他方法間的差異性概率值,如果p值小于0.05,我們就說該方法具有顯著性差異性。本文,我們?cè)谒形锓N和所用度量上使用符號(hào)秩檢驗(yàn)去統(tǒng)計(jì)HPHash和其他方法中的預(yù)測(cè)差異性,p值比10-9還要小。此外,我們也統(tǒng)計(jì)Hash....


基于基因本體降維的蛋白質(zhì)功能預(yù)測(cè)研究



西南大學(xué)碩士學(xué)位論文支上分別涉及的功能標(biāo)簽數(shù)為13150、3618和1668,當(dāng)d被設(shè)置為5或者10時(shí),哈希編碼的長(zhǎng)度210log1668是不滿足所有功能標(biāo)簽的編碼位數(shù)。碰撞可能會(huì)導(dǎo)致哈希沖突,從而會(huì)影響蛋白質(zhì)功能預(yù)測(cè)的結(jié)果。圖4-1記錄了在人類數(shù)據(jù)....



本文編號(hào):3966309

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/3966309.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c8339***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com