必需基因理論預(yù)測的多種算法研究
發(fā)布時間:2025-02-07 19:36
研究必需基因?qū)τ跇?gòu)建最小基因集、發(fā)現(xiàn)潛在的藥物靶標(biāo)和廣譜抗菌藥物的研發(fā)有著非常重要的作用。由于這些基因?qū)τ跈C(jī)體生存、繁殖和發(fā)育有著不可替代的作用,許多科研工作者不遺余力去探尋必需基因識別的方法。從傳統(tǒng)的實(shí)驗(yàn)技術(shù)到結(jié)合計算基因組學(xué)的理論識別方法,必需基因的識別逐漸成為基因組學(xué)研究領(lǐng)域的一個熱點(diǎn)。我們課題組曾經(jīng)提出過3款用于必需基因預(yù)測的在線服務(wù)工具,比如基于同源必需基因和物種進(jìn)化距離的Geptop,根據(jù)基因名稱比較進(jìn)行識別的CEG-Match,從DNA序列中提取序列組成特征去構(gòu)建人類必需基因預(yù)測模型的pheg。在本課題必需基因理論識別研究中,首先從Geptop算法得到啟發(fā),將同源必需性的特征與支持向量機(jī)(SVM)算法結(jié)合起來,以機(jī)器學(xué)習(xí)打分的機(jī)制去代替物種進(jìn)化距離給出的特征權(quán)重,自動地去學(xué)習(xí)每個特征對區(qū)分必需基因和非必需基因的重要性度量。對于物種內(nèi)的必需基因預(yù)測,在選擇的25個細(xì)菌中,通過此方法得到的10-折交叉驗(yàn)證的AUC值(受試者工作特征曲線下面積)最高達(dá)到0.9716。對于跨物種必需基因預(yù)測,我們則選擇在10-折交叉驗(yàn)證中AUC值超過0.90且親緣關(guān)系距離待測物種最近的那個物種為模型...
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 必需基因簡介
1.2 必需基因研究背景和現(xiàn)狀
1.3 論文內(nèi)容提要
第二章 病原菌必需基因識別
2.1 引言
2.2 必需基因數(shù)據(jù)集構(gòu)建
2.3 特征提取
2.3.1 同源必需性比對
2.3.2 構(gòu)建特征矩陣
2.3.3 進(jìn)化距離的計算
2.4 分類算法的選擇和使用
2.5 分類器設(shè)計和性能評估
2.5.1 N-折交叉驗(yàn)證
2.5.2 跨物種必需基因預(yù)測
2.5.3 分類器性能評估
2.6 預(yù)測結(jié)果與分析
2.6.1 基因同源數(shù)目與物種間進(jìn)化距離的分析
2.6.2 交叉驗(yàn)證預(yù)測結(jié)果
2.6.3 跨物種預(yù)測結(jié)果
第三章 人類必需基因識別
3.1 引言
3.2 必需基因數(shù)據(jù)集構(gòu)建
3.3 標(biāo)準(zhǔn)基因名確定
3.4 特征提取和特征評價
3.4.1 蛋白質(zhì)-蛋白質(zhì)互作網(wǎng)絡(luò)的拓?fù)鋵傩?br> 3.4.2 基因表達(dá)水平
3.4.3 GO功能注釋信息
3.4.4 特征評價
3.5 分類算法和性能評估
3.6 預(yù)測結(jié)果與分析
3.6.1 蛋白質(zhì)互作網(wǎng)絡(luò)拓?fù)鋵傩灶A(yù)測結(jié)果
3.6.2 基因表達(dá)水平預(yù)測結(jié)果
3.6.3 GO功能注釋預(yù)測結(jié)果
3.6.4 特征集合預(yù)測結(jié)果
3.6.5 特征評估和分析
第四章 總結(jié)和展望
4.1 全文總結(jié)
4.2 工作展望
致謝
參考文獻(xiàn)
附錄
攻讀碩士學(xué)位期間取得的成果
本文編號:4031195
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 必需基因簡介
1.2 必需基因研究背景和現(xiàn)狀
1.3 論文內(nèi)容提要
第二章 病原菌必需基因識別
2.1 引言
2.2 必需基因數(shù)據(jù)集構(gòu)建
2.3 特征提取
2.3.1 同源必需性比對
2.3.2 構(gòu)建特征矩陣
2.3.3 進(jìn)化距離的計算
2.4 分類算法的選擇和使用
2.5 分類器設(shè)計和性能評估
2.5.1 N-折交叉驗(yàn)證
2.5.2 跨物種必需基因預(yù)測
2.5.3 分類器性能評估
2.6 預(yù)測結(jié)果與分析
2.6.1 基因同源數(shù)目與物種間進(jìn)化距離的分析
2.6.2 交叉驗(yàn)證預(yù)測結(jié)果
2.6.3 跨物種預(yù)測結(jié)果
第三章 人類必需基因識別
3.1 引言
3.2 必需基因數(shù)據(jù)集構(gòu)建
3.3 標(biāo)準(zhǔn)基因名確定
3.4 特征提取和特征評價
3.4.1 蛋白質(zhì)-蛋白質(zhì)互作網(wǎng)絡(luò)的拓?fù)鋵傩?br> 3.4.2 基因表達(dá)水平
3.4.3 GO功能注釋信息
3.4.4 特征評價
3.5 分類算法和性能評估
3.6 預(yù)測結(jié)果與分析
3.6.1 蛋白質(zhì)互作網(wǎng)絡(luò)拓?fù)鋵傩灶A(yù)測結(jié)果
3.6.2 基因表達(dá)水平預(yù)測結(jié)果
3.6.3 GO功能注釋預(yù)測結(jié)果
3.6.4 特征集合預(yù)測結(jié)果
3.6.5 特征評估和分析
第四章 總結(jié)和展望
4.1 全文總結(jié)
4.2 工作展望
致謝
參考文獻(xiàn)
附錄
攻讀碩士學(xué)位期間取得的成果
本文編號:4031195
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/4031195.html
最近更新
教材專著