DNA序列分析和抗癌藥物敏感性預(yù)測的計算模型
發(fā)布時間:2023-04-19 00:35
高通量測序技術(shù)產(chǎn)生了海量的基因組學(xué)數(shù)據(jù)和抗癌藥物組學(xué)數(shù)據(jù)。建立有效的計算模型是快速挖掘這些大數(shù)據(jù)蘊含的信息的重要手段。本文首先基于DNA序列的堿基轉(zhuǎn)移概率、堿基含量和堿基位置比三類特征構(gòu)造了 24維特征向量,成功應(yīng)用于11物種β-珠蛋白基因完整編碼序列和18物種哺乳動物線粒體基因組序列的相似性比較,構(gòu)建的系統(tǒng)發(fā)生樹與進化事實相符。然后基于該特征向量,結(jié)合支持向量機分類識別了 28株細(xì)菌中的必需基因,平均AUC值高達0.808,高于部分識別方法。最后的實驗結(jié)果表明:生物序列基本構(gòu)成元素的轉(zhuǎn)移概率、含量和位置比可作為研究生物信息學(xué)中相關(guān)分類問題的選擇性工具。準(zhǔn)確預(yù)測細(xì)胞內(nèi)抗癌藥物的反應(yīng),有助于實現(xiàn)腫瘤的精確醫(yī)療。目前流行的計算模型無法解決新(未經(jīng)檢驗的)藥物與新(未經(jīng)檢驗的)細(xì)胞系間的敏感性預(yù)測問題;诎┘(xì)胞系百科全書(CCLE)和癌癥藥物敏感性基因組學(xué)數(shù)據(jù)庫(GDSC)兩個基準(zhǔn)數(shù)據(jù)集,論文首先利用分類方法驗證了一個一般性假設(shè),即“基因相似的細(xì)胞系與結(jié)構(gòu)相似的藥物之間其反應(yīng)也相似”。接下來借助細(xì)胞系基因表達譜的相似性和藥物化學(xué)結(jié)構(gòu)的相似性構(gòu)建了“細(xì)胞系-藥物復(fù)雜網(wǎng)絡(luò)”。這兩項工作告訴我們...
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 生物序列分析計算模型
1.2.2 抗癌藥物敏感性預(yù)測計算模型
1.3 論文的主要工作
1.4 論文結(jié)構(gòu)
第2章 基于堿基組成和分布的DNA序列分析計算模型
2.1 構(gòu)造24維DNA序列特征向量
2.2 基于24維特征向量的序列分析與比較
2.2.1 實驗數(shù)據(jù)集
2.2.2 序列分析與比較結(jié)果
2.3 基于24維特征向量的必需基因識別
2.3.1 實驗數(shù)據(jù)集
2.3.2 必需基因識別算法與結(jié)果
2.3.3 必需基因識別算法分析
2.4 本章小結(jié)
第3章 抗癌藥物敏感性預(yù)測的復(fù)雜網(wǎng)絡(luò)計算模型
3.1 實驗數(shù)據(jù)集與數(shù)據(jù)預(yù)處理
3.2 細(xì)胞系相似性和藥物相似性度量方法
3.3 細(xì)胞系-藥物復(fù)雜網(wǎng)絡(luò)計算模型框架
3.3.1 計算模型假設(shè)
3.3.2 細(xì)胞系-藥物復(fù)雜網(wǎng)絡(luò)計算模型
3.4 抗癌藥物敏感性預(yù)測結(jié)果
3.4.1 無類型限制的“細(xì)胞系-藥物”敏感性預(yù)測
3.4.2 “新細(xì)胞系-新藥物”的敏感性預(yù)測
3.4.3 GDSC數(shù)據(jù)集中缺失值的預(yù)測
3.5 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學(xué)位期間承擔(dān)的科研任務(wù)與主要成果
致謝
本文編號:3793356
【文章頁數(shù)】:57 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究目的和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 生物序列分析計算模型
1.2.2 抗癌藥物敏感性預(yù)測計算模型
1.3 論文的主要工作
1.4 論文結(jié)構(gòu)
第2章 基于堿基組成和分布的DNA序列分析計算模型
2.1 構(gòu)造24維DNA序列特征向量
2.2 基于24維特征向量的序列分析與比較
2.2.1 實驗數(shù)據(jù)集
2.2.2 序列分析與比較結(jié)果
2.3 基于24維特征向量的必需基因識別
2.3.1 實驗數(shù)據(jù)集
2.3.2 必需基因識別算法與結(jié)果
2.3.3 必需基因識別算法分析
2.4 本章小結(jié)
第3章 抗癌藥物敏感性預(yù)測的復(fù)雜網(wǎng)絡(luò)計算模型
3.1 實驗數(shù)據(jù)集與數(shù)據(jù)預(yù)處理
3.2 細(xì)胞系相似性和藥物相似性度量方法
3.3 細(xì)胞系-藥物復(fù)雜網(wǎng)絡(luò)計算模型框架
3.3.1 計算模型假設(shè)
3.3.2 細(xì)胞系-藥物復(fù)雜網(wǎng)絡(luò)計算模型
3.4 抗癌藥物敏感性預(yù)測結(jié)果
3.4.1 無類型限制的“細(xì)胞系-藥物”敏感性預(yù)測
3.4.2 “新細(xì)胞系-新藥物”的敏感性預(yù)測
3.4.3 GDSC數(shù)據(jù)集中缺失值的預(yù)測
3.5 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學(xué)位期間承擔(dān)的科研任務(wù)與主要成果
致謝
本文編號:3793356
本文鏈接:http://sikaile.net/yixuelunwen/yiyaoxuelunwen/3793356.html
最近更新
教材專著