基于智能計算的增強(qiáng)子分類預(yù)測研究
發(fā)布時間:2022-11-06 18:28
隨著分子生物學(xué)與統(tǒng)計學(xué)的發(fā)展,越來越多的新技術(shù)被用于基因組序列信息的研究中,其中針對增強(qiáng)子的識別研究技術(shù)也有了很大的改進(jìn)。但是大多數(shù)的增強(qiáng)子研究還是通過實驗、基因測序方法實現(xiàn),存在很大的局限性。目前為止,大部分的研究都集中于從其他的調(diào)控元件中預(yù)測增強(qiáng)子,只有少部分的研究著重于增強(qiáng)子及其強(qiáng)弱類型的預(yù)測研究。為促進(jìn)增強(qiáng)子研究工作并提高研究效率,本文主要基于智能計算,采用多種特征提取方法研究探討增強(qiáng)子及其強(qiáng)弱類型的預(yù)測問題,具體的工作包括以下幾個方面:1)概述了生物學(xué)中增強(qiáng)子的相關(guān)概念,包括強(qiáng)增強(qiáng)子和弱增強(qiáng)子的概念,以及增強(qiáng)子分類預(yù)測的研究背景及研究意義,簡述了增強(qiáng)子的相關(guān)研究方法,并對本文的研究工作做了整體安排。2)概述了幾種常用的序列特征提取方法,分析了相關(guān)的機(jī)器學(xué)習(xí)算法原理,以及這些算法在DNA序列等研究中的使用情況,學(xué)習(xí)算法包括支持向量機(jī)(SVM)、隨機(jī)森林(RF)等,此外還介紹了一些分類器的性能評價指標(biāo)。3)實現(xiàn)了增強(qiáng)子及其強(qiáng)弱類型的分類預(yù)測研究。根據(jù)轉(zhuǎn)錄激活能力和表達(dá)能力,將增強(qiáng)子主要分成了兩類:強(qiáng)增強(qiáng)子和弱增強(qiáng)子。通常情況下強(qiáng)增強(qiáng)子控制轉(zhuǎn)錄或蛋白代謝的相關(guān)功能,進(jìn)而促進(jìn)轉(zhuǎn)錄和增...
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 增強(qiáng)子及其強(qiáng)弱類型
1.1.1 增強(qiáng)子
1.1.2 強(qiáng)增強(qiáng)子和弱增強(qiáng)子
1.2 增強(qiáng)子預(yù)測分類研究背景及研究意義
1.2.1 增強(qiáng)子預(yù)測分類研究背景
1.2.2 增強(qiáng)子預(yù)測分類研究意義
1.3 論文的研究內(nèi)容及結(jié)構(gòu)劃分
2 常用的基因組序列特征提取方法
2.1 核苷酸成分法
2.1.1 單核苷酸組成成份法
2.1.2 二聯(lián)核苷酸組成成份法
2.1.3 三聯(lián)核苷酸組成成份法
2.2 偽K聯(lián)核苷酸成分法
2.2.1 基于核苷酸結(jié)構(gòu)屬性的偽K聯(lián)核苷酸成分法
2.2.2 基于核酸蛋白質(zhì)理化屬性的偽K聯(lián)核苷酸成分法
2.2.3 基于多窗口的偽K聯(lián)偽核苷酸成分法
2.3 基于核苷酸理化性質(zhì)及密度分布的融合特征法
2.3.1 核苷酸的物理化學(xué)屬性
2.3.2 核苷酸的密度分布
2.4 基于三聯(lián)核苷酸理化屬性的移動平均法
2.5 本章小結(jié)
3 常用的機(jī)器學(xué)習(xí)分類算法及評價
3.1 常用的機(jī)器學(xué)習(xí)分類算法
3.1.1 支持向量機(jī)
3.1.2 隨機(jī)森林
3.1.3 K-近鄰
3.1.4 人工神經(jīng)網(wǎng)絡(luò)
3.2 常用的檢驗方法與評價指標(biāo)
3.2.1 分類算法的檢驗方法
3.2.2 分類算法的評價指標(biāo)
3.3 本章小結(jié)
4 增強(qiáng)子及其強(qiáng)弱類別的預(yù)測研究
4.1 基準(zhǔn)數(shù)據(jù)集
4.1.1 單核苷酸頻率統(tǒng)計分析
4.1.2 二聯(lián)核苷酸頻率統(tǒng)計分析
4.1.3 三聯(lián)核苷酸頻率統(tǒng)計分析
4.2 預(yù)測增強(qiáng)子及其強(qiáng)弱類別方案一
4.2.1 基于核苷酸理化屬性的多種特征融合
4.2.2 分類模型的構(gòu)建結(jié)果與分析
4.3 預(yù)測增強(qiáng)子及其強(qiáng)弱類別方案二
4.3.1 基于SAAC的 DNA核苷酸理化性質(zhì)及密度分布的特征融合
4.3.2 基于支持向量機(jī)構(gòu)建兩層分類模型
4.3.3 預(yù)測結(jié)果與分析
4.3.4 ROC曲線圖
4.4 與現(xiàn)存方法比較
4.5 本章小結(jié)
5 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間參加的項目和所發(fā)表的論文
本文編號:3704002
【文章頁數(shù)】:64 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 增強(qiáng)子及其強(qiáng)弱類型
1.1.1 增強(qiáng)子
1.1.2 強(qiáng)增強(qiáng)子和弱增強(qiáng)子
1.2 增強(qiáng)子預(yù)測分類研究背景及研究意義
1.2.1 增強(qiáng)子預(yù)測分類研究背景
1.2.2 增強(qiáng)子預(yù)測分類研究意義
1.3 論文的研究內(nèi)容及結(jié)構(gòu)劃分
2 常用的基因組序列特征提取方法
2.1 核苷酸成分法
2.1.1 單核苷酸組成成份法
2.1.2 二聯(lián)核苷酸組成成份法
2.1.3 三聯(lián)核苷酸組成成份法
2.2 偽K聯(lián)核苷酸成分法
2.2.1 基于核苷酸結(jié)構(gòu)屬性的偽K聯(lián)核苷酸成分法
2.2.2 基于核酸蛋白質(zhì)理化屬性的偽K聯(lián)核苷酸成分法
2.2.3 基于多窗口的偽K聯(lián)偽核苷酸成分法
2.3 基于核苷酸理化性質(zhì)及密度分布的融合特征法
2.3.1 核苷酸的物理化學(xué)屬性
2.3.2 核苷酸的密度分布
2.4 基于三聯(lián)核苷酸理化屬性的移動平均法
2.5 本章小結(jié)
3 常用的機(jī)器學(xué)習(xí)分類算法及評價
3.1 常用的機(jī)器學(xué)習(xí)分類算法
3.1.1 支持向量機(jī)
3.1.2 隨機(jī)森林
3.1.3 K-近鄰
3.1.4 人工神經(jīng)網(wǎng)絡(luò)
3.2 常用的檢驗方法與評價指標(biāo)
3.2.1 分類算法的檢驗方法
3.2.2 分類算法的評價指標(biāo)
3.3 本章小結(jié)
4 增強(qiáng)子及其強(qiáng)弱類別的預(yù)測研究
4.1 基準(zhǔn)數(shù)據(jù)集
4.1.1 單核苷酸頻率統(tǒng)計分析
4.1.2 二聯(lián)核苷酸頻率統(tǒng)計分析
4.1.3 三聯(lián)核苷酸頻率統(tǒng)計分析
4.2 預(yù)測增強(qiáng)子及其強(qiáng)弱類別方案一
4.2.1 基于核苷酸理化屬性的多種特征融合
4.2.2 分類模型的構(gòu)建結(jié)果與分析
4.3 預(yù)測增強(qiáng)子及其強(qiáng)弱類別方案二
4.3.1 基于SAAC的 DNA核苷酸理化性質(zhì)及密度分布的特征融合
4.3.2 基于支持向量機(jī)構(gòu)建兩層分類模型
4.3.3 預(yù)測結(jié)果與分析
4.3.4 ROC曲線圖
4.4 與現(xiàn)存方法比較
4.5 本章小結(jié)
5 總結(jié)與展望
5.1 總結(jié)
5.2 展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間參加的項目和所發(fā)表的論文
本文編號:3704002
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3704002.html
最近更新
教材專著