基于序列信息的酵母重組熱點(diǎn)和冷點(diǎn)的分析與預(yù)測(cè)研究
本文關(guān)鍵詞:基于序列信息的酵母重組熱點(diǎn)和冷點(diǎn)的分析與預(yù)測(cè)研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著生物技術(shù)的快速不斷發(fā)展,尤其是人類(lèi)基因組計(jì)劃實(shí)施以來(lái),通過(guò)高通量基因的測(cè)序手段得到了大量的生物信息數(shù)據(jù),如何解讀和挖掘這些序列信息顯得日益迫切,因而發(fā)明了一系列基于統(tǒng)計(jì)和計(jì)算方法來(lái)預(yù)測(cè)基因和蛋白質(zhì)的功能。基因重組對(duì)于生命過(guò)程有著重要意義,它能夠交換遺傳的信息,促進(jìn)生命的進(jìn)化。由于基因重組在基因的不同區(qū)域發(fā)生的概率不同,可將基因不同區(qū)域分為冷點(diǎn)和熱點(diǎn)區(qū)域。本文基于序列信息對(duì)酵母DNA重組冷點(diǎn)和熱點(diǎn)進(jìn)行預(yù)測(cè)研究,采用統(tǒng)計(jì)學(xué)方法分析了序列的GC含量、堿基對(duì)的相對(duì)豐度和關(guān)聯(lián)性、密碼子偏性與基因重組的關(guān)系,得出冷點(diǎn)和熱點(diǎn)區(qū)域與GC含量關(guān)系密切,重組熱點(diǎn)區(qū)域中使用的密碼子以GC結(jié)尾使用居多。由于酵母冷點(diǎn)和熱點(diǎn)DNA序列相似度高,所以采用比對(duì)和堿基成分法對(duì)此進(jìn)行預(yù)測(cè)效果不佳。為此本文提出基于灰色理論、復(fù)雜度和二聯(lián)體結(jié)構(gòu)屬性相結(jié)合的偽核苷酸特征來(lái)預(yù)測(cè)酵母的重組冷點(diǎn)序列和重組熱點(diǎn)序列,使用K近鄰方法分類(lèi),Jackknife交叉驗(yàn)證方法測(cè)試結(jié)果表明所提出的模型具有較好的預(yù)測(cè)成功率。本預(yù)測(cè)方法能為生物學(xué)家發(fā)現(xiàn)序列中蘊(yùn)含的重組信息,為揭示基因重組的機(jī)制提供幫助。
【關(guān)鍵詞】:酵母序列 統(tǒng)計(jì)特征 特征提取 復(fù)雜度 重組熱點(diǎn)和冷點(diǎn)
【學(xué)位授予單位】:景德鎮(zhèn)陶瓷學(xué)院
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:Q811.4
【目錄】:
- 摘要3-4
- ABSTRACT4-7
- 1 緒論7-11
- 1.1 引言7
- 1.2 酵母重組的研究背景及研究意義7-10
- 1.2.1 基因重組的概念8-9
- 1.2.2 酵母重組冷點(diǎn)和熱點(diǎn)研究背景、意義及現(xiàn)狀9-10
- 1.3 論文的工作內(nèi)容安排10-11
- 2 基于酵母DNA序列統(tǒng)計(jì)特征及分析11-30
- 2.1 數(shù)據(jù)集的構(gòu)建11
- 2.2 基于酵母序列提取單詞的頻率分析11-19
- 2.2.1 單核苷酸的頻率12-13
- 2.2.2 二聯(lián)核苷酸的頻率13-15
- 2.2.3 三聯(lián)核苷酸的頻率15-19
- 2.3 GC含量分析19-20
- 2.4 二聯(lián)核苷酸相對(duì)豐度分析20-22
- 2.5 堿基對(duì)的關(guān)聯(lián)性分析22-25
- 2.6 密碼子的偏性分析25-30
- 2.6.1 同義密碼子使用度25-27
- 2.6.2 密碼子適用指數(shù)27
- 2.6.3 密碼子偏好參數(shù)27-30
- 3 常用的序列特征提取方法30-41
- 3.1 概述30
- 3.2 基于序列組成成分法提取特征30
- 3.3 基于序列的物理化學(xué)屬性提取特征30-39
- 3.3.1 基于氨基酸的物理化學(xué)屬性30-35
- 3.3.2 基于二聯(lián)核苷酸的結(jié)構(gòu)屬性35-39
- 3.4 基于圖像信息的DNA序列特征提取39-41
- 3.4.1 2D圖像表示法39
- 3.4.2 3D圖像表示法39-41
- 4 基于酵母序列冷點(diǎn)和熱點(diǎn)的分類(lèi)預(yù)測(cè)結(jié)果41-56
- 4.1 酵母序列信息的特征提取41-46
- 4.1.1 基于灰色理論的偽核苷酸特征提取41-43
- 4.1.2 基于結(jié)構(gòu)屬性的偽二聯(lián)核苷酸的特征提取43
- 4.1.3 基于復(fù)雜度的特征提取43-46
- 4.2 對(duì)酵母序列分類(lèi)和檢驗(yàn)評(píng)估46-52
- 4.2.1 基于支持向量機(jī)對(duì)酵母序列分類(lèi)與評(píng)估47-50
- 4.2.2 基于隨機(jī)森林對(duì)酵母序列分類(lèi)與評(píng)估50
- 4.2.3 基于K近鄰法對(duì)酵母序列分類(lèi)與評(píng)估50-52
- 4.3 基于酵母序列優(yōu)化測(cè)試結(jié)果52-54
- 4.3.1 特征選擇概念52-53
- 4.3.2 特征選擇方法具體介紹53-54
- 4.3.3 基于酵母序列的前向特征選擇方法54
- 4.4 基于酵母序列的預(yù)測(cè)結(jié)果與比較54-56
- 5 總結(jié)與展望56-57
- 5.1 總結(jié)56
- 5.2 展望56-57
- 致謝57-58
- 參考文獻(xiàn)58-65
- 攻讀碩士學(xué)位期間參加的項(xiàng)目和所發(fā)表的論文65
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 張冰潔;劉國(guó)慶;蔡祿;;基于多信息融合的酵母重組冷熱點(diǎn)預(yù)測(cè)[J];科學(xué)通報(bào);2014年11期
2 陳會(huì)平;;DMD基因DXS164位點(diǎn)內(nèi)的重組熱點(diǎn)[J];國(guó)外醫(yī)學(xué).遺傳學(xué)分冊(cè);1991年01期
3 ;[J];;年期
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 何積惠 編譯;進(jìn)化中“下落不明”的X因子[N];文匯報(bào);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 吳遠(yuǎn)廷;基于序列信息的酵母重組熱點(diǎn)和冷點(diǎn)的分析與預(yù)測(cè)研究[D];景德鎮(zhèn)陶瓷學(xué)院;2015年
2 張冰潔;減數(shù)分裂重組對(duì)DNA序列和染色質(zhì)結(jié)構(gòu)的依賴(lài)性[D];內(nèi)蒙古科技大學(xué);2013年
本文關(guān)鍵詞:基于序列信息的酵母重組熱點(diǎn)和冷點(diǎn)的分析與預(yù)測(cè)研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):335971
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/335971.html