基于層次聚類的生物序列結(jié)構(gòu)分析
發(fā)布時間:2021-09-06 20:59
生物序列是計算生物學(xué)中的一個重要研究對象,主要包含DNA序列和蛋白質(zhì)序列等。生物序列中隱藏著生物的遺傳信息,其發(fā)現(xiàn)與研究在生物學(xué)、醫(yī)學(xué)、藥學(xué)等領(lǐng)域上都有重要意義。為了挖掘生物序列中的遺傳信息,需要對序列結(jié)構(gòu)進行分析。層次聚類作為一種經(jīng)典的生物序列結(jié)構(gòu)分析方法,可用于獲得不同生物序列之間的相似性關(guān)系,進而分析序列的功能,研究其中隱藏的遺傳信息。本文研究的是生物序列的一級結(jié)構(gòu),主要利用各種數(shù)值映射方法構(gòu)造生物序列的特征向量,并基于特征向量對生物序列作結(jié)構(gòu)分析,然后研究生物序列之間的相關(guān)關(guān)系并預(yù)測序列功能,最后討論其生物學(xué)意義。研究中主要使用層次聚類對序列作結(jié)構(gòu)分析,同時結(jié)合使用了DNA分段、方差分析和分組討論等方法,并將處于DNA編碼區(qū)的p53家族基因和非編碼區(qū)的DNase I高敏位點(DNase I hypersensitive sites,DHSs)作為研究對象,具體工作為:1、研究p53家族基因的進化差異性。提取24條p53家族的DNA序列作為研究對象,利用混沌游走表示的方法將DNA序列映射為平面直角坐標系中的點列,然后構(gòu)造8維加權(quán)特征向量來描述DNA序列。結(jié)合DNA分段和方差分析等...
【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:43 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 計算生物學(xué)簡介
1.1.1 計算生物學(xué)的概念及其背景
1.1.2 計算生物學(xué)的研究內(nèi)容
1.1.3 計算生物學(xué)的研究現(xiàn)狀和發(fā)展趨勢
1.2 生物序列
1.2.1 P53家族
1.2.2 DNase Ⅰ高敏位點
1.3 本論文的主要研究內(nèi)容
第二章 編碼區(qū)p53家族基因的進化差異性分析
2.1 CGR方法的研究簡介
2.2 數(shù)據(jù)與方法
2.2.1 數(shù)據(jù)來源
2.2.2 CGR方法
2.2.3 加權(quán)特征向量
2.2.4 組內(nèi)精度和分組優(yōu)度
2.3 結(jié)果與討論
2.3.1 原始方法下p53 家族DNA序列的差異性分析
2.3.2 改進方法下p53 家族DNA序列的差異性分析
2.4 本章小結(jié)
第三章 編碼區(qū)p53家族基因的三周期性及其分步聚類分析
3.1 三周期性研究概況
3.2 數(shù)據(jù)與方法
3.2.1 數(shù)據(jù)來源
3.2.2 Voss映射
3.2.3 DFT方法
3.2.4 三周期性強度
3.2.5 分步聚類分析
3.3 結(jié)果與討論
3.3.1 P53家族基因的三周期性分析
3.3.2 P53家族基因的分步聚類分析
3.4 本章小結(jié)
第四章 非編碼區(qū)DHSs的結(jié)構(gòu)分析及其預(yù)測算法
4.1 數(shù)據(jù)與方法
4.1.1 數(shù)據(jù)來源
4.1.2 PseTNC方法
4.1.3 分組分類算法
4.1.4 加權(quán)歐式距離
4.1.5 性能評估
4.2 結(jié)果與討論
4.2.1 參數(shù)優(yōu)化
4.2.2 特征分析
4.2.3 交叉驗證與結(jié)果比較
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 工作展望
致謝
參考文獻
附錄:作者在攻讀碩士學(xué)位期間發(fā)表的論文及參加的學(xué)術(shù)活動
【參考文獻】:
期刊論文
[1]生物學(xué)新興前沿學(xué)科——計算生物學(xué)[J]. 梁丹,薄文浩,姜立波. 中國林業(yè)教育. 2017(S1)
[2]外顯子周期性探究及自適應(yīng)識別快速算法研究[J]. 佟慶英,熊小峰,劉松華. 數(shù)學(xué)的實踐與認識. 2015(04)
[3]P53基因三周期性與密碼子偏好性的相關(guān)性[J]. 王其強,談承杰,朱平. 物理學(xué)報. 2014(04)
[4]P53基因蛋白質(zhì)序列的相似性及其聚類分析[J]. 仇建燁,朱平. 計算機與應(yīng)用化學(xué). 2013(09)
[5]外顯子周期三行為特征的研究[J]. 田元新,陳超,鄒小勇,邱建丁,蔡沛祥,莫金垣. 化學(xué)學(xué)報. 2005(13)
[6]人類基因組計劃與后基因組時代[J]. 駱建新,鄭崛村,馬用信,張思仲. 中國生物工程雜志. 2003(11)
[7]不具有3-堿基周期性的編碼序列初探[J]. 張靜,石秀凡. 生物化學(xué)與生物物理進展. 2002(02)
碩士論文
[1]擬南芥WRKY基因家族的進化研究[D]. 郝博濟.天津大學(xué) 2014
本文編號:3388165
【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:43 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 計算生物學(xué)簡介
1.1.1 計算生物學(xué)的概念及其背景
1.1.2 計算生物學(xué)的研究內(nèi)容
1.1.3 計算生物學(xué)的研究現(xiàn)狀和發(fā)展趨勢
1.2 生物序列
1.2.1 P53家族
1.2.2 DNase Ⅰ高敏位點
1.3 本論文的主要研究內(nèi)容
第二章 編碼區(qū)p53家族基因的進化差異性分析
2.1 CGR方法的研究簡介
2.2 數(shù)據(jù)與方法
2.2.1 數(shù)據(jù)來源
2.2.2 CGR方法
2.2.3 加權(quán)特征向量
2.2.4 組內(nèi)精度和分組優(yōu)度
2.3 結(jié)果與討論
2.3.1 原始方法下p53 家族DNA序列的差異性分析
2.3.2 改進方法下p53 家族DNA序列的差異性分析
2.4 本章小結(jié)
第三章 編碼區(qū)p53家族基因的三周期性及其分步聚類分析
3.1 三周期性研究概況
3.2 數(shù)據(jù)與方法
3.2.1 數(shù)據(jù)來源
3.2.2 Voss映射
3.2.3 DFT方法
3.2.4 三周期性強度
3.2.5 分步聚類分析
3.3 結(jié)果與討論
3.3.1 P53家族基因的三周期性分析
3.3.2 P53家族基因的分步聚類分析
3.4 本章小結(jié)
第四章 非編碼區(qū)DHSs的結(jié)構(gòu)分析及其預(yù)測算法
4.1 數(shù)據(jù)與方法
4.1.1 數(shù)據(jù)來源
4.1.2 PseTNC方法
4.1.3 分組分類算法
4.1.4 加權(quán)歐式距離
4.1.5 性能評估
4.2 結(jié)果與討論
4.2.1 參數(shù)優(yōu)化
4.2.2 特征分析
4.2.3 交叉驗證與結(jié)果比較
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 全文總結(jié)
5.2 工作展望
致謝
參考文獻
附錄:作者在攻讀碩士學(xué)位期間發(fā)表的論文及參加的學(xué)術(shù)活動
【參考文獻】:
期刊論文
[1]生物學(xué)新興前沿學(xué)科——計算生物學(xué)[J]. 梁丹,薄文浩,姜立波. 中國林業(yè)教育. 2017(S1)
[2]外顯子周期性探究及自適應(yīng)識別快速算法研究[J]. 佟慶英,熊小峰,劉松華. 數(shù)學(xué)的實踐與認識. 2015(04)
[3]P53基因三周期性與密碼子偏好性的相關(guān)性[J]. 王其強,談承杰,朱平. 物理學(xué)報. 2014(04)
[4]P53基因蛋白質(zhì)序列的相似性及其聚類分析[J]. 仇建燁,朱平. 計算機與應(yīng)用化學(xué). 2013(09)
[5]外顯子周期三行為特征的研究[J]. 田元新,陳超,鄒小勇,邱建丁,蔡沛祥,莫金垣. 化學(xué)學(xué)報. 2005(13)
[6]人類基因組計劃與后基因組時代[J]. 駱建新,鄭崛村,馬用信,張思仲. 中國生物工程雜志. 2003(11)
[7]不具有3-堿基周期性的編碼序列初探[J]. 張靜,石秀凡. 生物化學(xué)與生物物理進展. 2002(02)
碩士論文
[1]擬南芥WRKY基因家族的進化研究[D]. 郝博濟.天津大學(xué) 2014
本文編號:3388165
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3388165.html
最近更新
教材專著