天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

生物序列的相似性分析及k詞模型研究

發(fā)布時(shí)間:2017-05-31 00:05

  本文關(guān)鍵詞:生物序列的相似性分析及k詞模型研究,,由筆耕文化傳播整理發(fā)布。


【摘要】:伴隨著科學(xué)技術(shù)的迅猛發(fā)展,同時(shí)人類基因工程計(jì)劃(Human Genome Projec, HGP)也已經(jīng)進(jìn)行了全面實(shí)施,人們所獲得的生物序列數(shù)據(jù)與日俱增,生物學(xué)的研究重點(diǎn)也逐步從積累數(shù)據(jù)過渡到分析解釋這些數(shù)據(jù)。這其中蘊(yùn)含著豐富的生物信息,能將它們管理好并從中提取盡可能多的信息是一項(xiàng)有意義的工作,因而很多數(shù)學(xué)家、生物學(xué)家和計(jì)算機(jī)科學(xué)家等多個(gè)領(lǐng)域的研究者都被吸引到生物信息這個(gè)新的交叉學(xué)科中來。而生物序列的比較是其中最重要、最基本的內(nèi)容之一,因?yàn)楹芏嗥渌难芯抗ぷ?像分子進(jìn)化問題、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)問題和基因識(shí)別問題等都是建立在上述工作的基礎(chǔ)上。序列比對(duì)(sequence alignment)是分析生物序列的傳統(tǒng)方法,而限于該分析方法自身存在的一些缺陷,非比對(duì)(alignment-free)方法作為其補(bǔ)充和改進(jìn)而出現(xiàn),并迅速發(fā)展成為計(jì)算分子生物學(xué)的研究熱點(diǎn)之一。在此以DNA序列、蛋白質(zhì)序列作為本文的研究對(duì)象,在圖形表示和k詞模型的基礎(chǔ)上,提出了生物序列的一些新的非比對(duì)模型,并進(jìn)行了相似性分析和進(jìn)化樹的構(gòu)建。主要工作有以下幾個(gè)方面:首先,在考慮到核苷酸化學(xué)結(jié)構(gòu)分類的基礎(chǔ)上,將已有的混沌游走表達(dá)(Chaos Game Representation,CGR)模型進(jìn)行了改進(jìn),首次構(gòu)建了DNA序列的三種CGR空間,得到了CGR-游走的數(shù)值序列,并提取了DNA序列的特征不變量。作為應(yīng)用,對(duì)九個(gè)不同物種β基因外顯子做了相似性分析,取得了較好的效果。我們的方法一方面可以作為DNA序列圖形表示的有效補(bǔ)充,另一方面也可以視為CGR結(jié)果的改進(jìn)。在該模型中首次將堿基的生物化學(xué)性質(zhì)考慮進(jìn)來,且圖形表示直觀,不變量易于計(jì)算,并且通過與已有的模型分析比較,我們的方法得到的結(jié)果更接近已知的生物事實(shí),所以能夠包含更豐富的生物信息。接下來,我們基于氨基酸的詳細(xì)疏水-親水(Hydrophilic-Hydrophobic,HP)模型,提出了蛋白質(zhì)序列的雙向量曲線(Dual Vector Curve,DV-Curve)表達(dá)方式,它是利用兩個(gè)向量來表達(dá)蛋白質(zhì)序列的一個(gè)氨基酸字符。通過建立數(shù)學(xué)模型,給出了DV-曲線表達(dá)和蛋白質(zhì)序列之間的一一對(duì)應(yīng)關(guān)系。這種圖形表示不僅避免了退化性問題,而且對(duì)于長的序列也有著較好的可視化效果,并且曲線本身可以反映序列的長度。作為應(yīng)用,一方面以不同物種的ND6蛋白質(zhì)序列為例,利用它們的DV曲線進(jìn)行了直觀的圖形相似性分析。另一方面,為了便于對(duì)蛋白質(zhì)序列進(jìn)行量化比較,構(gòu)建了24維的特征向量,利用歐氏距離度量得到相似性矩陣,并構(gòu)建了35條S結(jié)構(gòu)蛋白的進(jìn)化樹。本文是首次將DV-Curve方法和詳細(xì)的HP模型結(jié)合起來描述氨基酸序列,結(jié)果顯示該模型對(duì)生物序列有著較好的刻畫能力。在第五章中,我們提出了一種新的k詞(k-word)模型來分析生物序列。由于在進(jìn)化的過程中會(huì)存在堿基突變,當(dāng)給出新的k詞概率分布時(shí)需要去掉隨機(jī)背景,最終得到了表征DNA序列的4k維的特征向量,并以48個(gè)HEV戊型肝炎病毒基因序列和26種胎盤哺乳動(dòng)物線粒體的全基因組序列為例進(jìn)行了分析,取得了較為滿意的效果,并對(duì)字符串k的最優(yōu)取值問題進(jìn)行了探討。
【關(guān)鍵詞】:DNA序列 混沌游走表達(dá) 相似性分析 序列比對(duì) 非序列比對(duì) 蛋白質(zhì)序列 雙向量曲線表達(dá) 圖形表示模型 k詞分布 概率模型 進(jìn)化樹
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類號(hào)】:Q811.4
【目錄】:
  • 摘要7-9
  • 英文摘要9-11
  • 第一章 緒論11-19
  • §1.1 生物信息學(xué)研究背景介紹11-12
  • §1.2 生物信息學(xué)研究對(duì)象12-15
  • §1.3 生物信息學(xué)研究內(nèi)容15-16
  • §1.4 本文的主要工作16-19
  • 第二章 生物序列的相似性比較19-31
  • §2.1 引言19
  • §2.2 生物序列的比較19-31
  • §2.2.1 序列比對(duì)方法(Sequence Alignment)19-21
  • §2.2.2 非序列比對(duì)方法(Free Sequence Alignment)21-31
  • 第三章 DNA序列的CGR圖形表示模型31-43
  • §3.1 引言31-32
  • §3.2 CGR簡介32-36
  • §3.2.1 混沌游戲(The Chaos Game)介紹32-33
  • §3.2.2 DNA序列的混沌游走表達(dá)(Chaos Game Representation)33-34
  • §3.2.3 改進(jìn)的CGR空間34-35
  • §3.2.4 CGR游走數(shù)值序列35-36
  • §3.3 DNA序列的數(shù)值特征36-38
  • §3.4 九個(gè)不同物種的β-基因外顯子序列的相似性分析38-41
  • §3.4.1 相似性分析38-39
  • §3.4.2 與其他結(jié)果對(duì)比39-41
  • §3.5 總結(jié)和討論41-43
  • 第四章 基于DV-Curve表達(dá)的蛋白質(zhì)序列分析和應(yīng)用43-57
  • §4.1 引言43
  • §4.2 蛋白質(zhì)序列的DV-Curve表達(dá)43-47
  • §4.2.1 蛋白質(zhì)序列分類43-45
  • §4.2.2 蛋白質(zhì)序列的圖形表達(dá)45-47
  • §4.3 蛋白質(zhì)序列的數(shù)值特征47-48
  • §4.4 應(yīng)用48-57
  • §4.4.1 基于蛋白質(zhì)DV-Curve直觀圖形的相似性分析48-52
  • §4.4.2 基于冠狀病毒的系統(tǒng)發(fā)育樹分析52-57
  • 第五章 基于k-tuple分布的DNA序列的概率模型57-77
  • §5.1 引言57-58
  • §5.2 模型建立58-62
  • §5.2.1 基本概念和背景介紹58-59
  • §5.2.2 構(gòu)建特征向量59-60
  • §5.2.3 度量方法60-62
  • §5.3 結(jié)果討論62-72
  • §5.3.1 進(jìn)化樹構(gòu)建62-71
  • §5.3.2 背景分析71-72
  • §5.4 結(jié)束語72-77
  • 參考文獻(xiàn)77-86
  • 致謝86-87
  • 攻讀博士學(xué)位期間完成論文情況87-88
  • 附件88

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前1條

1 John SONG;;Protein sequence analysis based on hydropathy profile of amino acids[J];Journal of Zhejiang University-Science B(Biomedicine & Biotechnology);2012年02期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 吳霞;蛋白質(zhì)序列比較中的圖形表示及其相似性分析[D];大連理工大學(xué);2004年


  本文關(guān)鍵詞:生物序列的相似性分析及k詞模型研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):408197

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/408197.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶798cb***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
日韩亚洲精品国产第二页| 日本加勒比在线观看一区| 99久久免费中文字幕| 国产综合香蕉五月婷在线| 欧美一级黄片欧美精品| 黄色片一区二区在线观看| 一区二区免费视频中文乱码国产| 草草草草在线观看视频| 欧美精品亚洲精品一区| 国产成人午夜在线视频| 高清不卡一卡二卡区在线| 国产美女精品午夜福利视频| 欧美人妻一区二区三区| 国产一级二级三级观看| 极品少妇一区二区三区精品视频| 中文字幕人妻一区二区免费| 免费性欧美重口味黄色| 伊人色综合久久伊人婷婷| 久久综合九色综合欧美| 国产传媒精品视频一区| 国产精品丝袜一二三区| 亚洲天堂精品在线视频| 日韩精品视频香蕉视频| 亚洲高清中文字幕一区二区三区 | 亚洲综合一区二区三区在线| 内射精子视频欧美一区二区| 五月婷婷缴情七月丁香 | 毛片在线观看免费日韩| 亚洲天堂国产精品久久精品| 色一情一乱一区二区三区码| 91久久精品在这里色伊人| 色丁香一区二区黑人巨大| 国产欧美日韩一级小黄片| 国产欧美日产中文一区| 国产成人精品午夜福利av免费| 成人三级视频在线观看不卡| 亚洲a级一区二区不卡| 亚洲一区二区三区在线免费| 国产一区二区三区av在线| 99久久精品视频一区二区| 亚洲av专区在线观看|