天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 碩博論文 > 信息類碩士論文 >

基于Spark的DNA序列拼接算法研究

發(fā)布時(shí)間:2022-07-02 12:18
  生物信息學(xué)是對(duì)生物信息進(jìn)行處理的交叉學(xué)科,DNA序列拼接問(wèn)題是其研究的主要內(nèi)容之一。DNA序列長(zhǎng)度少則幾千,多則數(shù)十億,但目前測(cè)序儀的平均讀長(zhǎng)僅在500bp左右,無(wú)法直接測(cè)得生物體的基因組。所以,DNA序列拼接算法應(yīng)運(yùn)而生。該算法首先將目標(biāo)序列打斷成小片段,然后對(duì)這些小片段進(jìn)行分別測(cè)序,最后利用計(jì)算機(jī)技術(shù)根據(jù)片段間的重疊關(guān)系進(jìn)行拼接。目前,序列拼接算法主要分為Overlap-Layout-Consensus拼接算法和de-Bruijin graph 拼接算法。Overlap-Layout-Consensus 拼接算法運(yùn)用 "overlap-layout-consensus"方法基于read片段進(jìn)行拼接處理,雖能保留片段的完整信息,但卻不能有效克服重復(fù)序列的問(wèn)題。de-Bruijin graph拼接算法將read片段進(jìn)行進(jìn)一步拆分,然后基于更小的片段單元進(jìn)行拼接處理,一定程度上克服了重復(fù)序列問(wèn)題,但同時(shí)產(chǎn)生大量的k-mer片段,并且需要生成deBruijin圖,所以,這類算法存在著很大的存儲(chǔ)和時(shí)間上的開銷。另外,對(duì)于實(shí)現(xiàn)平臺(tái)而言,大多數(shù)研究在于單機(jī)環(huán)境下實(shí)現(xiàn)的串行算法,這種算法的瓶頸是空... 

【文章頁(yè)數(shù)】:57 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
縮略語(yǔ)表
1 引言
    1.1 DNA序列拼接概述
    1.2 課題背景
    1.3 國(guó)內(nèi)外研究現(xiàn)狀
    1.4 本文主要內(nèi)容及意義
        1.4.1 課題研究?jī)?nèi)容
        1.4.2 課題研究意義
    1.5 論文章節(jié)安排
2 相關(guān)理論概述
    2.1 DNA測(cè)序技術(shù)
        2.1.1 第一代測(cè)序技術(shù)
        2.1.2 第二代測(cè)序技術(shù)
        2.1.3 第三代測(cè)序技術(shù)
    2.2 序列拼接問(wèn)題描述
        2.2.1 研究DNA拼接算法的目的
        2.2.2 拼接算法難點(diǎn)
    2.3 序列拼接算法介紹
        2.3.1 Greedy-extension拼接算法
        2.3.2 Overlap-Layout-Consensus拼接算法
        2.3.3 de-Bruijin graph拼接算法
        2.3.4 算法優(yōu)缺點(diǎn)對(duì)比
    2.4 拼接算法難點(diǎn)分析
        2.4.1 ARACHNE法
        2.4.2 路徑相容法
        2.4.3 聚類分析法
    2.5 拼接算法并行化研究情況
    2.6 Spark并行框架介紹
        2.6.1 Spark要架構(gòu)
        2.6.2 RDD簡(jiǎn)介
        2.6.3 Spark的任務(wù)處理
        2.6.4 Spark處理數(shù)據(jù)的特點(diǎn)
    2.7 本章小結(jié)
3 基于Spark的Improved SSA-Spark序列拼接算法
    3.1 拼接算法的選擇
    3.2 de-Bruijin graph拼接算法具體流程
        3.2.1 k-mer序列的生成
        3.2.2 de-Bruijin圖的建立
        3.2.3 拼接路徑的選擇
    3.3 Spark并行環(huán)境下的DNA序列拼接算法的處理
        3.3.1 read文件生成方式
        3.3.2 read序列的拆分過(guò)程
        3.3.3 Improved SSA-Sparκ算法中k-mer的獲取
        3.3.4 Improved SSA-Spark算法拼接的路徑選擇
        3.3.5 Improved SSA-Spark算法在新平臺(tái)Spark并行框架下的實(shí)現(xiàn)
    3.4 基于Spark的Improved SSA-Spark序列拼接算法步驟描述
    3.5 本章小結(jié)
4 模擬及實(shí)驗(yàn)結(jié)果分析
    4.1 云計(jì)算平臺(tái)配置
    4.2 實(shí)驗(yàn)數(shù)據(jù)的產(chǎn)生
    4.3 實(shí)驗(yàn)設(shè)計(jì)
    4.4 實(shí)驗(yàn)結(jié)果與分析
        4.4.1 基于Spark的序列拼接算法與單機(jī)串行算法的時(shí)間比對(duì)
        4.4.2 基于Spark的序列拼接算法與MapReduce環(huán)境下的算法時(shí)間比對(duì)
        4.4.3 Improved SSA-Spark算法在Spark并行環(huán)境下的性能測(cè)試
        4.4.4 Improved SSA-Spark算法的線程數(shù)量對(duì)運(yùn)行時(shí)間的影響
    4.5 本章小結(jié)
5 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
致謝
參考文獻(xiàn)
作者簡(jiǎn)介



本文編號(hào):3654351

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3654351.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶43512***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
免费高清欧美一区二区视频| 国产视频在线一区二区| 亚洲夫妻性生活免费视频| 沐浴偷拍一区二区视频| 尤物久久91欧美人禽亚洲| 亚洲熟妇av一区二区三区色堂| 成人日韩在线播放视频| 国产精品欧美一区两区| 午夜福利精品视频视频| 夜夜躁狠狠躁日日躁视频黑人| 亚洲成人黄色一级大片| 不卡中文字幕在线视频| 日韩成人动画在线观看| 日本精品最新字幕视频播放| 日韩日韩欧美国产精品| 黄片免费在线观看日韩| 亚洲欧美日本成人在线| 亚洲欧洲一区二区中文字幕| 国产欧美日韩精品一区二| 夫妻性生活动态图视频| 后入美臀少妇一区二区| 男人和女人干逼的视频| 91天堂免费在线观看 | 欧美黄色黑人一区二区| 国产日韩中文视频一区| 久一视频这里只有精品| 深夜日本福利在线观看| 久久久精品区二区三区| 欧美精品亚洲精品日韩专区| 都市激情小说在线一区二区三区| 五月天婷亚洲天婷综合网| 久久国产亚洲精品成人| 国产一区二区三区精品免费| 麻豆欧美精品国产综合久久| 中文字幕不卡欧美在线| 日韩无套内射免费精品| 亚洲国产精品久久精品成人| 中文字幕佐山爱一区二区免费| 国产91色综合久久高清| 国产女优视频一区二区| 成人免费观看视频免费|