天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

基于Hadoop平臺的下一代測序數(shù)據(jù)處理算法研究

發(fā)布時間:2021-04-14 11:29
  下一代測序技術(shù)的發(fā)展產(chǎn)生大量的測序短序列,序列比對是將測序短序列映射到參考基因組的過程,對生物同源性分析,SNP位點預(yù)測及疾病預(yù)測具有重要的研究意義。由于下一代測序數(shù)據(jù)包含大量的重復(fù)序列,處理重復(fù)序列會帶來不必要的資源消耗,因此序列去重是常見的測序數(shù)據(jù)預(yù)處理操作,F(xiàn)有很多去重和比對的方法,但是這些方法面對大規(guī)模測序數(shù)據(jù)處理存在耗時長、效率低等問題。近年來研究界提出了一些面向大數(shù)據(jù)的并行處理算法,雖然在數(shù)據(jù)處理效率上有很大的提升,但依然存在著很大的改進空間,性能還需進一步提高。針對此問題,本文研究并實現(xiàn)基于Hadoop平臺的大規(guī)模測序序列去重和比對并行化算法,主要研究內(nèi)容和結(jié)論如下:(1)序列去重算法的研究與改進針對測序數(shù)據(jù)中存在大量的重復(fù)序列,本文研究基于前綴后綴思想的并行去重算法,并在此基礎(chǔ)上進行改進。算法的改進包括以下兩個方面:(1)原始算法去重結(jié)果中仍包含基準(zhǔn)重復(fù)序列,針對此問題,本研究在去重過程中刪除基準(zhǔn)重復(fù)序列,進一步提高了去重率。(2)原始算法去重結(jié)果中包含大量低質(zhì)量序列,針對此問題,本文提出在去重過程中結(jié)合質(zhì)量控制,過濾低質(zhì)量序列,提升測序數(shù)據(jù)質(zhì)量。(2)序列比對算法的并... 

【文章來源】:西北農(nóng)林科技大學(xué)陜西省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:59 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于Hadoop平臺的下一代測序數(shù)據(jù)處理算法研究


人類基因組測序成本Fig.1-1Thecostofsequencingthehumangenome

成本,信息工作者,數(shù)據(jù),單次


圖 1-2 每兆堿基測序成本Fig. 1-2 The cost of sequencing per megabit base001 年至 2007 年 10 月的數(shù)據(jù)代表使用第一成本,從 2008 年 1 月開始的數(shù)據(jù)代表近年來序技術(shù)的發(fā)展為生物信息工作者帶來便利的技術(shù)的發(fā)展,人們可以在短時間內(nèi)獲得大 單次運轉(zhuǎn)能產(chǎn)生 600GB 的新一代測序數(shù)據(jù)

過程圖,測序,高通量,平臺


Illumina 遺傳分析儀性價比高,是目前主流的高通量測序平臺。Illumina 測序平臺的測序過程如圖2-1①所示,具體包括以下步驟:第一步,將 DNA 序列打碎,形成短的片段;第二步,將 DNA 片段兩側(cè) 3’ 端和 5’ 端連上接頭;第三步,將 DNA 片段固定在磁珠上,形成微反應(yīng)器;第四步,每個片段獨立地進行擴增-微乳液 PCR 擴增;第五步,進行引物雜交和酶延伸反應(yīng),同一時刻進行熒光標(biāo)記的成像檢測。圖 2-1 高通量測序平臺測序過程Fig. 2-1 High-throughput sequencing platform sequencing process①https://www.biomart.cn/specials/illumina/article/57234

【參考文獻】:
期刊論文
[1]高通量測序行業(yè)現(xiàn)狀與發(fā)展趨勢分析[J]. 施慧琳,蘇燕,許麗,王玥.  生物產(chǎn)業(yè)技術(shù). 2018(03)
[2]高通量DNA測序數(shù)據(jù)的生物信息學(xué)方法[J]. 詹曉娟,姚登舉,朱懷球.  大數(shù)據(jù). 2016(02)
[3]序列比對算法中的BW變換索引技術(shù)研究及其改進[J]. 趙雅男,徐云,程昊宇.  計算機工程. 2016(01)
[4]基于新一代測序數(shù)據(jù)的比對算法的研究[J]. 權(quán)威,王亞東.  智能計算機與應(yīng)用. 2012(05)
[5]BWT與經(jīng)典壓縮算法研究[J]. 倪桂強,李彬,羅健欣,張雪.  計算機與數(shù)字工程. 2010(11)

碩士論文
[1]基于高通量轉(zhuǎn)錄組測序的序列比對算法研究[D]. 張勇.中國科學(xué)技術(shù)大學(xué) 2016
[2]基于分布式計算的高通量測序比對方法的研究與實現(xiàn)[D]. 張鑫.北京郵電大學(xué) 2015
[3]基于BWT的快速DNA比對系統(tǒng)的設(shè)計與實現(xiàn)[D]. 周渝東.哈爾濱工業(yè)大學(xué) 2014



本文編號:3137236

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3137236.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9ccb7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com