基于SOPC的Smith-Waterman算法硬件加速器的設(shè)計與實(shí)現(xiàn)
發(fā)布時間:2021-11-13 04:03
近年來,生物信息學(xué)在不斷地發(fā)展并成為一門重要的學(xué)科,國內(nèi)許多高校和科研院所都在大力發(fā)展這一方面的技術(shù),使其有了突飛猛進(jìn)的發(fā)展,并且以大數(shù)據(jù)為基礎(chǔ)的精準(zhǔn)醫(yī)療將成為我國“十三五”期間重點(diǎn)發(fā)展的科學(xué)領(lǐng)域,這樣使得生物信息學(xué)領(lǐng)域更受關(guān)注。生物序列分析是現(xiàn)代生命科學(xué)領(lǐng)域中重要的基礎(chǔ)性研究工作,而進(jìn)行序列分析的根本就是序列比對。目前美國已經(jīng)建立起100萬人的基因數(shù)據(jù)庫,預(yù)計我國的基因數(shù)據(jù)庫將遠(yuǎn)超此量級,并且伴隨著新一代測序技術(shù)的迅速發(fā)展,所需比對分析的序列數(shù)量出現(xiàn)了爆炸性增長的趨勢,但在現(xiàn)如今的序列比對技術(shù)當(dāng)中,已經(jīng)難以找出匹配序列數(shù)量迅速增快的技術(shù),隨后引發(fā)了序列比對速度跟不上序列產(chǎn)生速度的問題。針對這一問題,本文開展了基于SOPC的Smith-Waterman基因序列比對算法硬件加速器的設(shè)計實(shí)現(xiàn)工作,該研究利用Smith-Waterman算法原理與脈動陣列思想相結(jié)合的方法,基于SOPC硬件系統(tǒng)實(shí)現(xiàn)算法的高速完成,解決了上述的速度失配問題,具有十分重要的工程應(yīng)用價值。本文首先對基因數(shù)據(jù)處理流程進(jìn)行分析,提取其關(guān)鍵步驟,通過對處理模型進(jìn)行特征分析,得出其中序列比對環(huán)節(jié)耗時最嚴(yán)重的結(jié)論;隨后制定Sm...
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1個人全基因組測序成本發(fā)展趨勢
圖 2-1 堿基替換類型圖2)第二種是堿基插入,堿基插入就是在 DNA 基因序列當(dāng)中的某個位置插個或數(shù)個新的堿基,導(dǎo)致原來的序列長度變長產(chǎn)生影響,比如 AAGGTTACTT AAGGATTAACTT。3)第三種是堿基刪除,堿基刪除就是在 DNA 基因序列當(dāng)中的某個位置丟個或數(shù)個新的堿基,導(dǎo)致原來的序列長度變短產(chǎn)生影響,比如 AAGGTTACTT AGGTTACT。如圖 2-2 所示,其為雙序列比對時堿基因子產(chǎn)生的替換、插入及刪除的示意圖匹配 轉(zhuǎn)換 顛換 顛換轉(zhuǎn)換顛換顛換AGCT匹配匹配匹配顛換顛換顛換顛換轉(zhuǎn)換轉(zhuǎn)換
圖 2-3 基因序列增長擬合圖列比對列比對,它所解決針對的問題就是來判斷兩個 DNA 或蛋白的序列的、它們在演化上是否可能同源、我們能是否用一個蛋白的功能來預(yù)測,將這個問題歸結(jié)到計算上,就是:找到兩個序列的最優(yōu)或近似最優(yōu)的的更快,時間更短,量化二者的相似性。本節(jié)會以經(jīng)典的 Needleman-列比對算法、Smith-Waterman 局部序列比對算法以及基于仿射空位-Waterman 算法作為研究對象,具體比較各種算法的差異性。 序列比對基本原理因序列比對就是在尋找序列之間的最優(yōu)匹配問題,通過計算序列之,從而得到序列之間的生物屬性,這就是序列比對的目的。從參與比來劃分,序列比對可以分為雙序列和多序列比對,其中雙序列比對又的基礎(chǔ),進(jìn)行比對的兩條序列,一條叫參考序列,另一條叫目的序列
【參考文獻(xiàn)】:
期刊論文
[1]計算生物學(xué)中的高性能計算(Ⅱ)—序列分析[J]. 王濤. 計算機(jī)工程與科學(xué). 2015(01)
[2]動態(tài)規(guī)劃算法綜述[J]. 張瑩. 科技視界. 2014(28)
[3]基于FPGA的帶回溯的Smith-Waterman算法加速器的設(shè)計與實(shí)現(xiàn)[J]. 鄒丹,竇勇,夏飛,倪時策. 國防科技大學(xué)學(xué)報. 2009(05)
[4]基因芯片與高通量DNA測序技術(shù)前景分析[J]. 滕曉坤,肖華勝. 中國科學(xué)(C輯:生命科學(xué)). 2008(10)
[5]生物信息學(xué):我們能做什么?[J]. 朱慶華,李亮. 情報理論與實(shí)踐. 2006(04)
[6]生物序列分析中的若干數(shù)學(xué)方法[J]. 謝惠民. 高校應(yīng)用數(shù)學(xué)學(xué)報A輯(中文版). 2005(04)
[7]一種面向生物信息學(xué)的可重構(gòu)加速卡的設(shè)計與實(shí)現(xiàn)[J]. 張佩珩,劉新春,江先陽. 計算機(jī)研究與發(fā)展. 2005(06)
[8]Smith-Waterman算法在脈動陣列上的實(shí)現(xiàn)及分析[J]. 汪冬,唐志敏. 計算機(jī)學(xué)報. 2004(01)
博士論文
[1]大規(guī)模生物序列分析的高性能算法和模型[D]. 楊矯云.中國科學(xué)技術(shù)大學(xué) 2014
[2]基于多核CPU和GPU的生物序列分析并行算法研究[D]. 趙志恒.國防科學(xué)技術(shù)大學(xué) 2013
[3]生物序列分析算法硬件加速器關(guān)鍵技術(shù)研究[D]. 夏飛.國防科學(xué)技術(shù)大學(xué) 2011
碩士論文
[1]Smith-Waterman算法硬件加速的研究與實(shí)現(xiàn)[D]. 陳觀君.電子科技大學(xué) 2017
[2]基于AXI總線的SoC架構(gòu)設(shè)計與分析[D]. 胡景華.上海交通大學(xué) 2013
[3]基于AMBA2.0的SoC總線平臺的設(shè)計[D]. 陸小艷.西安電子科技大學(xué) 2012
[4]基于AMBA總線的通用存控設(shè)計與實(shí)現(xiàn)[D]. 孫志剛.國防科學(xué)技術(shù)大學(xué) 2011
[5]面向生物序列分析的算法加速器關(guān)鍵技術(shù)研究[D]. 張陽.國防科學(xué)技術(shù)大學(xué) 2008
[6]嵌入式系統(tǒng)軟硬件劃分方法的研究[D]. 杜敏.哈爾濱理工大學(xué) 2008
[7]生物序列模式發(fā)現(xiàn)算法的研究[D]. 趙麗華.西安電子科技大學(xué) 2007
[8]關(guān)于多序列比對和系統(tǒng)發(fā)育分析中的序列空位研究[D]. 史衛(wèi)峰.中國農(nóng)業(yè)大學(xué) 2005
本文編號:3492282
【文章來源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1個人全基因組測序成本發(fā)展趨勢
圖 2-1 堿基替換類型圖2)第二種是堿基插入,堿基插入就是在 DNA 基因序列當(dāng)中的某個位置插個或數(shù)個新的堿基,導(dǎo)致原來的序列長度變長產(chǎn)生影響,比如 AAGGTTACTT AAGGATTAACTT。3)第三種是堿基刪除,堿基刪除就是在 DNA 基因序列當(dāng)中的某個位置丟個或數(shù)個新的堿基,導(dǎo)致原來的序列長度變短產(chǎn)生影響,比如 AAGGTTACTT AGGTTACT。如圖 2-2 所示,其為雙序列比對時堿基因子產(chǎn)生的替換、插入及刪除的示意圖匹配 轉(zhuǎn)換 顛換 顛換轉(zhuǎn)換顛換顛換AGCT匹配匹配匹配顛換顛換顛換顛換轉(zhuǎn)換轉(zhuǎn)換
圖 2-3 基因序列增長擬合圖列比對列比對,它所解決針對的問題就是來判斷兩個 DNA 或蛋白的序列的、它們在演化上是否可能同源、我們能是否用一個蛋白的功能來預(yù)測,將這個問題歸結(jié)到計算上,就是:找到兩個序列的最優(yōu)或近似最優(yōu)的的更快,時間更短,量化二者的相似性。本節(jié)會以經(jīng)典的 Needleman-列比對算法、Smith-Waterman 局部序列比對算法以及基于仿射空位-Waterman 算法作為研究對象,具體比較各種算法的差異性。 序列比對基本原理因序列比對就是在尋找序列之間的最優(yōu)匹配問題,通過計算序列之,從而得到序列之間的生物屬性,這就是序列比對的目的。從參與比來劃分,序列比對可以分為雙序列和多序列比對,其中雙序列比對又的基礎(chǔ),進(jìn)行比對的兩條序列,一條叫參考序列,另一條叫目的序列
【參考文獻(xiàn)】:
期刊論文
[1]計算生物學(xué)中的高性能計算(Ⅱ)—序列分析[J]. 王濤. 計算機(jī)工程與科學(xué). 2015(01)
[2]動態(tài)規(guī)劃算法綜述[J]. 張瑩. 科技視界. 2014(28)
[3]基于FPGA的帶回溯的Smith-Waterman算法加速器的設(shè)計與實(shí)現(xiàn)[J]. 鄒丹,竇勇,夏飛,倪時策. 國防科技大學(xué)學(xué)報. 2009(05)
[4]基因芯片與高通量DNA測序技術(shù)前景分析[J]. 滕曉坤,肖華勝. 中國科學(xué)(C輯:生命科學(xué)). 2008(10)
[5]生物信息學(xué):我們能做什么?[J]. 朱慶華,李亮. 情報理論與實(shí)踐. 2006(04)
[6]生物序列分析中的若干數(shù)學(xué)方法[J]. 謝惠民. 高校應(yīng)用數(shù)學(xué)學(xué)報A輯(中文版). 2005(04)
[7]一種面向生物信息學(xué)的可重構(gòu)加速卡的設(shè)計與實(shí)現(xiàn)[J]. 張佩珩,劉新春,江先陽. 計算機(jī)研究與發(fā)展. 2005(06)
[8]Smith-Waterman算法在脈動陣列上的實(shí)現(xiàn)及分析[J]. 汪冬,唐志敏. 計算機(jī)學(xué)報. 2004(01)
博士論文
[1]大規(guī)模生物序列分析的高性能算法和模型[D]. 楊矯云.中國科學(xué)技術(shù)大學(xué) 2014
[2]基于多核CPU和GPU的生物序列分析并行算法研究[D]. 趙志恒.國防科學(xué)技術(shù)大學(xué) 2013
[3]生物序列分析算法硬件加速器關(guān)鍵技術(shù)研究[D]. 夏飛.國防科學(xué)技術(shù)大學(xué) 2011
碩士論文
[1]Smith-Waterman算法硬件加速的研究與實(shí)現(xiàn)[D]. 陳觀君.電子科技大學(xué) 2017
[2]基于AXI總線的SoC架構(gòu)設(shè)計與分析[D]. 胡景華.上海交通大學(xué) 2013
[3]基于AMBA2.0的SoC總線平臺的設(shè)計[D]. 陸小艷.西安電子科技大學(xué) 2012
[4]基于AMBA總線的通用存控設(shè)計與實(shí)現(xiàn)[D]. 孫志剛.國防科學(xué)技術(shù)大學(xué) 2011
[5]面向生物序列分析的算法加速器關(guān)鍵技術(shù)研究[D]. 張陽.國防科學(xué)技術(shù)大學(xué) 2008
[6]嵌入式系統(tǒng)軟硬件劃分方法的研究[D]. 杜敏.哈爾濱理工大學(xué) 2008
[7]生物序列模式發(fā)現(xiàn)算法的研究[D]. 趙麗華.西安電子科技大學(xué) 2007
[8]關(guān)于多序列比對和系統(tǒng)發(fā)育分析中的序列空位研究[D]. 史衛(wèi)峰.中國農(nóng)業(yè)大學(xué) 2005
本文編號:3492282
本文鏈接:http://sikaile.net/projectlw/swxlw/3492282.html
最近更新
教材專著