基于SOPC的Smith-Waterman算法硬件加速器的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-11-13 04:03
近年來(lái),生物信息學(xué)在不斷地發(fā)展并成為一門(mén)重要的學(xué)科,國(guó)內(nèi)許多高校和科研院所都在大力發(fā)展這一方面的技術(shù),使其有了突飛猛進(jìn)的發(fā)展,并且以大數(shù)據(jù)為基礎(chǔ)的精準(zhǔn)醫(yī)療將成為我國(guó)“十三五”期間重點(diǎn)發(fā)展的科學(xué)領(lǐng)域,這樣使得生物信息學(xué)領(lǐng)域更受關(guān)注。生物序列分析是現(xiàn)代生命科學(xué)領(lǐng)域中重要的基礎(chǔ)性研究工作,而進(jìn)行序列分析的根本就是序列比對(duì)。目前美國(guó)已經(jīng)建立起100萬(wàn)人的基因數(shù)據(jù)庫(kù),預(yù)計(jì)我國(guó)的基因數(shù)據(jù)庫(kù)將遠(yuǎn)超此量級(jí),并且伴隨著新一代測(cè)序技術(shù)的迅速發(fā)展,所需比對(duì)分析的序列數(shù)量出現(xiàn)了爆炸性增長(zhǎng)的趨勢(shì),但在現(xiàn)如今的序列比對(duì)技術(shù)當(dāng)中,已經(jīng)難以找出匹配序列數(shù)量迅速增快的技術(shù),隨后引發(fā)了序列比對(duì)速度跟不上序列產(chǎn)生速度的問(wèn)題。針對(duì)這一問(wèn)題,本文開(kāi)展了基于SOPC的Smith-Waterman基因序列比對(duì)算法硬件加速器的設(shè)計(jì)實(shí)現(xiàn)工作,該研究利用Smith-Waterman算法原理與脈動(dòng)陣列思想相結(jié)合的方法,基于SOPC硬件系統(tǒng)實(shí)現(xiàn)算法的高速完成,解決了上述的速度失配問(wèn)題,具有十分重要的工程應(yīng)用價(jià)值。本文首先對(duì)基因數(shù)據(jù)處理流程進(jìn)行分析,提取其關(guān)鍵步驟,通過(guò)對(duì)處理模型進(jìn)行特征分析,得出其中序列比對(duì)環(huán)節(jié)耗時(shí)最嚴(yán)重的結(jié)論;隨后制定Sm...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1個(gè)人全基因組測(cè)序成本發(fā)展趨勢(shì)
圖 2-1 堿基替換類型圖2)第二種是堿基插入,堿基插入就是在 DNA 基因序列當(dāng)中的某個(gè)位置插個(gè)或數(shù)個(gè)新的堿基,導(dǎo)致原來(lái)的序列長(zhǎng)度變長(zhǎng)產(chǎn)生影響,比如 AAGGTTACTT AAGGATTAACTT。3)第三種是堿基刪除,堿基刪除就是在 DNA 基因序列當(dāng)中的某個(gè)位置丟個(gè)或數(shù)個(gè)新的堿基,導(dǎo)致原來(lái)的序列長(zhǎng)度變短產(chǎn)生影響,比如 AAGGTTACTT AGGTTACT。如圖 2-2 所示,其為雙序列比對(duì)時(shí)堿基因子產(chǎn)生的替換、插入及刪除的示意圖匹配 轉(zhuǎn)換 顛換 顛換轉(zhuǎn)換顛換顛換AGCT匹配匹配匹配顛換顛換顛換顛換轉(zhuǎn)換轉(zhuǎn)換
圖 2-3 基因序列增長(zhǎng)擬合圖列比對(duì)列比對(duì),它所解決針對(duì)的問(wèn)題就是來(lái)判斷兩個(gè) DNA 或蛋白的序列的、它們?cè)谘莼鲜欠窨赡芡、我們能是否用一個(gè)蛋白的功能來(lái)預(yù)測(cè),將這個(gè)問(wèn)題歸結(jié)到計(jì)算上,就是:找到兩個(gè)序列的最優(yōu)或近似最優(yōu)的的更快,時(shí)間更短,量化二者的相似性。本節(jié)會(huì)以經(jīng)典的 Needleman-列比對(duì)算法、Smith-Waterman 局部序列比對(duì)算法以及基于仿射空位-Waterman 算法作為研究對(duì)象,具體比較各種算法的差異性。 序列比對(duì)基本原理因序列比對(duì)就是在尋找序列之間的最優(yōu)匹配問(wèn)題,通過(guò)計(jì)算序列之,從而得到序列之間的生物屬性,這就是序列比對(duì)的目的。從參與比來(lái)劃分,序列比對(duì)可以分為雙序列和多序列比對(duì),其中雙序列比對(duì)又的基礎(chǔ),進(jìn)行比對(duì)的兩條序列,一條叫參考序列,另一條叫目的序列
【參考文獻(xiàn)】:
期刊論文
[1]計(jì)算生物學(xué)中的高性能計(jì)算(Ⅱ)—序列分析[J]. 王濤. 計(jì)算機(jī)工程與科學(xué). 2015(01)
[2]動(dòng)態(tài)規(guī)劃算法綜述[J]. 張瑩. 科技視界. 2014(28)
[3]基于FPGA的帶回溯的Smith-Waterman算法加速器的設(shè)計(jì)與實(shí)現(xiàn)[J]. 鄒丹,竇勇,夏飛,倪時(shí)策. 國(guó)防科技大學(xué)學(xué)報(bào). 2009(05)
[4]基因芯片與高通量DNA測(cè)序技術(shù)前景分析[J]. 滕曉坤,肖華勝. 中國(guó)科學(xué)(C輯:生命科學(xué)). 2008(10)
[5]生物信息學(xué):我們能做什么?[J]. 朱慶華,李亮. 情報(bào)理論與實(shí)踐. 2006(04)
[6]生物序列分析中的若干數(shù)學(xué)方法[J]. 謝惠民. 高校應(yīng)用數(shù)學(xué)學(xué)報(bào)A輯(中文版). 2005(04)
[7]一種面向生物信息學(xué)的可重構(gòu)加速卡的設(shè)計(jì)與實(shí)現(xiàn)[J]. 張佩珩,劉新春,江先陽(yáng). 計(jì)算機(jī)研究與發(fā)展. 2005(06)
[8]Smith-Waterman算法在脈動(dòng)陣列上的實(shí)現(xiàn)及分析[J]. 汪冬,唐志敏. 計(jì)算機(jī)學(xué)報(bào). 2004(01)
博士論文
[1]大規(guī)模生物序列分析的高性能算法和模型[D]. 楊矯云.中國(guó)科學(xué)技術(shù)大學(xué) 2014
[2]基于多核CPU和GPU的生物序列分析并行算法研究[D]. 趙志恒.國(guó)防科學(xué)技術(shù)大學(xué) 2013
[3]生物序列分析算法硬件加速器關(guān)鍵技術(shù)研究[D]. 夏飛.國(guó)防科學(xué)技術(shù)大學(xué) 2011
碩士論文
[1]Smith-Waterman算法硬件加速的研究與實(shí)現(xiàn)[D]. 陳觀君.電子科技大學(xué) 2017
[2]基于AXI總線的SoC架構(gòu)設(shè)計(jì)與分析[D]. 胡景華.上海交通大學(xué) 2013
[3]基于AMBA2.0的SoC總線平臺(tái)的設(shè)計(jì)[D]. 陸小艷.西安電子科技大學(xué) 2012
[4]基于AMBA總線的通用存控設(shè)計(jì)與實(shí)現(xiàn)[D]. 孫志剛.國(guó)防科學(xué)技術(shù)大學(xué) 2011
[5]面向生物序列分析的算法加速器關(guān)鍵技術(shù)研究[D]. 張陽(yáng).國(guó)防科學(xué)技術(shù)大學(xué) 2008
[6]嵌入式系統(tǒng)軟硬件劃分方法的研究[D]. 杜敏.哈爾濱理工大學(xué) 2008
[7]生物序列模式發(fā)現(xiàn)算法的研究[D]. 趙麗華.西安電子科技大學(xué) 2007
[8]關(guān)于多序列比對(duì)和系統(tǒng)發(fā)育分析中的序列空位研究[D]. 史衛(wèi)峰.中國(guó)農(nóng)業(yè)大學(xué) 2005
本文編號(hào):3492282
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-1個(gè)人全基因組測(cè)序成本發(fā)展趨勢(shì)
圖 2-1 堿基替換類型圖2)第二種是堿基插入,堿基插入就是在 DNA 基因序列當(dāng)中的某個(gè)位置插個(gè)或數(shù)個(gè)新的堿基,導(dǎo)致原來(lái)的序列長(zhǎng)度變長(zhǎng)產(chǎn)生影響,比如 AAGGTTACTT AAGGATTAACTT。3)第三種是堿基刪除,堿基刪除就是在 DNA 基因序列當(dāng)中的某個(gè)位置丟個(gè)或數(shù)個(gè)新的堿基,導(dǎo)致原來(lái)的序列長(zhǎng)度變短產(chǎn)生影響,比如 AAGGTTACTT AGGTTACT。如圖 2-2 所示,其為雙序列比對(duì)時(shí)堿基因子產(chǎn)生的替換、插入及刪除的示意圖匹配 轉(zhuǎn)換 顛換 顛換轉(zhuǎn)換顛換顛換AGCT匹配匹配匹配顛換顛換顛換顛換轉(zhuǎn)換轉(zhuǎn)換
圖 2-3 基因序列增長(zhǎng)擬合圖列比對(duì)列比對(duì),它所解決針對(duì)的問(wèn)題就是來(lái)判斷兩個(gè) DNA 或蛋白的序列的、它們?cè)谘莼鲜欠窨赡芡、我們能是否用一個(gè)蛋白的功能來(lái)預(yù)測(cè),將這個(gè)問(wèn)題歸結(jié)到計(jì)算上,就是:找到兩個(gè)序列的最優(yōu)或近似最優(yōu)的的更快,時(shí)間更短,量化二者的相似性。本節(jié)會(huì)以經(jīng)典的 Needleman-列比對(duì)算法、Smith-Waterman 局部序列比對(duì)算法以及基于仿射空位-Waterman 算法作為研究對(duì)象,具體比較各種算法的差異性。 序列比對(duì)基本原理因序列比對(duì)就是在尋找序列之間的最優(yōu)匹配問(wèn)題,通過(guò)計(jì)算序列之,從而得到序列之間的生物屬性,這就是序列比對(duì)的目的。從參與比來(lái)劃分,序列比對(duì)可以分為雙序列和多序列比對(duì),其中雙序列比對(duì)又的基礎(chǔ),進(jìn)行比對(duì)的兩條序列,一條叫參考序列,另一條叫目的序列
【參考文獻(xiàn)】:
期刊論文
[1]計(jì)算生物學(xué)中的高性能計(jì)算(Ⅱ)—序列分析[J]. 王濤. 計(jì)算機(jī)工程與科學(xué). 2015(01)
[2]動(dòng)態(tài)規(guī)劃算法綜述[J]. 張瑩. 科技視界. 2014(28)
[3]基于FPGA的帶回溯的Smith-Waterman算法加速器的設(shè)計(jì)與實(shí)現(xiàn)[J]. 鄒丹,竇勇,夏飛,倪時(shí)策. 國(guó)防科技大學(xué)學(xué)報(bào). 2009(05)
[4]基因芯片與高通量DNA測(cè)序技術(shù)前景分析[J]. 滕曉坤,肖華勝. 中國(guó)科學(xué)(C輯:生命科學(xué)). 2008(10)
[5]生物信息學(xué):我們能做什么?[J]. 朱慶華,李亮. 情報(bào)理論與實(shí)踐. 2006(04)
[6]生物序列分析中的若干數(shù)學(xué)方法[J]. 謝惠民. 高校應(yīng)用數(shù)學(xué)學(xué)報(bào)A輯(中文版). 2005(04)
[7]一種面向生物信息學(xué)的可重構(gòu)加速卡的設(shè)計(jì)與實(shí)現(xiàn)[J]. 張佩珩,劉新春,江先陽(yáng). 計(jì)算機(jī)研究與發(fā)展. 2005(06)
[8]Smith-Waterman算法在脈動(dòng)陣列上的實(shí)現(xiàn)及分析[J]. 汪冬,唐志敏. 計(jì)算機(jī)學(xué)報(bào). 2004(01)
博士論文
[1]大規(guī)模生物序列分析的高性能算法和模型[D]. 楊矯云.中國(guó)科學(xué)技術(shù)大學(xué) 2014
[2]基于多核CPU和GPU的生物序列分析并行算法研究[D]. 趙志恒.國(guó)防科學(xué)技術(shù)大學(xué) 2013
[3]生物序列分析算法硬件加速器關(guān)鍵技術(shù)研究[D]. 夏飛.國(guó)防科學(xué)技術(shù)大學(xué) 2011
碩士論文
[1]Smith-Waterman算法硬件加速的研究與實(shí)現(xiàn)[D]. 陳觀君.電子科技大學(xué) 2017
[2]基于AXI總線的SoC架構(gòu)設(shè)計(jì)與分析[D]. 胡景華.上海交通大學(xué) 2013
[3]基于AMBA2.0的SoC總線平臺(tái)的設(shè)計(jì)[D]. 陸小艷.西安電子科技大學(xué) 2012
[4]基于AMBA總線的通用存控設(shè)計(jì)與實(shí)現(xiàn)[D]. 孫志剛.國(guó)防科學(xué)技術(shù)大學(xué) 2011
[5]面向生物序列分析的算法加速器關(guān)鍵技術(shù)研究[D]. 張陽(yáng).國(guó)防科學(xué)技術(shù)大學(xué) 2008
[6]嵌入式系統(tǒng)軟硬件劃分方法的研究[D]. 杜敏.哈爾濱理工大學(xué) 2008
[7]生物序列模式發(fā)現(xiàn)算法的研究[D]. 趙麗華.西安電子科技大學(xué) 2007
[8]關(guān)于多序列比對(duì)和系統(tǒng)發(fā)育分析中的序列空位研究[D]. 史衛(wèi)峰.中國(guó)農(nóng)業(yè)大學(xué) 2005
本文編號(hào):3492282
本文鏈接:http://sikaile.net/projectlw/swxlw/3492282.html
最近更新
教材專著