并行計(jì)算在生物信息學(xué)中的運(yùn)用和實(shí)現(xiàn)
發(fā)布時間:2022-01-27 14:12
生物信息學(xué)是多門學(xué)科相互交叉而形成的一門新興學(xué)科,是當(dāng)今生命科學(xué)和自然科學(xué)的核心領(lǐng)域和最具活力的前沿領(lǐng)域之一。使用計(jì)算機(jī)系統(tǒng)進(jìn)行科學(xué)計(jì)算和模擬已經(jīng)成為現(xiàn)代生物研究最重要的方法之一。在生物信息學(xué)中,DNA序列的比對、拼接和基因表達(dá)數(shù)據(jù)的聚類分析是最常見也是重要的內(nèi)容,它們數(shù)據(jù)量多、計(jì)算量大,對計(jì)算機(jī)的處理速度等性能要求較高。雖然高性能并行計(jì)算機(jī)能夠滿足大規(guī)模計(jì)算的需要,但其價(jià)格昂貴,使用成本高。本文提出使用PC機(jī)構(gòu)建局域網(wǎng)絡(luò),開發(fā)并使用并行化的生物信息學(xué)軟件。本文提出了一種可擴(kuò)展的架構(gòu)模式BioMpi。在深入分析現(xiàn)有的phrap軟件的前提下,針對并行計(jì)算環(huán)境,提出一種新的并行算法并實(shí)現(xiàn)了基于BioMpi架構(gòu)下的并行拼接軟件mpiphrap。本文還針對mpiblast和HMMER這2款并行化的軟件,給出了并行化接口并移植于BioMpi架構(gòu)下。最后,分別針對基于BioMpi架構(gòu)下mpiphrap、mpiblast和HMMER這3款軟件進(jìn)行了測試,并給出了在單節(jié)點(diǎn)和多節(jié)點(diǎn)運(yùn)行環(huán)境的情況下的測試結(jié)果。試驗(yàn)數(shù)據(jù)...
【文章來源】:南京林業(yè)大學(xué)江蘇省
【文章頁數(shù)】:50 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
第一章 緒論
1.1 課題背景
1.2 國內(nèi)外生物并行軟件的研究現(xiàn)狀
1.2.1 并行計(jì)算的研究進(jìn)展
1.2.2 phrap 研究進(jìn)展
1.2.3 BLAST 研究進(jìn)展
1.2.4 HMMER 的研究進(jìn)展
1.3 本課題的研究意義和主要內(nèi)容
1.3.1 本課題的研究意義
1.3.2 本課題的主要研究工作
第二章 并行軟件架構(gòu)體系Bio_Mpi 的開發(fā)
2.1 開發(fā)語言介紹
2.1.1 MPI 簡介
2.1.2 通信域
2.1.3 MPI 調(diào)用接口
2.1.4 MPI 并行編程模式
2.1.5 MPI 通信模式
2.2 模型設(shè)計(jì)
2.3 Bio_Mpi 架構(gòu)圖
2.4 Bio_Mpi 的開發(fā)
2.4.1 主節(jié)點(diǎn)的初始化串行處理過程
2.4.2 各節(jié)點(diǎn)的并行處理過程
2.4.3 主節(jié)點(diǎn)匯總處理過程
2.5 mpiphrap 的開發(fā)
2.5.1 mpiphrap 的并行思想
2.5.2 mpiphrap 的并行算法
第三章 并行軟件架構(gòu)體系Bio_Mpi 的測試
3.1 Bio_Mpi 的測試環(huán)境
3.2 mpiphrap 的測試
3.2.1 楊樹的mpiphrap 測試
3.2.2 芝麻的mpiphrap 測試
3.3 mpiblast 的測試
3.3.1 測試使用的軟件版本
3.3.2 Swiss_Prot 數(shù)據(jù)庫的測試
3.3.3 env_nr 數(shù)據(jù)庫的測試
3.4 HMMER 的測試
3.4.1 hmmbuild 的測試
3.4.2 hmmsearch 的測試
第四章 結(jié)束語
參考文獻(xiàn)
附錄A Fedora 操作系統(tǒng)中的設(shè)置
1 Fedora 的準(zhǔn)備工作
2 創(chuàng)建NFS 服務(wù)
2.1 服務(wù)器的設(shè)置
2.2 客戶機(jī)的設(shè)置
3 創(chuàng)建SSH 信任連接
4 安裝MPICH2
5 環(huán)境測試
6 編寫程序并運(yùn)行
7 卸載環(huán)境
附錄B 安裝mpiblast
1 下載和解壓
2 安裝ncbi
3 安裝mpiblast
4 mpiblast 環(huán)境設(shè)置
附錄C 安裝HMMER3
1 安裝hmmer
詳細(xì)摘要
【參考文獻(xiàn)】:
期刊論文
[1]基于HMM的基因識別并行計(jì)算[J]. 王棟,李靖,武華北,宋婷. 計(jì)算機(jī)與信息技術(shù). 2007(10)
[2]基于HMM的基因識別并行計(jì)算[J]. 王棟,李靖,武華北,宋婷. 計(jì)算機(jī)與信息技術(shù). 2007 (10)
[3]基于曙光4000A的BLAST并行算法[J]. 譚光明,徐琳,周幼英,馮圣中,孫凝暉. 計(jì)算機(jī)工程. 2006(10)
[4]基于SSE2的Smith-Waterman算法[J]. 戴正華,張慶丹,徐琳,譚光明,馮圣中. 計(jì)算機(jī)工程與應(yīng)用. 2006(11)
[5]一種SMP機(jī)群下程序并行化模式的設(shè)計(jì)與應(yīng)用[J]. 劉瑋. 微電子學(xué)與計(jì)算機(jī). 2005(11)
[6]基于隱馬爾可夫模型的多重序列分析[J]. 羅澤舉,朱思銘,何淼. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(02)
[7]Linux環(huán)境下MPI并行編程與算法實(shí)現(xiàn)研究[J]. 曾志峰. 航空計(jì)算技術(shù). 2004(02)
[8]基因序列分析軟件Hmmpfam的可擴(kuò)展并行性能優(yōu)化[J]. 陳軍,趙文輝,莫則堯,李曉梅. 軟件學(xué)報(bào). 2004(02)
[9]序列拼裝程序的并行化研究與實(shí)現(xiàn)[J]. 蔡立志,童維勤,廖文昭. 計(jì)算機(jī)工程與應(yīng)用. 2003(14)
[10]隱馬爾可夫模型用于蛋白質(zhì)序列分析[J]. 吳曉明,宋長新,王波,程敬之. 生物醫(yī)學(xué)工程學(xué)雜志. 2002(03)
本文編號:3612627
【文章來源】:南京林業(yè)大學(xué)江蘇省
【文章頁數(shù)】:50 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
第一章 緒論
1.1 課題背景
1.2 國內(nèi)外生物并行軟件的研究現(xiàn)狀
1.2.1 并行計(jì)算的研究進(jìn)展
1.2.2 phrap 研究進(jìn)展
1.2.3 BLAST 研究進(jìn)展
1.2.4 HMMER 的研究進(jìn)展
1.3 本課題的研究意義和主要內(nèi)容
1.3.1 本課題的研究意義
1.3.2 本課題的主要研究工作
第二章 并行軟件架構(gòu)體系Bio_Mpi 的開發(fā)
2.1 開發(fā)語言介紹
2.1.1 MPI 簡介
2.1.2 通信域
2.1.3 MPI 調(diào)用接口
2.1.4 MPI 并行編程模式
2.1.5 MPI 通信模式
2.2 模型設(shè)計(jì)
2.3 Bio_Mpi 架構(gòu)圖
2.4 Bio_Mpi 的開發(fā)
2.4.1 主節(jié)點(diǎn)的初始化串行處理過程
2.4.2 各節(jié)點(diǎn)的并行處理過程
2.4.3 主節(jié)點(diǎn)匯總處理過程
2.5 mpiphrap 的開發(fā)
2.5.1 mpiphrap 的并行思想
2.5.2 mpiphrap 的并行算法
第三章 并行軟件架構(gòu)體系Bio_Mpi 的測試
3.1 Bio_Mpi 的測試環(huán)境
3.2 mpiphrap 的測試
3.2.1 楊樹的mpiphrap 測試
3.2.2 芝麻的mpiphrap 測試
3.3 mpiblast 的測試
3.3.1 測試使用的軟件版本
3.3.2 Swiss_Prot 數(shù)據(jù)庫的測試
3.3.3 env_nr 數(shù)據(jù)庫的測試
3.4 HMMER 的測試
3.4.1 hmmbuild 的測試
3.4.2 hmmsearch 的測試
第四章 結(jié)束語
參考文獻(xiàn)
附錄A Fedora 操作系統(tǒng)中的設(shè)置
1 Fedora 的準(zhǔn)備工作
2 創(chuàng)建NFS 服務(wù)
2.1 服務(wù)器的設(shè)置
2.2 客戶機(jī)的設(shè)置
3 創(chuàng)建SSH 信任連接
4 安裝MPICH2
5 環(huán)境測試
6 編寫程序并運(yùn)行
7 卸載環(huán)境
附錄B 安裝mpiblast
1 下載和解壓
2 安裝ncbi
3 安裝mpiblast
4 mpiblast 環(huán)境設(shè)置
附錄C 安裝HMMER3
1 安裝hmmer
詳細(xì)摘要
【參考文獻(xiàn)】:
期刊論文
[1]基于HMM的基因識別并行計(jì)算[J]. 王棟,李靖,武華北,宋婷. 計(jì)算機(jī)與信息技術(shù). 2007(10)
[2]基于HMM的基因識別并行計(jì)算[J]. 王棟,李靖,武華北,宋婷. 計(jì)算機(jī)與信息技術(shù). 2007 (10)
[3]基于曙光4000A的BLAST并行算法[J]. 譚光明,徐琳,周幼英,馮圣中,孫凝暉. 計(jì)算機(jī)工程. 2006(10)
[4]基于SSE2的Smith-Waterman算法[J]. 戴正華,張慶丹,徐琳,譚光明,馮圣中. 計(jì)算機(jī)工程與應(yīng)用. 2006(11)
[5]一種SMP機(jī)群下程序并行化模式的設(shè)計(jì)與應(yīng)用[J]. 劉瑋. 微電子學(xué)與計(jì)算機(jī). 2005(11)
[6]基于隱馬爾可夫模型的多重序列分析[J]. 羅澤舉,朱思銘,何淼. 中山大學(xué)學(xué)報(bào)(自然科學(xué)版). 2005(02)
[7]Linux環(huán)境下MPI并行編程與算法實(shí)現(xiàn)研究[J]. 曾志峰. 航空計(jì)算技術(shù). 2004(02)
[8]基因序列分析軟件Hmmpfam的可擴(kuò)展并行性能優(yōu)化[J]. 陳軍,趙文輝,莫則堯,李曉梅. 軟件學(xué)報(bào). 2004(02)
[9]序列拼裝程序的并行化研究與實(shí)現(xiàn)[J]. 蔡立志,童維勤,廖文昭. 計(jì)算機(jī)工程與應(yīng)用. 2003(14)
[10]隱馬爾可夫模型用于蛋白質(zhì)序列分析[J]. 吳曉明,宋長新,王波,程敬之. 生物醫(yī)學(xué)工程學(xué)雜志. 2002(03)
本文編號:3612627
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3612627.html
最近更新
教材專著