基于GPU的大豆基因數(shù)據(jù)分析方法的研究
本文關鍵詞:基于GPU的大豆基因數(shù)據(jù)分析方法的研究
更多相關文章: GPU并行 大豆啟動子 調(diào)控元件識別 基因關聯(lián)分析
【摘要】:隨著生物領域高通量測序技術的出現(xiàn),海量生物數(shù)據(jù)不斷涌現(xiàn),但是不完美的算法以及數(shù)據(jù)量的制約使得生物信息處理效率依然不高,因此,優(yōu)化算法以及采用并行手段進一步提升數(shù)據(jù)處理效率顯得十分必要。本文以大豆基因數(shù)據(jù)作為研究對象,對大豆基因編碼區(qū)和非編碼區(qū)的數(shù)據(jù)處理方法進行了優(yōu)化和并行處理。主要的工作內(nèi)容包括:首先,本文對大豆基因非編碼區(qū)的啟動子數(shù)據(jù)處理過程進行研究,對其中涉及的調(diào)控元件定位算法進行了優(yōu)化,針對算法中存在冗余匹配問題,提出了基于反向匹配的調(diào)控元件定位算法,并對啟動子數(shù)據(jù)中存在代表重復序列的連續(xù)字符N進行了特殊處理,采用跳躍式處理方法進行優(yōu)化。其次,在對串行算法優(yōu)化的基礎上,本文采用GPU并行技術對大豆啟動子數(shù)據(jù)處理過程進行多種并行方式的實現(xiàn)。單GPU并行方面,討論了并行線程設置原則,實現(xiàn)了一級并行和兩級并行。在多GPU并行方面,規(guī)劃各GPU任務安排,實現(xiàn)了多GPU并行,并從訪存方面進行了優(yōu)化。最終,經(jīng)過優(yōu)化、并行處理后的大豆啟動子數(shù)據(jù)處理效率提高了兩個數(shù)量級。第三,本文對編碼區(qū)的基因表達數(shù)據(jù)生成關聯(lián)規(guī)則過程進行并行研究,分析了基因表達數(shù)據(jù)的特點,提出二進制位組合方式的非遞歸生成關聯(lián)規(guī)則算法,并進行了GPU并行,新算法突破了遞歸算法GPU并行時的局限。最后對實驗結果進行了分析,指出了算法的優(yōu)勢和存在的問題。
【關鍵詞】:GPU并行 大豆啟動子 調(diào)控元件識別 基因關聯(lián)分析
【學位授予單位】:黑龍江大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:Q943.2;TP338.6
【目錄】:
- 中文摘要4-5
- Abstract5-9
- 第1章 緒論9-15
- 1.1 課題研究背景、目的和意義9-10
- 1.2 國內(nèi)外同類課題研究現(xiàn)狀及發(fā)展趨勢10-13
- 1.3 本文主要研究內(nèi)容13-14
- 1.4 本章小結14-15
- 第2章 生物數(shù)據(jù)分析相關理論和技術15-26
- 2.1 相關理論15-19
- 2.1.1 調(diào)控元件識別16-18
- 2.1.2 頻繁項集挖掘18-19
- 2.1.3 基因功能注釋19
- 2.1.4 基因關聯(lián)分析19
- 2.2 并行技術19-25
- 2.2.1 GPU并行技術20-23
- 2.2.2 Open MP并行技技術23-25
- 2.3 本章小結25-26
- 第3章 基因調(diào)控元件定位算法優(yōu)化26-38
- 3.1 問題描述26-28
- 3.2 算法的優(yōu)化28-32
- 3.2.1 基于反向匹配的優(yōu)化算法28-30
- 3.2.2 特殊數(shù)據(jù)形式的處理30-32
- 3.3 實驗結果與分析32-37
- 3.3.1 有效數(shù)據(jù)的獲取32-33
- 3.3.2 實驗環(huán)境33-34
- 3.3.3 優(yōu)化算法與原算法效率比較34-37
- 3.4 本章小結37-38
- 第4章 基于GPU的大豆啟動子數(shù)據(jù)處理算法38-59
- 4.1 啟動子數(shù)據(jù)處理過程38-43
- 4.2 單GPU并行算法43-52
- 4.2.1 一級并行算法的設計與實現(xiàn)44-47
- 4.2.2 兩級并行算法的設計與實現(xiàn)47-49
- 4.2.3 實驗結果與分析49-52
- 4.3 多GPU并行算法52-58
- 4.3.1 多GPU并行算法的設計與實現(xiàn)52-54
- 4.3.2 并行算法的優(yōu)化54-55
- 4.3.3 實驗結果與分析55-58
- 4.4 本章小結58-59
- 第5章 基因表達數(shù)據(jù)的GPU關聯(lián)規(guī)則生成算法59-76
- 5.1 基因表達數(shù)據(jù)處理過程59-64
- 5.1.1 主要算法描述60-63
- 5.1.2 有效數(shù)據(jù)的獲取63-64
- 5.2 基于GPU的關聯(lián)規(guī)則生成遞歸算法64-67
- 5.2.1 并行算法的實現(xiàn)64-66
- 5.2.2 實驗結果與分析66-67
- 5.3 基于GPU的非遞歸關聯(lián)規(guī)則生成算法67-74
- 5.3.1 非遞歸關聯(lián)規(guī)則生成算法67-70
- 5.3.2 并行算法的實現(xiàn)70-72
- 5.3.3 實驗結果與分析72-74
- 5.4 本章小結74-76
- 結論76-78
- 參考文獻78-82
- 致謝82-83
- 攻讀學位期間發(fā)表的學術論文及申請的專利83
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前6條
1 ;31個大豆基因組重測序揭示遺傳多樣性和進化選擇模式[J];科學觀察;2011年01期
2 Paul Christou;孫雷心;;大豆基因工程——轉基因植物的商業(yè)化生產(chǎn)[J];生物技術通報;1991年09期
3 ;ISAAA信息[J];中國生物工程雜志;2010年01期
4 竇新田,李曉鳴,李新民,周繼松,李樹藩,周俊初,沈輝,張忠明,胡志浩,彭文濤,胡福榮,陳華癸;大豆基因工程根瘤菌田間結瘤和共生固氮效應[J];生物技術;1991年03期
5 何德功;可以治療缺鐵的米[J];世界發(fā)明;2003年12期
6 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 劉建中;;利用病毒誘導的基因沉默技術解析大豆基因功能[A];從植物科學到農(nóng)業(yè)發(fā)展——2012全國植物生物學大會論文集[C];2012年
中國碩士學位論文全文數(shù)據(jù)庫 前3條
1 蔡宇鵬;CRISPR/Cas9介導的大豆基因組定點編輯研究[D];中國農(nóng)業(yè)科學院;2016年
2 鄭金亮;基于GPU的大豆基因數(shù)據(jù)分析方法的研究[D];黑龍江大學;2016年
3 劉曉彬;TRV介導的大豆基因瞬時沉默體系建立及其在大豆基因功能分析中的應用[D];河北農(nóng)業(yè)大學;2015年
,本文編號:986430
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/986430.html