ChIP-Seq中DNA模體挖掘工具的比較
本文關(guān)鍵詞:ChIP-Seq中DNA模體挖掘工具的比較,,由筆耕文化傳播整理發(fā)布。
【摘要】:下一代測序技術(shù),尤其是Ch IP-Seq技術(shù)的普及,產(chǎn)生了一系列大數(shù)據(jù)量、高復(fù)雜度的數(shù)據(jù)。而DNA模體的挖掘,是Ch IP-Seq數(shù)據(jù)功能分析的一個很重要的模塊。目前,已有大量的軟件能夠從Peak-Calling的數(shù)據(jù)中尋找出模體。但是我們對于這些軟件的信息所知甚少。直至目前為止還沒有專注于轉(zhuǎn)錄因子的Ch IP-Seq數(shù)據(jù)的軟件比較。因此本文挑選了6款軟件MEME、DREME、CHIPMUNK、RSAT-peak motif、HOMER和SIOMICS。使用了4個物種Mus musculus、Homo sapiens、Drosophila melanogaster、Saccharomyces cerevisiae的37套真實數(shù)據(jù)對這六款軟件進(jìn)行了運(yùn)行時間、模體數(shù)目、模體長度分布的測試;4個物種Homo sapiens、Mus musculus、Drosophila melanogaster、Caenorhabditis Elegans的模擬數(shù)據(jù)對軟件的準(zhǔn)確度進(jìn)行測試。通過本文的測試,我們發(fā)現(xiàn)這幾款軟件在Saccharomyces cerevisiae的數(shù)據(jù)中表現(xiàn)均比較好,準(zhǔn)確度均大于30%,其中最高的為MEME,達(dá)到了66.7%。而在Homo sapiens、Mus musculus、Drosophila melanogaster這三個物種的數(shù)據(jù)中,HOMER相較于其它軟件有較高的準(zhǔn)確度,大約在30%左右。同時我們認(rèn)為軟件結(jié)果之間的相互覆蓋度并不能成為取代準(zhǔn)確度的判定指標(biāo)。
【關(guān)鍵詞】:下一代測序 ChIP-Seq 轉(zhuǎn)錄因子結(jié)合位點(diǎn) 模體
【學(xué)位授予單位】:蘇州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:Q811.4;TP311.13
【目錄】:
- 中文摘要4-5
- Abstract5-7
- 第一章 前言7-12
- 1.1 基因序列測序技術(shù)的發(fā)展7-8
- 1.2 ChIP-chip與ChIP-Seq技術(shù)的發(fā)展和比較8-10
- 1.3 本課題研究的目的以及意義10
- 1.4 本文的研究內(nèi)容10-12
- 第二章 國內(nèi)DNA模體數(shù)據(jù)庫及基于ChIP-Seq數(shù)據(jù)挖掘工具的發(fā)展現(xiàn)狀12-18
- 2.1 綜合性軟件:MEMESUIT、RSAT peak-模體、HOMER12-13
- 2.2 單一性性軟件:ChIPMunk、SIOMICS13
- 2.3 DNA模體數(shù)據(jù)庫的廣泛度的匯總13-18
- 第三章DNA模體挖掘軟件比較18-22
- 3.1 特征比較18-20
- 3.2 算法比較20-22
- 第四章 數(shù)據(jù)處理流程22-38
- 4.1 虛擬數(shù)據(jù)收集及設(shè)計22-24
- 4.2 虛擬數(shù)據(jù)預(yù)處理24-28
- 4.3 實際數(shù)據(jù)收集28-32
- 4.4 實際數(shù)據(jù)集預(yù)處理32-33
- 4.5 模體挖掘數(shù)據(jù)處理33-38
- 第五章 結(jié)論及展望38-46
- 5.1 軟件運(yùn)行時間統(tǒng)計38-40
- 5.2 挖掘出的模體特征統(tǒng)計40-42
- 5.3 軟件準(zhǔn)確度和靈敏度測評42-46
- 參考文獻(xiàn)46-49
- 附錄一49-53
- 附錄二53-62
- 附錄三62-75
- 攻讀碩士學(xué)位期間公開發(fā)表的論文75-76
- 致謝76-77
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王春連;胡秀珍;;用二次判別方法識別蛋白質(zhì)β-發(fā)夾模體[J];生物物理學(xué)報;2009年04期
2 李慧敏;胡俊;張靜;;果蠅核糖體蛋白基因中潛在轉(zhuǎn)錄協(xié)同作用模體的統(tǒng)計分析[J];云南大學(xué)學(xué)報(自然科學(xué)版);2010年03期
3 胡秀珍;李前忠;;矩陣打分的方法應(yīng)用于蛋白質(zhì)β-發(fā)夾模體的識別[J];內(nèi)蒙古大學(xué)學(xué)報(自然科學(xué)版);2007年06期
4 姜雪;胡秀珍;;打分矩陣方法在β-發(fā)夾模體識別中的應(yīng)用[J];生物信息學(xué);2008年04期
5 岳俊杰;譚明峰;周圍;王夏;李北平;王月蘭;梁龍;;細(xì)菌黏附素序列模體分析[J];生物技術(shù)通訊;2008年05期
6 姜雪;;蛋白質(zhì)βαβ模體序列的統(tǒng)計分析及其識別[J];昆明理工大學(xué)學(xué)報(理工版);2010年05期
7 賈少春;胡秀珍;;基于添加功能位點(diǎn)信息的組合向量預(yù)測β-發(fā)夾模體[J];內(nèi)蒙古工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2012年03期
8 陳丹;梁振霞;李慧敏;;組合調(diào)控中過表達(dá)模體對距離的統(tǒng)計檢驗[J];基因組學(xué)與應(yīng)用生物學(xué);2013年01期
9 宋航宇;胡秀珍;馮振興;姜卓;孫利霞;;基于統(tǒng)計特征的酶蛋白質(zhì)中特殊模體βαβ的預(yù)測[J];生物物理學(xué)報;2013年09期
10 葉玉珍,解濤,丁達(dá)夫;蛋白質(zhì)功能基團(tuán)三維模體及其應(yīng)用[J];科學(xué)通報;2000年12期
中國重要會議論文全文數(shù)據(jù)庫 前4條
1 李彩艷;胡秀珍;;蛋白質(zhì)中兩種Strand-Loop-Strand模體的判斷[A];第十次中國生物物理學(xué)術(shù)大會論文摘要集[C];2006年
2 高燕莉;張鐳;李劍穎;;應(yīng)用64排CT優(yōu)化高分辨CT掃描方案的模體研究[A];中華醫(yī)學(xué)會第十三屆全國放射學(xué)大會論文匯編(下冊)[C];2006年
3 李興東;萬國慶;田中青;;X射線CT檢測標(biāo)準(zhǔn)的研究[A];加入WTO和中國科技與可持續(xù)發(fā)展——挑戰(zhàn)與機(jī)遇、責(zé)任和對策(下冊)[C];2002年
4 安晶剛;;PET質(zhì)量檢測的方法及相應(yīng)模體[A];全國醫(yī)用輻射防護(hù)與安全學(xué)術(shù)研討會論文匯編[C];2004年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前7條
1 劉丙強(qiáng);原核生物中的轉(zhuǎn)錄調(diào)控模體預(yù)測研究[D];山東大學(xué);2010年
2 劉倩;基于貝葉斯統(tǒng)計的基因非編碼區(qū)與模體識別問題研究[D];西安電子科技大學(xué);2014年
3 周川;原核生物調(diào)控模體和調(diào)節(jié)子預(yù)測算法研究[D];山東大學(xué);2014年
4 周鵬;生物非鍵模體[D];浙江大學(xué);2011年
5 張凌慧;基因組中順式調(diào)控模體的特征分析與計算預(yù)測[D];中國協(xié)和醫(yī)科大學(xué);2005年
6 劉立芳;生物信息學(xué)中的多序列比對與模體識別問題研究[D];西安電子科技大學(xué);2006年
7 張懿璞;轉(zhuǎn)錄因子結(jié)合位點(diǎn)識別問題的算法研究[D];西安電子科技大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 周燕;SRK-ARC1識別模體序列多態(tài)性與甘藍(lán)親和指數(shù)的相關(guān)性研究[D];西南大學(xué);2015年
2 馬平;基因組序列8-mer模體使用分離與不同序列組成和物種進(jìn)化的關(guān)系[D];內(nèi)蒙古大學(xué);2015年
3 劉國君;酵母基因組8-mer模體使用的進(jìn)化分離與功能分析[D];內(nèi)蒙古大學(xué);2015年
4 王晶;ChIP-Seq中DNA模體挖掘工具的比較[D];蘇州大學(xué);2015年
5 趙振華;模體發(fā)現(xiàn)問題的若干算法及應(yīng)用研究[D];西安電子科技大學(xué);2009年
6 萬春娟;基于聚類和團(tuán)求精的模體識別算法[D];西安電子科技大學(xué);2012年
7 孫玲;基于約束的方法查找細(xì)胞周期網(wǎng)絡(luò)的骨干模體[D];西安電子科技大學(xué);2011年
8 張瀚元;基因轉(zhuǎn)錄調(diào)控模體預(yù)測的研究及其在線服務(wù)開發(fā)[D];吉林大學(xué);2015年
9 侯青敏;基于子圖密度的序列模體發(fā)現(xiàn)算法研究[D];西安電子科技大學(xué);2009年
10 詹海萍;弱信號模體檢測的圖搜索算法[D];西安電子科技大學(xué);2010年
本文關(guān)鍵詞:ChIP-Seq中DNA模體挖掘工具的比較,由筆耕文化傳播整理發(fā)布。
本文編號:370844
本文鏈接:http://sikaile.net/yixuelunwen/swyx/370844.html