基于DNase高通測(cè)序信息的DNA蛋白結(jié)合位點(diǎn)識(shí)別研究
發(fā)布時(shí)間:2021-04-17 11:42
自人類全基因組計(jì)劃以來,對(duì)轉(zhuǎn)錄因子以及其結(jié)合位點(diǎn)的研究成為人類探索生命本質(zhì)的重要課題。轉(zhuǎn)錄因子只有在與特定的結(jié)合位點(diǎn)結(jié)合之后才具有調(diào)控基因表達(dá)的功能。所以,準(zhǔn)確識(shí)別出轉(zhuǎn)錄因子結(jié)合位點(diǎn)的位置成為遺傳學(xué)的核心內(nèi)容之一。2010年,Crawford提出的DNase-seq技術(shù)可以實(shí)現(xiàn)單次實(shí)驗(yàn)即可檢測(cè)出全基因組范圍內(nèi)的蛋白結(jié)合位點(diǎn)。DNase-seq技術(shù)相比于目前廣泛使用的ChIP-seq技術(shù)、ATAC-seq,表現(xiàn)出了諸多的優(yōu)勢(shì),在提高檢測(cè)效率和檢測(cè)精度的同時(shí),大幅降低了檢測(cè)成本。在本課題研究中,首先在網(wǎng)站上獲取到DNase-seq數(shù)據(jù)以及轉(zhuǎn)錄因子的有關(guān)數(shù)據(jù)。然后,利用FIMO工具得到確切的轉(zhuǎn)錄因子結(jié)合位點(diǎn),提取整理每個(gè)結(jié)合位點(diǎn)的DNase-seq數(shù)據(jù)并構(gòu)建數(shù)據(jù)集。隨后,根據(jù)DNase-seq數(shù)據(jù)特點(diǎn)選擇并構(gòu)建了基于自動(dòng)編碼器神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)識(shí)別模型。接著,從轉(zhuǎn)錄因子結(jié)合位點(diǎn)的典型性和測(cè)序深度兩個(gè)方面對(duì)所構(gòu)建模型的識(shí)別結(jié)果進(jìn)行分析,從而確定使用該識(shí)別模型所需的條件。最后,考慮到數(shù)據(jù)集的大小存在著不平衡的因素,我們選用指標(biāo)靈敏度、特異性以及馬修相關(guān)系數(shù)等指標(biāo)來對(duì)所構(gòu)建模型的識(shí)別能力進(jìn)...
【文章來源】:哈爾濱工程大學(xué)黑龍江省 211工程院校
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
ChIP-seq技術(shù)流程圖
圖 2.1 ChIP-seq 技術(shù)流程圖目前,基于 ChIP-seq 技術(shù)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)的分析方法已相當(dāng)成熟到了廣泛應(yīng)用[39],并且也得到了很多專家學(xué)者的支持。本質(zhì)上講,該心是尋找富集區(qū)域—即與轉(zhuǎn)錄因子結(jié)合的 DNA 序列,受到一定的保護(hù)作異性抗體免疫共沉淀之后,會(huì)被富集。當(dāng)我們對(duì)大量的序列進(jìn)行疊加就個(gè)類似駝峰的區(qū)域,我們把該富集區(qū)域稱為“peak”區(qū)。如下圖 2.2 所
哈爾濱工程大學(xué)碩士學(xué)位論文定一種轉(zhuǎn)錄因子的結(jié)合位點(diǎn)序列。檢測(cè)效率低是 ChIP-seq 致命缺陷,直接導(dǎo)致了該技術(shù)浪費(fèi)時(shí)間與人力資源[41]。而 DNase-seq 的發(fā)明很好地彌補(bǔ)了 ChIP-se技術(shù)的缺陷,為轉(zhuǎn)錄因子結(jié)合位點(diǎn)的研究節(jié)省了大量成本的同時(shí)也獲得了更多的研究數(shù)據(jù)。2.3 ATAC-seq 技術(shù)ATAC-seq 技術(shù)是染色質(zhì)開放區(qū)域定位技術(shù)與高通量測(cè)序技術(shù)的結(jié)合。也可以用來研究轉(zhuǎn)錄因子結(jié)合位點(diǎn)。該方法測(cè)序流程簡(jiǎn)單,并且對(duì)細(xì)胞數(shù)量的要求較低,從 500 到 50000 個(gè)細(xì)胞均可完成測(cè)序。該方法的主要原理是利用活性 Tn轉(zhuǎn)座酶,體外與 DNA 測(cè)序接頭結(jié)合,然后將 Tn5 轉(zhuǎn)座酶作用于待測(cè)序列,由于轉(zhuǎn)座酶的“轉(zhuǎn)移”特性,會(huì)將攜帶的測(cè)序接頭插入到待測(cè)序列中,在染色質(zhì)的開放區(qū)域內(nèi),經(jīng)接頭的分割作用,待測(cè)序列即可被分割成 DNA 小片段,然后構(gòu)建文庫,PCR 擴(kuò)增,即可完成測(cè)序。ATAC-seq 技術(shù)流程圖如下圖 2.3 所示。
【參考文獻(xiàn)】:
期刊論文
[1]谷歌TensorFlow機(jī)器學(xué)習(xí)框架及應(yīng)用[J]. 章敏敏,徐和平,王曉潔,周夢(mèng)昀,洪淑月. 微型機(jī)與應(yīng)用. 2017(10)
[2]ENCODE計(jì)劃和功能基因組研究[J]. 丁楠,渠鴻竹,方向東. 遺傳. 2014(03)
[3]用ID-SVM預(yù)測(cè)蛋白質(zhì)的ATP結(jié)合位點(diǎn)[J]. 包文榮,趙巨東. 生物信息學(xué). 2013(03)
[4]植物MYB蛋白與其靶定DNA結(jié)合位點(diǎn)之間的相互作用[J]. 李曼,趙芊,劉方,李浩,宋水山. 生物學(xué)雜志. 2013(04)
[5]利用ChIP-seq技術(shù)研究轉(zhuǎn)錄因子EDAG在全基因組的結(jié)合譜[J]. 董小明,鄭巍薇,尹榮華,詹軼群,楊曉明,李長(zhǎng)燕. 中國(guó)生物化學(xué)與分子生物學(xué)報(bào). 2013(06)
[6]下一代測(cè)序中ChIP-seq數(shù)據(jù)的處理與分析[J]. 高山,張寧,李勃,徐碩,葉彥波,阮吉壽. 遺傳. 2012(06)
[7]高通量測(cè)序技術(shù)及其應(yīng)用[J]. 王興春,楊致榮,王敏,李瑋,李生才. 中國(guó)生物工程雜志. 2012(01)
[8]一種新的快速鑒定蛋白與靶DNA結(jié)合位點(diǎn)的方法[J]. 朱明,魏偉,陳明,張憲省,徐兆師,李連城,馬有志. 作物學(xué)報(bào). 2011(12)
[9]ChIP技術(shù)及其在基因組水平上分析DNA與蛋白質(zhì)相互作用[J]. 李敏俐,王薇,陸祖宏. 遺傳. 2010(03)
[10]基因芯片與高通量DNA測(cè)序技術(shù)前景分析[J]. 滕曉坤,肖華勝. 中國(guó)科學(xué)(C輯:生命科學(xué)). 2008(10)
博士論文
[1]基于機(jī)器學(xué)習(xí)的蛋白質(zhì)結(jié)合位點(diǎn)特征化和預(yù)測(cè)方法研究[D]. 熊毅.武漢大學(xué) 2011
[2]miRNA及轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)與調(diào)控功能分析[D]. 汪國(guó)華.哈爾濱工業(yè)大學(xué) 2009
[3]轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)算法的研究與應(yīng)用[D]. 徐東.上海大學(xué) 2005
碩士論文
[1]基于ChIP-seq數(shù)據(jù)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)識(shí)別算法[D]. 賈瑤麗.北京交通大學(xué) 2016
[2]分類器性能評(píng)價(jià)研究[D]. 武婷婷.北京交通大學(xué) 2010
[3]蛋白質(zhì)-DNA結(jié)構(gòu)模型比較及其在轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)中的應(yīng)用[D]. 陳凌.復(fù)旦大學(xué) 2010
本文編號(hào):3143393
【文章來源】:哈爾濱工程大學(xué)黑龍江省 211工程院校
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
ChIP-seq技術(shù)流程圖
圖 2.1 ChIP-seq 技術(shù)流程圖目前,基于 ChIP-seq 技術(shù)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)的分析方法已相當(dāng)成熟到了廣泛應(yīng)用[39],并且也得到了很多專家學(xué)者的支持。本質(zhì)上講,該心是尋找富集區(qū)域—即與轉(zhuǎn)錄因子結(jié)合的 DNA 序列,受到一定的保護(hù)作異性抗體免疫共沉淀之后,會(huì)被富集。當(dāng)我們對(duì)大量的序列進(jìn)行疊加就個(gè)類似駝峰的區(qū)域,我們把該富集區(qū)域稱為“peak”區(qū)。如下圖 2.2 所
哈爾濱工程大學(xué)碩士學(xué)位論文定一種轉(zhuǎn)錄因子的結(jié)合位點(diǎn)序列。檢測(cè)效率低是 ChIP-seq 致命缺陷,直接導(dǎo)致了該技術(shù)浪費(fèi)時(shí)間與人力資源[41]。而 DNase-seq 的發(fā)明很好地彌補(bǔ)了 ChIP-se技術(shù)的缺陷,為轉(zhuǎn)錄因子結(jié)合位點(diǎn)的研究節(jié)省了大量成本的同時(shí)也獲得了更多的研究數(shù)據(jù)。2.3 ATAC-seq 技術(shù)ATAC-seq 技術(shù)是染色質(zhì)開放區(qū)域定位技術(shù)與高通量測(cè)序技術(shù)的結(jié)合。也可以用來研究轉(zhuǎn)錄因子結(jié)合位點(diǎn)。該方法測(cè)序流程簡(jiǎn)單,并且對(duì)細(xì)胞數(shù)量的要求較低,從 500 到 50000 個(gè)細(xì)胞均可完成測(cè)序。該方法的主要原理是利用活性 Tn轉(zhuǎn)座酶,體外與 DNA 測(cè)序接頭結(jié)合,然后將 Tn5 轉(zhuǎn)座酶作用于待測(cè)序列,由于轉(zhuǎn)座酶的“轉(zhuǎn)移”特性,會(huì)將攜帶的測(cè)序接頭插入到待測(cè)序列中,在染色質(zhì)的開放區(qū)域內(nèi),經(jīng)接頭的分割作用,待測(cè)序列即可被分割成 DNA 小片段,然后構(gòu)建文庫,PCR 擴(kuò)增,即可完成測(cè)序。ATAC-seq 技術(shù)流程圖如下圖 2.3 所示。
【參考文獻(xiàn)】:
期刊論文
[1]谷歌TensorFlow機(jī)器學(xué)習(xí)框架及應(yīng)用[J]. 章敏敏,徐和平,王曉潔,周夢(mèng)昀,洪淑月. 微型機(jī)與應(yīng)用. 2017(10)
[2]ENCODE計(jì)劃和功能基因組研究[J]. 丁楠,渠鴻竹,方向東. 遺傳. 2014(03)
[3]用ID-SVM預(yù)測(cè)蛋白質(zhì)的ATP結(jié)合位點(diǎn)[J]. 包文榮,趙巨東. 生物信息學(xué). 2013(03)
[4]植物MYB蛋白與其靶定DNA結(jié)合位點(diǎn)之間的相互作用[J]. 李曼,趙芊,劉方,李浩,宋水山. 生物學(xué)雜志. 2013(04)
[5]利用ChIP-seq技術(shù)研究轉(zhuǎn)錄因子EDAG在全基因組的結(jié)合譜[J]. 董小明,鄭巍薇,尹榮華,詹軼群,楊曉明,李長(zhǎng)燕. 中國(guó)生物化學(xué)與分子生物學(xué)報(bào). 2013(06)
[6]下一代測(cè)序中ChIP-seq數(shù)據(jù)的處理與分析[J]. 高山,張寧,李勃,徐碩,葉彥波,阮吉壽. 遺傳. 2012(06)
[7]高通量測(cè)序技術(shù)及其應(yīng)用[J]. 王興春,楊致榮,王敏,李瑋,李生才. 中國(guó)生物工程雜志. 2012(01)
[8]一種新的快速鑒定蛋白與靶DNA結(jié)合位點(diǎn)的方法[J]. 朱明,魏偉,陳明,張憲省,徐兆師,李連城,馬有志. 作物學(xué)報(bào). 2011(12)
[9]ChIP技術(shù)及其在基因組水平上分析DNA與蛋白質(zhì)相互作用[J]. 李敏俐,王薇,陸祖宏. 遺傳. 2010(03)
[10]基因芯片與高通量DNA測(cè)序技術(shù)前景分析[J]. 滕曉坤,肖華勝. 中國(guó)科學(xué)(C輯:生命科學(xué)). 2008(10)
博士論文
[1]基于機(jī)器學(xué)習(xí)的蛋白質(zhì)結(jié)合位點(diǎn)特征化和預(yù)測(cè)方法研究[D]. 熊毅.武漢大學(xué) 2011
[2]miRNA及轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)與調(diào)控功能分析[D]. 汪國(guó)華.哈爾濱工業(yè)大學(xué) 2009
[3]轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)算法的研究與應(yīng)用[D]. 徐東.上海大學(xué) 2005
碩士論文
[1]基于ChIP-seq數(shù)據(jù)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)識(shí)別算法[D]. 賈瑤麗.北京交通大學(xué) 2016
[2]分類器性能評(píng)價(jià)研究[D]. 武婷婷.北京交通大學(xué) 2010
[3]蛋白質(zhì)-DNA結(jié)構(gòu)模型比較及其在轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)中的應(yīng)用[D]. 陳凌.復(fù)旦大學(xué) 2010
本文編號(hào):3143393
本文鏈接:http://sikaile.net/yixuelunwen/swyx/3143393.html
最近更新
教材專著