利用生物信息學(xué)發(fā)現(xiàn)核酶和新的結(jié)構(gòu)性ncRNA
發(fā)布時(shí)間:2021-09-15 18:48
HDV核酶和錘頭型(hammerhead)核酶在植物中已經(jīng)有報(bào)道存在,在此課題中,我們?cè)谧约航⒌?4個(gè)植物物種的基因組數(shù)據(jù)庫(kù)中,嘗試用RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)軟件Infernal在未報(bào)道過(guò)的植物中發(fā)現(xiàn)核酶。除了核酶,我們也用不同的生物信息學(xué)流水線(pipeline)分別在人類基因組和裸子植物基因組中發(fā)現(xiàn)了新的結(jié)構(gòu)性ncRNA。流水線的主要思路一致:先下載物種的基因組建立數(shù)據(jù)庫(kù),然后將基因組的非編碼區(qū)提取出來(lái),并且我們會(huì)去掉上傳到Rfam數(shù)據(jù)庫(kù)的已知的ncRNA。同時(shí)由于不管在動(dòng)物還是植物基因組中,重復(fù)序列的存在比例都相當(dāng)高,為了避免重復(fù)序列的影響我們會(huì)通過(guò)不同的方法去除重復(fù)序列。提取出新的非編碼區(qū)序列以后我們用BLAST進(jìn)行同源序列比對(duì),然后用CMfinder預(yù)測(cè)二級(jí)結(jié)構(gòu)。為了增加預(yù)測(cè)的二級(jí)結(jié)構(gòu)的可靠度,我們會(huì)篩選出共變異較多、保守性較好的二級(jí)結(jié)構(gòu),再用Infernal在更大的基因組數(shù)據(jù)庫(kù)里找到更多符合結(jié)構(gòu)特點(diǎn)的序列,進(jìn)一步改善二級(jí)結(jié)構(gòu)。通過(guò)上述方法,我們?cè)谛碌闹参锘蚪M中發(fā)現(xiàn)了有活性的HDV核酶和III型hammerhead核酶的存在,分別預(yù)測(cè)到了123和319條核酶序列,在Selagi...
【文章來(lái)源】:華僑大學(xué)福建省
【文章頁(yè)數(shù)】:157 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
H. annus和C. scolymus中HDV-like核酶二級(jí)結(jié)構(gòu)
人類基因組基本思路和裸子植物類似,但是由于裸子植物基因組普遍以Gb為單位,已有程序方法處理可以處理動(dòng)物基因組但是不能處理植物的大數(shù)據(jù)庫(kù),另一方面裸子植物基因組及注釋文件有一部分是下載于專門的裸子植物測(cè)序基因組數(shù)據(jù)庫(kù),除了與人類基因組研究涉及的20多個(gè)物種的基因庫(kù)文件格式不一樣以外,還有一些基因組已經(jīng)用softmasker將重復(fù)區(qū)替換成了小寫的atcg,可以直接下載使用,基于這兩點(diǎn)我們用了不同的程序語(yǔ)言和方法提取植物方面和動(dòng)物方面基因組的新的非編碼RNA。具體實(shí)施方法的區(qū)別主要是以下幾點(diǎn):1.在提取新的非編碼區(qū)的時(shí)候,人類基因組研究單純用的perl語(yǔ)言程序,而裸子植物的研究結(jié)合了Linux文本處理工具(grep、sed、awk等)、python語(yǔ)言程序、seqtk、seqkit等工具和方法,不僅解決了所能處理的基因組容量的問(wèn)題,同時(shí)也大大縮短了處理時(shí)間;2.處理的先后順序,人類基因組的研究是先得到非編碼區(qū)序列,拿這個(gè)結(jié)果去用BLAST比對(duì)Rfam的已注釋的基因數(shù)據(jù)庫(kù),比對(duì)上的就去除,而裸子植物基因組研究是先拿整個(gè)基因組和Rfam數(shù)據(jù)庫(kù)比對(duì),下一步同時(shí)去掉全基因組中的編碼區(qū)、重復(fù)序列、已注釋的ncRNA。圖1.5 應(yīng)用比較基因組學(xué)在裸子植物基因組中發(fā)現(xiàn)新的結(jié)構(gòu)性ncRNA的技術(shù)路線
應(yīng)用比較基因組學(xué)在裸子植物基因組中發(fā)現(xiàn)新的結(jié)構(gòu)性ncRNA的技術(shù)路線
【參考文獻(xiàn)】:
期刊論文
[1]植物中的非編碼RNA及其作用機(jī)制[J]. 李莉云,劉國(guó)振. 生命的化學(xué). 2006(03)
本文編號(hào):3396600
【文章來(lái)源】:華僑大學(xué)福建省
【文章頁(yè)數(shù)】:157 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
H. annus和C. scolymus中HDV-like核酶二級(jí)結(jié)構(gòu)
人類基因組基本思路和裸子植物類似,但是由于裸子植物基因組普遍以Gb為單位,已有程序方法處理可以處理動(dòng)物基因組但是不能處理植物的大數(shù)據(jù)庫(kù),另一方面裸子植物基因組及注釋文件有一部分是下載于專門的裸子植物測(cè)序基因組數(shù)據(jù)庫(kù),除了與人類基因組研究涉及的20多個(gè)物種的基因庫(kù)文件格式不一樣以外,還有一些基因組已經(jīng)用softmasker將重復(fù)區(qū)替換成了小寫的atcg,可以直接下載使用,基于這兩點(diǎn)我們用了不同的程序語(yǔ)言和方法提取植物方面和動(dòng)物方面基因組的新的非編碼RNA。具體實(shí)施方法的區(qū)別主要是以下幾點(diǎn):1.在提取新的非編碼區(qū)的時(shí)候,人類基因組研究單純用的perl語(yǔ)言程序,而裸子植物的研究結(jié)合了Linux文本處理工具(grep、sed、awk等)、python語(yǔ)言程序、seqtk、seqkit等工具和方法,不僅解決了所能處理的基因組容量的問(wèn)題,同時(shí)也大大縮短了處理時(shí)間;2.處理的先后順序,人類基因組的研究是先得到非編碼區(qū)序列,拿這個(gè)結(jié)果去用BLAST比對(duì)Rfam的已注釋的基因數(shù)據(jù)庫(kù),比對(duì)上的就去除,而裸子植物基因組研究是先拿整個(gè)基因組和Rfam數(shù)據(jù)庫(kù)比對(duì),下一步同時(shí)去掉全基因組中的編碼區(qū)、重復(fù)序列、已注釋的ncRNA。圖1.5 應(yīng)用比較基因組學(xué)在裸子植物基因組中發(fā)現(xiàn)新的結(jié)構(gòu)性ncRNA的技術(shù)路線
應(yīng)用比較基因組學(xué)在裸子植物基因組中發(fā)現(xiàn)新的結(jié)構(gòu)性ncRNA的技術(shù)路線
【參考文獻(xiàn)】:
期刊論文
[1]植物中的非編碼RNA及其作用機(jī)制[J]. 李莉云,劉國(guó)振. 生命的化學(xué). 2006(03)
本文編號(hào):3396600
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3396600.html
最近更新
教材專著