與棉纖維發(fā)育相關(guān)的EST生物信息學(xué)分析
本文關(guān)鍵詞:與棉纖維發(fā)育相關(guān)的EST生物信息學(xué)分析,,由筆耕文化傳播整理發(fā)布。
【摘要】: 棉花作為纖維的重要來(lái)源,是一種重要的經(jīng)濟(jì)作物,在世界經(jīng)濟(jì)中發(fā)揮著重要的作用.隨著測(cè)序技術(shù)和生物信息學(xué)的快速發(fā)展,GenBank等重要分子生物數(shù)據(jù)庫(kù)中登陸的序列呈指數(shù)增長(zhǎng),截至2007年4月,NCBI、EMBL和DDBJ3大數(shù)據(jù)庫(kù)收錄的核酸序列已經(jīng)達(dá)到67,218,344條,共計(jì)71,292,211,453堿基對(duì),其中棉花EST有281,233條,利用生物信息學(xué)手段對(duì)棉纖維發(fā)育相關(guān)的EST進(jìn)行大規(guī)模分析顯得日益重要.本實(shí)驗(yàn)利用138,086條與棉纖維發(fā)育相關(guān)的ESTs進(jìn)行生物信息學(xué)研究,開(kāi)發(fā)新標(biāo)記和功能分析,為加密遺傳圖譜、基因定位、發(fā)掘新基因、比較基因組、基因網(wǎng)絡(luò)分析和分子進(jìn)化奠定堅(jiān)實(shí)的基礎(chǔ). 為了在棉花中開(kāi)發(fā)EST-SSR功能性標(biāo)記,利用生物信息學(xué)方法對(duì)NCBI網(wǎng)上公開(kāi)的63485條雷蒙德氏棉(Gossypium raimondii Ulbrich)ESTs序列進(jìn)行EST-SSRs特征分析.剔除冗余序列,得到非冗余序列58906條.在非冗余序列中發(fā)現(xiàn)含不同重復(fù)基元SSRs的EST序列有2620條,共2818個(gè)EST-SSRs,EST-SSRs序列的頻率是4.45%,平均相隔14.8kb出現(xiàn)一個(gè)SSR.在1-6bp的重復(fù)基元中,三核苷酸重復(fù)基元的SSRs出現(xiàn)頻率最高(38.31%),其次是二核苷酸(24.09%)、單核苷酸(23.35%).統(tǒng)計(jì)所有的重復(fù)基元類(lèi)型,所占比例最大的是A/T(18.67%),其次是AT/TA(14.83%).在復(fù)合型(Compound)中發(fā)現(xiàn)三核苷酸串聯(lián)三核苷酸的重復(fù)基元出現(xiàn)頻率最高,為48.65%.利用Prime 3軟件,設(shè)計(jì)了1554對(duì)EST-SSRs引物,應(yīng)用這些引物對(duì)我室四倍體作圖親本陸地棉TM-1和海島棉海7124進(jìn)行多態(tài)性檢測(cè),其中744對(duì)有多態(tài)性,多態(tài)性頻率為47.9%.這些EST-SSRs已有效用于不同棉種間的分布特征比較及染色體定位等方面研究. 對(duì)來(lái)自A組、D組和AD組的12個(gè)棉纖維發(fā)育時(shí)期混合cDNA文庫(kù)的138,086條ESTs序列進(jìn)行不同棉種間EST序列同源性比較,其中A組(G.arboreum,7-10dpa)39,117條、D組(G.raimondii,-3 to 3dpa)32,316條和AD組(G.hirsutum,10個(gè)文庫(kù),覆蓋-3-25dpa)66,653條,通過(guò)同一種內(nèi)EST序列拼接分析,分別得到A、D和AD三個(gè)棉種的Unigenes16,100條、11,912條和14,307條,共42,319unigenes.經(jīng)過(guò)對(duì)不同基因組間的Unigenes序列相似性分析,得到七個(gè)集合(D∩(?)∩(?)、AD∩(?)∩(?)、A∩D∩AD、A∩D∩(?)、A∩AD∩(?)、A∩(?)∩(?)和D∩AD∩(?))的相似序列,分別對(duì)A組和D組間共有而在AD組間沒(méi)有相似性(A∩D∩(?))的序列937條,A組和AD組間有而在D組間沒(méi)有的(A∩AD∩(?))2,717條,D組和AD組間有而在A組間沒(méi)有的(D∩AD∩(?))2188條,三個(gè)組間相似性高的序列(A∩D∩AD)共有2441條。D組獨(dú)有(D∩(?)∩(?))的6346,A組獨(dú)有(A∩(?)∩(?))的7996和AD組獨(dú)有的(AD∩(?)∩(?))4467條Unigenes進(jìn)行了功能注釋和代謝分析.結(jié)果表明: (1) A組、D組和AD組間不同關(guān)系(D∩(?)∩(?)、AD∩(?)∩(?)、A∩D∩AD、A∩D∩(?)、A∩AD∩(?)、A∩(?)∩(?)和D∩AD∩(?)七個(gè)集合)的相似性序列進(jìn)行功能分類(lèi)分成生物進(jìn)程(Biologicat Process)、細(xì)胞組分(Cellular Component)和分子功能(Molecular Function)3個(gè)類(lèi)型.在同一功能類(lèi)型不同集合中所占比例最大的前兩種功能基本相同,生物進(jìn)程中所占比例最大的是cellulaur process,其次是metabolicprocess;細(xì)胞組分中所占比例最大的是cell/cell part,其次是organelle;分子功能中所占比例最大的兩個(gè)是catalytic activity和binding,即在棉纖維發(fā)育進(jìn)程中,具有催化活性的基因在不同棉種中均發(fā)揮著重要作用. (2)對(duì)A、D、AD基因組七個(gè)集合27,092條相似性序列進(jìn)行功能和代謝分析.功能分析表明,13,845條功能已知,13,247條未知功能.利用KEGG數(shù)據(jù)庫(kù)進(jìn)一步對(duì)已知功能的13,845條序列進(jìn)行代謝分析,2,543條Unigenes有代謝途徑,其中能量和碳水化合物代謝最多(1607,63.19%),其次是氨基酸代謝(718,28.23%).在已知功能的13,845條序列中與棉纖維發(fā)育相關(guān)的重要基因如膨脹素、纖維素舍酶、蔗糖合酶、UDP、磷酸烯醇丙酮酸羧化酶、蔗糖轉(zhuǎn)運(yùn)蛋白、MYB家族和液泡H+-ATPases(V-ATPase)都存在.通過(guò)對(duì)D(D_5)基因組和AD(A_2D_5)基因組間的與棉纖維發(fā)育相關(guān)的Unigenes功能分析發(fā)現(xiàn),D組38.86%((2188+2441)/11912)的Unigenes與AD組中的Unigenes具有相同的功能.說(shuō)明在D基因組和AD基因組中在棉纖維起始發(fā)育階段有很多相似的表達(dá)基因,盡管D基因組的種子上只有短絨沒(méi)有生產(chǎn)上可利用的纖維,但D基因組和AD基因組在轉(zhuǎn)錄水平上的高同源性表明D基因組蘊(yùn)含著決定纖維發(fā)育的基因.A基因組和AD基因組間有5158條Unigenes有相似性.5158條序列中有847(16.42%)條序列有代謝途徑.在代謝方面主要以碳水化合物和能量代謝與氨基酸代謝為主.對(duì)A基因組(7 to10dpa)和D基因組(-3 to 3dpa)中3378條相似性序列進(jìn)行代謝和功能分析,2916條序列有功能,748條序列在KEGG數(shù)據(jù)庫(kù)中找到代謝途徑.通過(guò)分析A、D基因組間的相似序列來(lái)源說(shuō)明上述基因在纖維啟動(dòng)和伸長(zhǎng)階段均在表達(dá). (3)四倍體AD基因組與二倍體A和D基因組的轉(zhuǎn)錄產(chǎn)物比較發(fā)現(xiàn)有4522(31.61%,A∩D∩AD)Unigenes在A和D基因組共同表達(dá),表明這些基因是來(lái)源比較保守的祖先基因,它們并合到四倍體AD基因組中仍然轉(zhuǎn)錄,發(fā)揮相應(yīng)的功能及參與相應(yīng)的代謝進(jìn)程.在A∩AD∩D中有2717(18.99%)Unigenes在A基因組中找到相似序列而在D基因組中沒(méi)有,說(shuō)明這些Unigenes僅在纖維發(fā)育伸長(zhǎng)階段表達(dá)或在A和A_T基因組;磉_(dá);在D∩AD∩(?)中有2601(18.18%)條Unigenes在D基因組中找到相似序列而在A基因組中沒(méi)有,說(shuō)明這些Unigenes僅在纖維起始階段特異表達(dá)或在D和D_T基因組;磉_(dá);而在AD∩(?)A∩(?)中有4467(31.22%)Unigenes在A和D基因組中均未找到相似序列,是AD基因組中特有的轉(zhuǎn)錄產(chǎn)物,可能是由于多倍化后產(chǎn)生新的轉(zhuǎn)錄產(chǎn)物,進(jìn)而在功能上發(fā)生了變化. (4)通過(guò)A和D基因組相互比較發(fā)現(xiàn)A基因組有4797(29.77%)Unigenes在D基因組中有相似序列,D基因組在A基因組中有3378(28.36%)Unigenes存在相似性,表明相似Unigenes在纖維發(fā)育起始階段和伸長(zhǎng)期均表達(dá).在A和D基因組中沒(méi)有相似性的序列分別是11303(70.20%)和8534(71.64%),進(jìn)一步說(shuō)明這些Unigenes是不同纖維發(fā)育期特異表達(dá)的或基因組專化表達(dá)的基因. 生物信息學(xué)分析結(jié)果為進(jìn)一步研究棉纖維的發(fā)育,闡明不同棉種間纖維發(fā)育關(guān)系,進(jìn)而為改良棉纖維品質(zhì)奠定基礎(chǔ).
【關(guān)鍵詞】:生物信息 EST 功能分析 相似性 代謝 Unigene
【學(xué)位授予單位】:南京農(nóng)業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2007
【分類(lèi)號(hào)】:S562
【目錄】:
- 摘要6-9
- ABSTRACT9-13
- 第一部分 文獻(xiàn)綜述13-39
- 第一章 生物信息學(xué)概述13-30
- 1.生物信息學(xué)產(chǎn)生的背景13-15
- 2.生物信息學(xué)的發(fā)展與應(yīng)用15-30
- 2.1 相關(guān)學(xué)科和技術(shù)的發(fā)展15-16
- 2.2 分子生物信息數(shù)據(jù)庫(kù)16-24
- 2.2.1 基因組數(shù)據(jù)庫(kù)18
- 2.2.2 序列數(shù)據(jù)庫(kù)18-21
- 2.2.2.1 核酸序列數(shù)據(jù)庫(kù)19-20
- 2.2.2.2 蛋白質(zhì)序列數(shù)據(jù)庫(kù)20-21
- 2.2.3 結(jié)構(gòu)數(shù)據(jù)庫(kù)21-22
- 2.2.4 二次數(shù)據(jù)庫(kù)22
- 2.2.5 其他數(shù)據(jù)庫(kù)22-24
- 2.3 生物信息數(shù)據(jù)分析工具24-27
- 2.4 生物信息學(xué)的應(yīng)用27-30
- 第二章 與棉纖維發(fā)育相關(guān)的ESTs研究進(jìn)展30-38
- 1.EST概述30-35
- 1.1 EST基本概念30
- 1.2 EST的獲取30-31
- 1.3 EST數(shù)據(jù)庫(kù)31-32
- 1.4 EST生物信息學(xué)分析32-35
- 1.4.1 ESTs與基因識(shí)別33
- 1.4.2 ESTs與基因圖譜的繪制33
- 1.4.3 ESTs與基因預(yù)測(cè)33
- 1.4.4 ESTs與SNPs33-34
- 1.4.5 利用ESTs大規(guī)模分析基因表達(dá)水平34-35
- 1.4.6 用于分子標(biāo)記的開(kāi)發(fā)35
- 2.棉纖維發(fā)育相關(guān)的ESTs研究進(jìn)展35-38
- 2.1 基因克隆35
- 2.2 基因注釋和功能分析35-37
- 2.3 EST-SSR新標(biāo)記的開(kāi)發(fā)與遺傳圖譜的構(gòu)建37-38
- 本研究的目的與意義38-39
- 第二部分 研究報(bào)告39-63
- 第三章 雷蒙德氏棉EST-SSRs分布特征及開(kāi)發(fā)與利用39-46
- 1.材料和方法40-41
- 1.1 EST序列來(lái)源40
- 1.2 EST—SSRs的開(kāi)發(fā)40
- 1.3 EST—SSRs的引物開(kāi)發(fā)40-41
- 1.4 DNA提取、SSR擴(kuò)增和電泳41
- 2.結(jié)果和討論41-46
- 2.1 源于雷蒙德氏棉ESTs的SSRs發(fā)掘41-42
- 2.2 雷蒙德氏棉EST—SSRs的分布特征42-44
- 2.3 雷蒙德氏棉EST—SSRs標(biāo)記開(kāi)發(fā)及其在海、陸四倍體栽培棉種間的多態(tài)性44-46
- 第四章 與棉纖維發(fā)育相關(guān)的ESTs組裝與功能分析46-63
- 1.材料與方法47-49
- 1.1 EST序列來(lái)源47
- 1.2 Unigenes的發(fā)掘47
- 1.3 序列間的相似性分析47
- 1.4 相似性序列功能注釋47-49
- 2.結(jié)果49-59
- 2.1 Unigenes的獲得49-50
- 2.2 不同基因組間Unigenes序列相似性分析50-51
- 2.3 27092 Unigenes功能注釋51-53
- 2.4 27092 Unigenes代謝分析53-54
- 2.5 A、D、AD基因組間相似性序列代謝分析54-57
- 2.6 三個(gè)基因組間共有的相似序列功能和代謝分析57-58
- 2.7 D組和AD組間相似性Unigenes功能和代謝分析58-59
- 2.8 A組和AD組間相似性Unigenes功能和代謝分析59
- 2.9 A組和D組間相似性Unigenes功能和代謝分析59
- 3.討論59-63
- 3.1 不同基因組間ESTs的功能表達(dá)59-61
- 3.1.1 D基因組和AD基因組間功能EST的表達(dá)59-61
- 3.1.2 A基因組和D基因組不同文庫(kù)間的功能ESTs表達(dá)61
- 3.1.3 A基因組和AD基因組不同文庫(kù)間的功能ESTs表達(dá)61
- 3.2 與棉纖維發(fā)育相關(guān)的ESTs代謝分析61-63
- 全文結(jié)論63-65
- 參考文獻(xiàn)65-78
- 附錄78-140
- 本試驗(yàn)中用的程序腳本140-149
- 1.提取序列腳本140-143
- 2.格式轉(zhuǎn)換143-144
- 3.發(fā)掘SSR后的結(jié)果處理144-146
- 4.統(tǒng)計(jì)序列長(zhǎng)度和GC含量146-148
- 5.提取PRIMER3結(jié)果的相關(guān)信息148-149
- 攻讀碩士學(xué)位期間已發(fā)表和待發(fā)表的論文149-150
- 致謝150
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 張波;李鮮;陳昆松;;基于EST庫(kù)的獼猴桃脂氧合酶基因家族成員的克隆[J];園藝學(xué)報(bào);2008年03期
2 董昌金,姚占芳;香菇優(yōu)良品種HL_6的選育研究[J];中國(guó)食用菌;1999年06期
3 鄒華文;朱玉梅;黃叢林;田小海;;一種簡(jiǎn)單、快速克隆玉米功能基因的方法[J];長(zhǎng)江大學(xué)學(xué)報(bào)(自科版)農(nóng)學(xué)卷;2007年02期
4 張豐源;;烏拉爾甘草EST特征分析[J];民營(yíng)科技;2008年10期
5 安澤偉;趙彥宏;程漢;李維國(guó);黃華孫;;橡膠樹(shù)EST-SSR標(biāo)記的開(kāi)發(fā)與應(yīng)用[J];遺傳;2009年03期
6 陳全求;詹先進(jìn);藍(lán)家樣;黃云;;EST分子標(biāo)記開(kāi)發(fā)研究進(jìn)展[J];中國(guó)農(nóng)學(xué)通報(bào);2008年09期
7 江寧,鄧龍文,譚國(guó)林,湛鳳凰,周鳴,曹莉,邱元正,謝奕,李桂源;一個(gè)定位在7q32染色體區(qū)域的鼻咽癌負(fù)相關(guān)EST[J];遺傳學(xué)報(bào);1999年04期
8 周?chē)?guó)嶺,楊光圣,傅廷棟;基因克隆技術(shù)[J];華中農(nóng)業(yè)大學(xué)學(xué)報(bào);2001年06期
9 童富淡,汪俏梅,劉艷荷;西方蜜蜂四個(gè)亞種酯酶同工酶型和蘋(píng)果酸脫氫酶Ⅱ同工酶基因型的遺傳差異[J];動(dòng)物學(xué)報(bào);2002年06期
10 于學(xué)寧;劉欣玲;董秀春;樊金會(huì);曹幫華;;刺槐Na~+/H~+逆向轉(zhuǎn)運(yùn)蛋白R(shí)pNHX1基因的分離和生物信息學(xué)分析(英文)[J];分子植物育種;2007年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 段云;武予清;蔣月麗;苗進(jìn);吳仁海;;小麥紅吸漿蟲(chóng)唾腺EST序列的生物信息學(xué)分析[A];公共植保與綠色防控[C];2010年
2 劉保忠;董波;相建海;;不同發(fā)育時(shí)期文蛤幼蟲(chóng)cDNA文庫(kù)的構(gòu)建及ESTs測(cè)序和分析[A];中國(guó)海洋湖沼學(xué)會(huì)中國(guó)動(dòng)物學(xué)會(huì)貝類(lèi)學(xué)分會(huì)第十二次學(xué)術(shù)討論會(huì)摘要[C];2005年
3 麻巧迎;張帥;王春義;雒s
本文編號(hào):368351
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/368351.html