負相關(guān)的基因表達模式及其保守性研究
本文關(guān)鍵詞:負相關(guān)的基因表達模式及其保守性研究,由筆耕文化傳播整理發(fā)布。
【摘要】:基因表達數(shù)據(jù)提供了大量基因表達的信息,這些為理解生命的本質(zhì)起著重要作用。基因表達數(shù)據(jù)常見的處理方法包括識別差異表達的基因,聚類,雙向聚類和構(gòu)建基因調(diào)控網(wǎng)絡(luò)等等。盡管用這些方法也能夠挖掘出隱藏在基因表達數(shù)據(jù)里面的部分信息,但所獲得的信息相對而言還是較少,例如在癌癥的研究中,雖然使用了許多先進的方法,數(shù)據(jù)和手段來研究這些疾病,如癌癥和腫瘤基因圖譜(TCGA)數(shù)據(jù)庫等等,但是當(dāng)前對付癌癥依舊沒有較好的策略,這表明研究者對相關(guān)疾病還沒有獲得全部的生物信息,需要反思當(dāng)前這些方法存在的問題。在基因表達數(shù)據(jù)中,絕大部分基因的表達是沒有明顯變化的,只有很少的一部分基因是差異表達的。在這些差異表達的基因中,有一部分基因的表達是上調(diào)的,另外一部分基因是下調(diào)的,這些上調(diào)基因與下調(diào)基因是否存在關(guān)聯(lián)?如果基因集V的兩個子集V1和V2在部分實驗條件或時間點中具有相反的表達趨勢,而且每個子集之內(nèi)的基因都具有相似的表達趨勢,那么就說子集V1和子集V2是一個負相關(guān)表達模式,簡稱負相關(guān)模式,如果這個負相關(guān)模式在其他多個數(shù)據(jù)集中也存在,那么就說這個負相關(guān)模式是保守的(不變的)。基因表達譜中的負相關(guān)模式很少有學(xué)者進行深入系統(tǒng)探索。針對這些問題,本論文嘗試從負相關(guān)的思路出發(fā),對基因表達數(shù)據(jù)中上調(diào)和下調(diào)基因之間的這種相反變化趨勢,結(jié)合生物信息學(xué)的方法和生物學(xué)的理論,從以下幾個不同方面進行深入系統(tǒng)的探討。其主要研究內(nèi)容和結(jié)果如下:(1)設(shè)計識別負相關(guān)模式的算法:①設(shè)計了基于形式概念分析技術(shù)的負相關(guān)雙向聚類算法(NCFCA算法),通過與其他算法比較表明,NCFCA算法在平均平衡率,平均皮爾森相關(guān)系數(shù)和聚類得分方面均優(yōu)于其他算法,能更多地識別出數(shù)目平衡的負相關(guān)模式。②為了能處理較大的基因表達數(shù)據(jù),本文利用CPU的多核并行技術(shù),設(shè)計了基于形式概念分析技術(shù)的并行負相關(guān)雙向聚類算法(NCFCA2算法),與NCFCA算法比較,NCFCA2算法在運行時間方面均大大優(yōu)于以前的NCFCA算法。(2)三個不同數(shù)據(jù)集中負相關(guān)模式及其保守性(不變性)研究:①將NCFCA算法應(yīng)用于酵母菌細胞周期的alpha 26,alpha 30和alpha 38三個時間過程的數(shù)據(jù)集,選取這三個數(shù)據(jù)集中的800個細胞周期調(diào)控基因通過分析處理之后發(fā)現(xiàn):微小染色體維持蛋白基因與核心組蛋白基因會形成負相關(guān)模式,而且這個負相關(guān)模式均發(fā)現(xiàn)于alpha 26,alpha 30和alpha 38三個數(shù)據(jù)集。傳統(tǒng)的觀點認為,負相關(guān)的兩組基因一般來說沒有功能上的相似性,然而將這兩組基因一起做基因集富集分析之后發(fā)現(xiàn),它們表達相反的基因之間也具有顯著的功能相似性,這就表明參與同一生物學(xué)過程的兩組基因也可能具有相反的表達趨勢。將ncfca算法應(yīng)用于酵母菌10個其它細胞周期過程的表達數(shù)據(jù)之后發(fā)現(xiàn),在這10個數(shù)據(jù)集中也發(fā)現(xiàn)微小染色體維持蛋白基因與核心組蛋白基因也能形成負相關(guān)模式。同時在最近出版的兩個高精度瓦片測序的基因數(shù)據(jù)集中也證實了這一觀點。這些發(fā)現(xiàn)表明這兩組基因形成的負相關(guān)模式可能是保守的。進一步分析它們的調(diào)控關(guān)系表明:這兩組基因形成保守的負相關(guān)模式的主要原因很可能是由clb-cdk1激酶是通過一個共調(diào)控和一個負調(diào)控來實現(xiàn)的,clb-cdk1是在細胞周期過程的不同時期上調(diào)或下調(diào)這兩組基因的表達。②將ncfca2算法應(yīng)用于酵母菌的2010.shapira04和gse26169這兩個氧化應(yīng)激響應(yīng)數(shù)據(jù)集,從這兩個數(shù)據(jù)集中各自選取所有通路基因的表達數(shù)據(jù)進行分析之后發(fā)現(xiàn):淀粉和蔗糖代謝通路中的部分基因和嘌呤代謝通路中的部分基因的表達曲線也是負相關(guān)的。也就是說,在環(huán)境應(yīng)激響應(yīng)數(shù)據(jù)中兩組通路的基因也會形成負相關(guān)模式。將ncfca2算法應(yīng)用于酵母菌10個其它環(huán)境應(yīng)激響應(yīng)數(shù)據(jù)集中分析之后發(fā)現(xiàn),這兩條通路中的部分基因也會形成負相關(guān)模式。這些發(fā)現(xiàn)表明這兩條通路基因之間的負相關(guān)模式可能是保守的。通過研究它們的生物學(xué)調(diào)控關(guān)系表明,這兩條通路形成保守的負相關(guān)模式的原因很可能是由雷帕霉素受體復(fù)合物1(torc1)在蛋白酶體的輔助下是通過一個共調(diào)控和一個負調(diào)控來實現(xiàn)的。③將ncfca2算法應(yīng)用于酵母菌的熱休克響應(yīng)和氧化應(yīng)激響應(yīng)的表達數(shù)據(jù)集,將這兩個數(shù)據(jù)集中基因的表達值按照方差由大到小排序,通過分別選取這兩個數(shù)據(jù)集中排名前1000的基因進行分析之后,發(fā)現(xiàn)核糖體蛋白基因與熱休克響應(yīng)基因;核糖體蛋白基因與氧化應(yīng)激響應(yīng)基因的表達曲線均是負相關(guān)的。將ncfca2算法應(yīng)用于酵母菌其它的環(huán)境應(yīng)激響應(yīng)數(shù)據(jù)集中分析之后發(fā)現(xiàn),在這些數(shù)據(jù)集中核糖體蛋白基因和其它環(huán)境應(yīng)激響應(yīng)的基因也能形成負相關(guān)模式。這些發(fā)現(xiàn)表明這個負相關(guān)模式可能是保守的。進一步研究它們的生物學(xué)調(diào)控關(guān)系表明,核糖體蛋白基因與不同環(huán)境應(yīng)激響應(yīng)基因形成的負相關(guān)模式,很可能也是由雷帕霉素受體復(fù)合物1(torc1)在蛋白酶體的輔助下也是通過一個共調(diào)控和一個負調(diào)控共同作用,調(diào)控核糖體蛋白基因與環(huán)境應(yīng)激響應(yīng)基因的表達來實現(xiàn)的。綜合以上研究結(jié)果,表明ncfca算法和ncfca2算法能用較少的時間和空間花費,有效地識別基因表達數(shù)據(jù)中的負相關(guān)模式,特別是識別數(shù)目平衡的負相關(guān)模式。這些負相關(guān)模式經(jīng)過信息冗余過濾和基因集富集分析之后,發(fā)現(xiàn)只有少量負相關(guān)模式是具有功能顯著性,比如核糖體蛋白基因與環(huán)境應(yīng)激響應(yīng)基因,而且這些負相關(guān)模式可能是保守的(不變的)。進一步研究發(fā)現(xiàn)這些保守的負相關(guān)模式可能是由一個關(guān)鍵的調(diào)控子通過一個共調(diào)控和一個負調(diào)控共同作用形成的。這些說明,生物系統(tǒng)可能會在各個子系統(tǒng)內(nèi)部協(xié)調(diào)上調(diào)基因與下調(diào)基因之間的表達關(guān)系。從能量的角度來講,生物系統(tǒng)可能會在各個子系統(tǒng)中協(xié)調(diào)能量供求的平衡關(guān)系,以達到新的平衡點。
【關(guān)鍵詞】:負相關(guān)模式 保守性 細胞周期 應(yīng)激響應(yīng) 酵母菌
【學(xué)位授予單位】:重慶大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:Q811.4
【目錄】:
- 中文摘要3-6
- 英文摘要6-13
- 主要略縮詞13-14
- 1 緒論14-28
- 1.1 問題的提出及研究意義14-15
- 1.2 國內(nèi)外現(xiàn)狀15-26
- 1.2.1 負相關(guān)模式的發(fā)現(xiàn)15-18
- 1.2.2 負相關(guān)模式識別算法18-19
- 1.2.3 相關(guān)的算法和技術(shù)研究現(xiàn)狀19-26
- 1.3 研究思路及主要研究內(nèi)容26-27
- 1.3.1 研究思路26
- 1.3.2 主要研究內(nèi)容26-27
- 1.4 本文的創(chuàng)新點27-28
- 2 基于改進形式概念分析技術(shù)的負相關(guān)雙向聚類算法28-44
- 2.1 前言28-29
- 2.2 負相關(guān)模式相關(guān)概念介紹29-30
- 2.2.1 基因表達數(shù)據(jù)描述29
- 2.2.2 負相關(guān)模式的正式定義29
- 2.2.3 形式概念分析介紹29-30
- 2.3 基于改進的形式概念分析技術(shù)的負相關(guān)雙向聚類算法(NCFCA算法)30-32
- 2.3.1 NCFCA算法的偽代碼30-31
- 2.3.2 NCFCA算法的詳細描述31-32
- 2.4 NCFCA算法與其他算法的比較32-39
- 2.4.1 數(shù)據(jù)集32-33
- 2.4.2 負相關(guān)算法與其他算法的比較和評估33-39
- 2.5 基于并行技術(shù)的負相關(guān)雙向聚類算法(NCFCA2算法)39-41
- 2.5.1 PCbO算法的主要思想39
- 2.5.2 基于并行技術(shù)的負相關(guān)雙向聚類算法的偽代碼39-40
- 2.5.3 NCFCA2算法的性能40-41
- 2.6 討論41-42
- 2.7 小結(jié)42-44
- 3 酵母菌中細胞周期調(diào)控基因的負相關(guān)模式及其保守性研究44-58
- 3.1 前言44
- 3.2 數(shù)據(jù)44-46
- 3.2.1 三個基因表達數(shù)據(jù)集44
- 3.2.2 基因表達數(shù)據(jù)的提取和預(yù)處理44
- 3.2.3 NCFCA2算法應(yīng)用于三個數(shù)據(jù)集44-46
- 3.3 負相關(guān)模式的生物信息學(xué)分析46-51
- 3.3.1 核心組蛋白(histone)基因的功能富集分析46-47
- 3.3.2 微小維持蛋白復(fù)合物(MCM)基因的功能富集分析47-49
- 3.3.3 聯(lián)合微小維持蛋白復(fù)合物基因和核心組蛋白基因的功能富集分析49-51
- 3.4 負相關(guān)模式的保守性(不變性)探索51-53
- 3.5 討論53-57
- 3.5.1 微小染色體維持蛋白復(fù)合物基因53-54
- 3.5.2 核心組蛋白基因54
- 3.5.3 Clb-Cdk1的調(diào)控可能是微小維持蛋白復(fù)合物基因和核心組蛋白基因形成負相關(guān)模式保守性的原因54-56
- 3.5.4 微小維持蛋白復(fù)合物基因和核心組蛋白基因具有相似的功能56-57
- 3.6 小結(jié)57-58
- 4 酵母菌中通路基因的負相關(guān)模式及其保守性研究58-80
- 4.1 前言58
- 4.2 數(shù)據(jù)和方法58-60
- 4.2.1 兩個基因表達數(shù)據(jù)58
- 4.2.2 基因表達數(shù)據(jù)的提取和預(yù)處理58-59
- 4.2.3 NCFCA2算法應(yīng)用于上述兩個數(shù)據(jù)集59-60
- 4.3 兩個負相關(guān)模式的生物信息學(xué)分析60-72
- 4.4 保守性(不變性)探索72-76
- 4.5 討論76-79
- 4.5.1 淀粉和蔗糖代謝通路基因76-77
- 4.5.2 嘌呤代謝通路基因77
- 4.5.3 TORC1的調(diào)控可能是淀粉和蔗糖代謝通路基因與嘌呤代謝通路基因形成保守負相關(guān)模式的原因77-79
- 4.5.4 通路基因中負相關(guān)模式的數(shù)目79
- 4.6 小結(jié)79-80
- 5 酵母菌應(yīng)激響應(yīng)數(shù)據(jù)中顯著變化基因的負相關(guān)模式及其保守性研究80-104
- 5.1 前言80
- 5.2 數(shù)據(jù)和方法80-83
- 5.2.1 兩個基因表達數(shù)據(jù)80-81
- 5.2.2 基因表達數(shù)據(jù)的提取和預(yù)處理81
- 5.2.3 NCFCA2算法應(yīng)用于這兩個數(shù)據(jù)集81-83
- 5.3 負相關(guān)模式的生物信息學(xué)分析83-96
- 5.4 保守性(不變性)探索96-98
- 5.5 討論98-102
- 5.5.1 應(yīng)激響應(yīng)基因98-99
- 5.5.2 核糖體蛋白基因99
- 5.5.3 TORC1的調(diào)控可能是核糖體蛋白基因與應(yīng)激響應(yīng)基因形成保守負相關(guān)模式的原因99-101
- 5.5.4 TORC1在環(huán)境應(yīng)激響應(yīng)中的作用101-102
- 5.6 小結(jié)102-104
- 6 主要結(jié)論104-108
- 6.1 主要結(jié)論104-106
- 6.2 展望106-108
- 致謝108-110
- 參考文獻110-128
- 附錄128
- A. 作者在攻讀學(xué)位期間發(fā)表的論文目錄128
- B. 作者在攻讀學(xué)位期間參加的科研項目目錄128
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 張立新,聞繼威;弱負相關(guān)隨機場的兩個強收斂定理[J];高校應(yīng)用數(shù)學(xué)學(xué)報A輯(中文版);2000年03期
2 吳群英;負相關(guān)隨機序列的收斂性質(zhì)[J];廣西科學(xué);2000年02期
3 ;[J];;年期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 錢鐵云;馮小年;王元珍;;超越支持度-置信度框架的負相關(guān)對規(guī)則挖掘[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2005年
中國重要報紙全文數(shù)據(jù)庫 前7條
1 中信銀行金融市場部 胡明;美元與大宗商品負相關(guān)將延續(xù)[N];中國證券報;2013年
2 本報見習(xí)記者 馬爽;11家未設(shè)營業(yè)部期貨公司去年虧27.48萬元 營業(yè)部數(shù)量與盈利負相關(guān)[N];證券日報;2012年
3 記者 朱周良;打破“負相關(guān)”傳統(tǒng) 美元與美股比翼齊飛[N];上海證券報;2013年
4 記者 葉苗 編輯 楊曉坤;避險情緒轉(zhuǎn)為看好經(jīng)濟前景 美元商品“負相關(guān)弱化”或成主旋律[N];上海證券報;2010年
5 金水;短期看國際油價與股市負相關(guān)[N];華夏時報;2008年
6 本報記者 朱周良;美元與美股的負相關(guān)或暫告段落[N];上海證券報;2009年
7 白洋 編譯;全要素生產(chǎn)率與勞動時間負相關(guān)[N];中國社會科學(xué)報;2013年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 涂旭東;負相關(guān)的基因表達模式及其保守性研究[D];重慶大學(xué);2015年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條
1 莊瑩瑩;負相關(guān)序列的收斂性[D];哈爾濱工業(yè)大學(xué);2009年
2 張淑俠;負相關(guān)加權(quán)和的收斂性[D];哈爾濱工業(yè)大學(xué);2011年
3 林超;負相關(guān)模擬電路的演化模型研究[D];中國科學(xué)技術(shù)大學(xué);2014年
本文關(guān)鍵詞:負相關(guān)的基因表達模式及其保守性研究,,由筆耕文化傳播整理發(fā)布。
本文編號:394250
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/394250.html