通過基因矩陣數(shù)據(jù)分析識別阿爾茨海默病致病基因
發(fā)布時間:2020-06-03 18:22
【摘要】:阿爾茨海默病是最常見的一種癡呆癥之一。這種疾病的特點是會導致病人的認知記憶、定向、判斷和推理等能力衰退。2006年時,全球就有2.66億阿爾茨海默病患者,預計到2050年,全球中每85個人中將會有一個是阿爾茨海默病患者。然而到目前為止,還沒有找到特別有效的措施來治療阿爾茨海默病。為了能夠徹底的治療阿爾茨海默病,就必須能夠了解阿爾茨海默病的發(fā)病原理,也就必須要找到阿爾茨海默病的致病基因。所以尋找阿爾茨海默病的致病基因是目前的一項主要研究。目前尋找阿爾茨海默病致病基因采取的主要方法,是通過分析DNA矩陣數(shù)據(jù)尋找阿爾茨海默病的候選致病基因。目前很多方法都是通過差異基因的表達分析來尋找阿爾茨海默病的致病基因。本文正是設計了算法來尋找阿爾茨海默病的致病基因。主要研究內容如下: (1)綜述了阿爾茨海默病,基因芯片技術,以及尋找阿爾茨海默病致病基因的研究現(xiàn)狀,詳細介紹了本文中所設計算法的模型及算法的具體實現(xiàn)步驟。 (2)首先應用本文的算法對DNA矩陣數(shù)據(jù)進行分析處理。并根據(jù)基因表達水平的偏離幅度得到了阿爾茨海默病的候選致病基因。并對候選致病基因進行調研,標注出一些也被其他的研究者發(fā)現(xiàn)為致病基因的基因,作為以后生物驗證的對象。實驗表明,本文的實驗結果中的候選基因有很多已經被其他的研究者證實為阿爾茨海默病的致病基因,而且一些基因生物性質也是和神經相關的。所以說,本文的實驗結果有很好的參考價值。 (3)為了使本文算法便于理解,本文詳細介紹了本文算法的數(shù)據(jù)結構和具體代碼。
【圖文】:
一個基因芯片會產生在一定的實驗條件或環(huán)境下的一列數(shù)據(jù)。而且對應了一個基因的表達水平(圖 1)。 每一列數(shù)據(jù)可以被看作為一個兩個基因芯片上的兩列數(shù)據(jù)是在不同的測試環(huán)境或條件下得到的,,兩列數(shù)據(jù)是不可比較的,相應的這兩列數(shù)據(jù)間的差異會較大,兩列離也會變大。如果兩列數(shù)據(jù)的測試環(huán)境或測試條件是相近時,那么圖 2: 實驗數(shù)據(jù)不可比較性在這個表中,從正常人體得到的第二列數(shù)據(jù) GSM21217 (已標準化)可以看作為一個 22283 維的向量.根據(jù)同樣的規(guī)則,從嚴重病人得到的 7 列數(shù)據(jù)GSM21203, GSM21206,…, GSM21229 也可以看作 7 個向量。 向量 GSM21217 和7 個向量的歐幾里德距離的平方分別被計算出來并寫在了表格中。距離越大兩個向量之間越不可比較。從這個表格中,我們可以知道第三列列數(shù)據(jù)GSM21207 與來自正常人體的數(shù)據(jù) GSM21217 是不可比較的。因此,比較來自正常人體與患者的基因表現(xiàn)水平的不同時, 就應該避免數(shù)據(jù)的不可比較性。
圖 3-a: 從正常人體與輕度病人得到的列數(shù)據(jù)之間的距離正常人體中得到 9 列數(shù)據(jù)(ctrlM ),一列數(shù)據(jù)由一次實驗(一個基因芯片)得到。同樣的,從輕度患者人體得到 7 列數(shù)據(jù)形成一個矩陣incipM,矩陣里的每列數(shù)據(jù)對應著不同的實驗。矩陣中列數(shù)據(jù)可看作為一個向量,計算出ctrlM 中向量和incipM 中每個列向量的歐幾里德的距離的平方。 得到 9 組距離值并列在表格中。圖 3-b: 從正常人體和中度病人得到的列數(shù)據(jù)之間的距離
【學位授予單位】:四川師范大學
【學位級別】:碩士
【學位授予年份】:2011
【分類號】:R749.16
本文編號:2695212
【圖文】:
一個基因芯片會產生在一定的實驗條件或環(huán)境下的一列數(shù)據(jù)。而且對應了一個基因的表達水平(圖 1)。 每一列數(shù)據(jù)可以被看作為一個兩個基因芯片上的兩列數(shù)據(jù)是在不同的測試環(huán)境或條件下得到的,,兩列數(shù)據(jù)是不可比較的,相應的這兩列數(shù)據(jù)間的差異會較大,兩列離也會變大。如果兩列數(shù)據(jù)的測試環(huán)境或測試條件是相近時,那么圖 2: 實驗數(shù)據(jù)不可比較性在這個表中,從正常人體得到的第二列數(shù)據(jù) GSM21217 (已標準化)可以看作為一個 22283 維的向量.根據(jù)同樣的規(guī)則,從嚴重病人得到的 7 列數(shù)據(jù)GSM21203, GSM21206,…, GSM21229 也可以看作 7 個向量。 向量 GSM21217 和7 個向量的歐幾里德距離的平方分別被計算出來并寫在了表格中。距離越大兩個向量之間越不可比較。從這個表格中,我們可以知道第三列列數(shù)據(jù)GSM21207 與來自正常人體的數(shù)據(jù) GSM21217 是不可比較的。因此,比較來自正常人體與患者的基因表現(xiàn)水平的不同時, 就應該避免數(shù)據(jù)的不可比較性。
圖 3-a: 從正常人體與輕度病人得到的列數(shù)據(jù)之間的距離正常人體中得到 9 列數(shù)據(jù)(ctrlM ),一列數(shù)據(jù)由一次實驗(一個基因芯片)得到。同樣的,從輕度患者人體得到 7 列數(shù)據(jù)形成一個矩陣incipM,矩陣里的每列數(shù)據(jù)對應著不同的實驗。矩陣中列數(shù)據(jù)可看作為一個向量,計算出ctrlM 中向量和incipM 中每個列向量的歐幾里德的距離的平方。 得到 9 組距離值并列在表格中。圖 3-b: 從正常人體和中度病人得到的列數(shù)據(jù)之間的距離
【學位授予單位】:四川師范大學
【學位級別】:碩士
【學位授予年份】:2011
【分類號】:R749.16
【參考文獻】
相關期刊論文 前1條
1 王艷;侯德仁;;AGTR1、AGTR2在阿爾茨海默病模型大鼠海馬中的變化[J];卒中與神經疾病;2009年06期
本文編號:2695212
本文鏈接:http://sikaile.net/yixuelunwen/jsb/2695212.html
最近更新
教材專著