蟻群算法在求解阿爾茨海默病最優(yōu)微陣列上的應(yīng)用
發(fā)布時間:2020-11-21 22:09
阿爾茨海默病是一種最常見的癡呆癥。這種疾病的特點是會導(dǎo)致病人的認知記憶、定向、判斷和推理等能力衰退并最終導(dǎo)致死亡。2006年,全球就有2.66億阿爾茨海默病患者,預(yù)計到2050年,全球中每85個人中將會有一個是阿爾茨海默病患者。然而到目前為止,還沒有找到特別有效的措施來治療阿爾茨海默病。為了能夠徹底的治療阿爾茨海默病,就必須能夠了解阿爾茨海默病的發(fā)病原理,也就必須要找到阿爾茨海默病的致病基因。所以尋找阿爾茨海默病的致病基因是目前的一項主要研究。目前尋找阿爾茨海默病致病基因采取的主要方法,是通過分析DNA微陣列數(shù)據(jù)尋找阿爾茨海默病的候選致病基因。而分析DNA微陣列數(shù)據(jù)的其中一種方法是將表達相似的基因放在一起(因為它們很可能在功能上也相似)。傳統(tǒng)的聚類方法只注重聚類結(jié)果,忽略了類中數(shù)據(jù)的排列問題,然而將功能相似的基因聚在一起必須考慮基因的排列問題。因此,本文首先將求解阿爾茨海默病的全局最優(yōu)排列問題轉(zhuǎn)化為TSP問題,然后引入目前流行的智能算法——蟻群算法(Ant Colony Optimization)及其改進算法來解決此問題。主要研究內(nèi)容如下:? (1).綜述了阿爾茨海默病,基因芯片技術(shù),尋找阿爾茨海默病致病基因的研究現(xiàn)狀,以及應(yīng)用全局優(yōu)化思想求解最優(yōu)DNA微陣列序列的主要方法。? (2).首先應(yīng)用基本蟻群算法對酵母菌基因數(shù)據(jù)進行處理,并分析討論了三種度量方式在求解最優(yōu)基因序列中的優(yōu)劣;然后引入信息熵并將其作為蟻群算法的結(jié)束判據(jù),智能判斷蟻群算法的迭代次數(shù)并減少運行時間,而且在實驗結(jié)果中我們可以得出改進的蟻群算法在處理大規(guī)模數(shù)據(jù)時的優(yōu)勢更明顯;最后我們將蟻群分為兩類,并在迭代過程中減少蟻群規(guī)模,然后還以信息熵作為收斂判據(jù),在大大加快運行速度的同時獲得了與基本蟻群算法幾乎一致的解。?
【學位單位】:四川師范大學
【學位級別】:碩士
【學位年份】:2011
【中圖分類】:R749.16;TP301.6
【部分圖文】:
圖 1 自然界中的螞蟻覓食過程模擬 圖 1 中,假設(shè) A 點為螞蟻巢穴,E 點為食物源,C、H 為障礙物。由于障礙物的存在,螞蟻要想從 A 點到達 E 點,或者從 E 點返回 A 點,只能通過 H 點或 C點繞過障礙物,各點之間的距離如圖 1(a)所示。假設(shè)每個單位時間內(nèi)有 30 只螞蟻由 A 點到達 B 點,有 30 只螞蟻由 E 點到達 D 點,每只螞蟻經(jīng)過后留下的信息素為 1。設(shè)該物質(zhì)(信息素)停留時間為 1。在初始時刻,由于路徑 BH、BC、DH、DC 上信息素是相同的,則位于 B 點和 D 點的螞蟻可以隨機選擇路徑,可以認為螞蟻以相同的概率選擇 BH、BC、DH、DC,如圖 1(b)所示。經(jīng)過一個時間單位后,殘留在路徑 BCD 上的信息量是路徑 BHD 上信息量的兩倍。又經(jīng)過一段時間,將有 20 只螞蟻由 B 點和 D 點到達 C 點,有 10 只螞蟻由 B 點和 D 點到達 H 點,如圖 1(c)所示。隨著時間的推移,更多的螞蟻將選擇路徑 BCD,甚至最終將會完全選擇路徑 BCD,從而整個蟻群就找到了從蟻穴到食物源之間的最短路徑。由此可見,螞蟻個體之間的信息交換是一個正反饋過程。
結(jié)論如下: (1) 不同的度量方式將產(chǎn)生不同質(zhì)量的基因序列;(2) 與 Pearson 度量和 Euclidean 度量相比,Euclidean 度量的平方產(chǎn)生最優(yōu)的基因序列,盡管 Pearson 度量是當前最常用的基因相似性度量方式。(a) (b) (c) (d) 圖 3. 最優(yōu)序列熱圖(Heat map) 此圖是用 TreeView 軟件顯示蟻群算法求得的最優(yōu)酵母菌基因序列熱圖,(a)是原圖,(b)、(c)、(d)是用蟻群算法分別和公式(1)、(2)、(3)求得的最優(yōu)酵母菌序列熱圖。每一行表示一個基因表達數(shù)據(jù),每一列表示一個實驗條件,顏色相近的基因表示兩個基因相似。從四幅圖我們可以得出,對于蟻群算法,Euclidean 的平方能產(chǎn)生 2 個度量方式更好的基因序列,而不是經(jīng)常用的 Pearson 度量。
【參考文獻】
本文編號:2893673
【學位單位】:四川師范大學
【學位級別】:碩士
【學位年份】:2011
【中圖分類】:R749.16;TP301.6
【部分圖文】:
圖 1 自然界中的螞蟻覓食過程模擬 圖 1 中,假設(shè) A 點為螞蟻巢穴,E 點為食物源,C、H 為障礙物。由于障礙物的存在,螞蟻要想從 A 點到達 E 點,或者從 E 點返回 A 點,只能通過 H 點或 C點繞過障礙物,各點之間的距離如圖 1(a)所示。假設(shè)每個單位時間內(nèi)有 30 只螞蟻由 A 點到達 B 點,有 30 只螞蟻由 E 點到達 D 點,每只螞蟻經(jīng)過后留下的信息素為 1。設(shè)該物質(zhì)(信息素)停留時間為 1。在初始時刻,由于路徑 BH、BC、DH、DC 上信息素是相同的,則位于 B 點和 D 點的螞蟻可以隨機選擇路徑,可以認為螞蟻以相同的概率選擇 BH、BC、DH、DC,如圖 1(b)所示。經(jīng)過一個時間單位后,殘留在路徑 BCD 上的信息量是路徑 BHD 上信息量的兩倍。又經(jīng)過一段時間,將有 20 只螞蟻由 B 點和 D 點到達 C 點,有 10 只螞蟻由 B 點和 D 點到達 H 點,如圖 1(c)所示。隨著時間的推移,更多的螞蟻將選擇路徑 BCD,甚至最終將會完全選擇路徑 BCD,從而整個蟻群就找到了從蟻穴到食物源之間的最短路徑。由此可見,螞蟻個體之間的信息交換是一個正反饋過程。
結(jié)論如下: (1) 不同的度量方式將產(chǎn)生不同質(zhì)量的基因序列;(2) 與 Pearson 度量和 Euclidean 度量相比,Euclidean 度量的平方產(chǎn)生最優(yōu)的基因序列,盡管 Pearson 度量是當前最常用的基因相似性度量方式。(a) (b) (c) (d) 圖 3. 最優(yōu)序列熱圖(Heat map) 此圖是用 TreeView 軟件顯示蟻群算法求得的最優(yōu)酵母菌基因序列熱圖,(a)是原圖,(b)、(c)、(d)是用蟻群算法分別和公式(1)、(2)、(3)求得的最優(yōu)酵母菌序列熱圖。每一行表示一個基因表達數(shù)據(jù),每一列表示一個實驗條件,顏色相近的基因表示兩個基因相似。從四幅圖我們可以得出,對于蟻群算法,Euclidean 的平方能產(chǎn)生 2 個度量方式更好的基因序列,而不是經(jīng)常用的 Pearson 度量。
【參考文獻】
相關(guān)期刊論文 前1條
1 單連峰;李明;張惠丹;周寶森;;GLRT和LS_SVM應(yīng)用于基因表達數(shù)據(jù)分類[J];數(shù)學的實踐與認識;2010年09期
本文編號:2893673
本文鏈接:http://sikaile.net/yixuelunwen/jsb/2893673.html
最近更新
教材專著