遺傳聚類算法的改進及其在基因表達數(shù)據(jù)分析中的應用
發(fā)布時間:2021-10-08 02:17
近年來,cDNA微陣列技術的出現(xiàn)和應用,使得基因表達數(shù)據(jù)被大量檢測出來,從而為人類在分子層級分析疾病提供了充足的樣本數(shù)據(jù)。而如何通過海量的基因表達數(shù)據(jù)挖掘出有用的信息,便成了當前的研究熱點。聚類算法作為數(shù)據(jù)挖掘中的重要算法,是對基因表達數(shù)據(jù)分析的一個有效手段,科研人員常利用聚類算法找出相似基因,從而利用已知的基因表達數(shù)據(jù)分析出樣本的顯著性特點。在眾多聚類算法中,k-means作為最常用的聚類算法之一,常用在基因表達數(shù)據(jù)的分析中。但k-means本身具有初始中心點敏感,局部收斂等問題,遺傳算法作為求解多目標優(yōu)化問題的一個常用手段,可以有效地提升k-means的聚類效果。本文研究并編碼實現(xiàn)了遺傳聚類(遺傳k-means算法、遺傳k-meanS++算法);為了提升遺傳聚類算法的收斂速度和種群多樣性對遺傳聚類算法進行了改進,并用實驗驗證了改進算法的有效性,進一步將該算法運用于基因表達數(shù)據(jù)分析領域。具體改進之處如下:(1)初始種群的選擇,在遺傳聚類算法中,一個進化個體代表著一種聚類中心點的分布方案,此時的初始種群相當于k-means聚類中的初始中心點集合。而在基因表達數(shù)據(jù)中存在著大量的無關基因,...
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
圖1-1.DNA中心法則??Fig?1?-1.?DNA?center?rule??
個人不同時期之間的差別,這也是個體間差異性的主要原因。??基因將DNA序列中的遺傳信息轉換為蛋白質的過程,稱為基因表達�;�??表達的過程遵循DNA中心法則,如圖1-1所示。由DNA中心法則可知,基因??無法直接合成蛋白質,而是先通過基因轉錄將DNA轉錄為mRNA,接著通過基??因翻譯,將mRNA翻譯成相關的蛋白質。??^ ̄^?u?.1—1?翮譯—??DNA?_? ̄n?mRNA???蛋白質??逆轉策??圖1-1.DNA中心法則??Fig?1?-1.?DNA?center?rule??在整個基因表達過程中,DNA需要通過轉錄轉化為mRNA,再由mRNA翻??譯成相應的蛋白質,從而產生不同個體的生物性狀。這里mRNA起到了信息傳??遞的作用,也間接體現(xiàn)了各個基因的活躍程度。因此,我們可以通過測量mRNA??的轉錄豐度來作為基因的表達水平。??1??
圖2-3.遺傳算法的基本流程??Fig2-3.?Flow?chart?of?genetic??由圖2-3可知,遺傳算法在求解多目標優(yōu)化問題過程中,求解種群需要經(jīng)過??選擇、交叉、變異等進化算子才能逐步逼近最優(yōu)解,而在進化過程中,每一過程??的介紹如下所示。??(1)
【參考文獻】:
期刊論文
[1]基于時序加權PPI網(wǎng)絡的關鍵蛋白質識別[J]. 胡健,朱海灣,毛伊敏. 計算機工程與應用. 2019(23)
[2]C4玉米中光呼吸銨轉運蛋白候選基因的確定[J]. 李享,孫寧,劉征. 分子植物育種. 2019(23)
[3]精英遺傳K-medoids聚類算法[J]. 宋飛豹,賈瑞玉. 計算機工程與應用. 2018(22)
[4]一種MapReduce架構下基于遺傳算法的K-Medoids聚類[J]. 賴向陽,宮秀軍,韓來明. 計算機科學. 2017(03)
[5]局部子空間聚類[J]. 劉展杰,陳曉云. 自動化學報. 2016(08)
[6]基于強類別特征近鄰傳播的半監(jiān)督文本聚類[J]. 文翰,肖南峰. 模式識別與人工智能. 2014(07)
[7]基于MapReduce的基因數(shù)據(jù)密度層次聚類算法[J]. 涂金金,楊明,郭麗娜. 中國科學技術大學學報. 2014(07)
[8]一種改進的譜聚類算法及其在基因表達譜分析中的應用[J]. 葛芳,王年,郭秀麗. 安徽大學學報(自然科學版). 2012(05)
[9]雙精英協(xié)同進化遺傳算法[J]. 劉全,王曉燕,傅啟明,張永剛,章曉芳. 軟件學報. 2012(04)
[10]一種基于動態(tài)遺傳算法的聚類新方法[J]. 何宏,譚永紅. 電子學報. 2012(02)
博士論文
[1]數(shù)據(jù)挖掘在癌癥細胞增殖機制分析中的應用研究[D]. 孫慧妍.吉林大學 2018
[2]基因表達數(shù)據(jù)的相似性度量和特征提取研究[D]. 王文俊.西安電子科技大學 2011
碩士論文
[1]基于基因表達數(shù)據(jù)的癌癥共性分析方法研究[D]. 胡心穎.中國科學技術大學 2018
[2]一種新的混合遺傳的基因聚類方法[D]. 王化楠.大連理工大學 2014
本文編號:3423236
【文章來源】:安徽大學安徽省 211工程院校
【文章頁數(shù)】:72 頁
【學位級別】:碩士
【部分圖文】:
圖1-1.DNA中心法則??Fig?1?-1.?DNA?center?rule??
個人不同時期之間的差別,這也是個體間差異性的主要原因。??基因將DNA序列中的遺傳信息轉換為蛋白質的過程,稱為基因表達�;�??表達的過程遵循DNA中心法則,如圖1-1所示。由DNA中心法則可知,基因??無法直接合成蛋白質,而是先通過基因轉錄將DNA轉錄為mRNA,接著通過基??因翻譯,將mRNA翻譯成相關的蛋白質。??^ ̄^?u?.1—1?翮譯—??DNA?_? ̄n?mRNA???蛋白質??逆轉策??圖1-1.DNA中心法則??Fig?1?-1.?DNA?center?rule??在整個基因表達過程中,DNA需要通過轉錄轉化為mRNA,再由mRNA翻??譯成相應的蛋白質,從而產生不同個體的生物性狀。這里mRNA起到了信息傳??遞的作用,也間接體現(xiàn)了各個基因的活躍程度。因此,我們可以通過測量mRNA??的轉錄豐度來作為基因的表達水平。??1??
圖2-3.遺傳算法的基本流程??Fig2-3.?Flow?chart?of?genetic??由圖2-3可知,遺傳算法在求解多目標優(yōu)化問題過程中,求解種群需要經(jīng)過??選擇、交叉、變異等進化算子才能逐步逼近最優(yōu)解,而在進化過程中,每一過程??的介紹如下所示。??(1)
【參考文獻】:
期刊論文
[1]基于時序加權PPI網(wǎng)絡的關鍵蛋白質識別[J]. 胡健,朱海灣,毛伊敏. 計算機工程與應用. 2019(23)
[2]C4玉米中光呼吸銨轉運蛋白候選基因的確定[J]. 李享,孫寧,劉征. 分子植物育種. 2019(23)
[3]精英遺傳K-medoids聚類算法[J]. 宋飛豹,賈瑞玉. 計算機工程與應用. 2018(22)
[4]一種MapReduce架構下基于遺傳算法的K-Medoids聚類[J]. 賴向陽,宮秀軍,韓來明. 計算機科學. 2017(03)
[5]局部子空間聚類[J]. 劉展杰,陳曉云. 自動化學報. 2016(08)
[6]基于強類別特征近鄰傳播的半監(jiān)督文本聚類[J]. 文翰,肖南峰. 模式識別與人工智能. 2014(07)
[7]基于MapReduce的基因數(shù)據(jù)密度層次聚類算法[J]. 涂金金,楊明,郭麗娜. 中國科學技術大學學報. 2014(07)
[8]一種改進的譜聚類算法及其在基因表達譜分析中的應用[J]. 葛芳,王年,郭秀麗. 安徽大學學報(自然科學版). 2012(05)
[9]雙精英協(xié)同進化遺傳算法[J]. 劉全,王曉燕,傅啟明,張永剛,章曉芳. 軟件學報. 2012(04)
[10]一種基于動態(tài)遺傳算法的聚類新方法[J]. 何宏,譚永紅. 電子學報. 2012(02)
博士論文
[1]數(shù)據(jù)挖掘在癌癥細胞增殖機制分析中的應用研究[D]. 孫慧妍.吉林大學 2018
[2]基因表達數(shù)據(jù)的相似性度量和特征提取研究[D]. 王文俊.西安電子科技大學 2011
碩士論文
[1]基于基因表達數(shù)據(jù)的癌癥共性分析方法研究[D]. 胡心穎.中國科學技術大學 2018
[2]一種新的混合遺傳的基因聚類方法[D]. 王化楠.大連理工大學 2014
本文編號:3423236
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3423236.html
最近更新
教材專著