基于半監(jiān)督學(xué)習(xí)的單體型組裝算法
發(fā)布時間:2021-02-16 17:20
單體型組裝(Haplotype Assembly)是根據(jù)測序得到的DNA片段通過各種模型算法來重建出生物個體的單體型。隨著人類基因組計劃(Human Genome Project,HGP)的逐漸完成,人們已經(jīng)認識到個體之間基因序列的差異是造成個體之間各種表型差異的主要原因,如發(fā)色、體型、罹患疾病的不同風(fēng)險程度等。因此分析個體的單體型在遺傳領(lǐng)域有非常重要的意義,其主要應(yīng)用有疾病診斷、藥物研究等。如果能僅通過生物手段就獲得個體正確的完整DNA序列,那么單體型組裝問題是容易解決的。然而,在實際過程中,由于生物實驗的的限制,通常僅能得到一些較短的DNA片段,并且實驗中會不可避免地發(fā)生一些測序錯誤。因此,根據(jù)一些有測序錯誤的DNA片段并結(jié)合計算機技術(shù)來組裝出錯誤最少甚至是正確的個體單體型既是目標,也是挑戰(zhàn)。機器學(xué)習(xí)領(lǐng)域的半監(jiān)督學(xué)習(xí)策略是一種科學(xué)利用無類標簽數(shù)據(jù)的學(xué)習(xí)模式,由于有標簽樣本僅占少數(shù),因此結(jié)合少量有標簽數(shù)據(jù)和大量無標簽數(shù)據(jù)來提高模型的學(xué)習(xí)性能是非常有必要的。基于以上,本文提出兩種結(jié)合半監(jiān)督學(xué)習(xí)的單體型組裝算法。K均值算法(K-Means)是機器學(xué)習(xí)中非常經(jīng)典的聚類算法,算法在迭代過程中...
【文章來源】:湖南師范大學(xué)湖南省 211工程院校
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 生物學(xué)理論基礎(chǔ)
1.2.1 染色體
1.2.2 DNA與基因
1.2.3 單體型與基因型
1.3 單體型組裝問題
1.4 研究現(xiàn)狀
1.5 主要研究內(nèi)容
第2章 基于半監(jiān)督學(xué)習(xí)的單體型組裝K均值算法
2.1 半監(jiān)督學(xué)習(xí)策略
2.1.1 半監(jiān)督學(xué)習(xí)策略的生物信息領(lǐng)域應(yīng)用
2.2 K均值算法
2.2.1 K均值算法原理
2.3 基于半監(jiān)督學(xué)習(xí)的單體型組裝K均值算法
2.3.1 預(yù)處理階段
2.3.2 基于半監(jiān)督學(xué)習(xí)的K均值聚類階段
2.3.3 單體型組裝階段
2.4 本章小結(jié)
第3章 基于半監(jiān)督學(xué)習(xí)的單體型組裝K最近鄰算法
3.1 K最近鄰算法
3.1.1 K最近鄰算法原理
3.2 基于半監(jiān)督學(xué)習(xí)的單體型組裝K最近鄰算法
3.2.1 預(yù)處理階段
3.2.2 基于半監(jiān)督學(xué)習(xí)的SKNN分類階段
3.2.3 單體型組裝階段
3.3 本章小結(jié)
第4章 實驗設(shè)計與結(jié)果分析
4.1 模擬數(shù)據(jù)的生成
4.2 模擬數(shù)據(jù)實驗結(jié)果與分析
4.3 真實數(shù)據(jù)實驗結(jié)果與分析
4.4 本章小結(jié)
總結(jié)與展望
1 總結(jié)
2 展望
參考文獻
致謝
【參考文獻】:
期刊論文
[1]重構(gòu)腫瘤克隆單體型的改進生成樹算法[J]. 耿彧,趙仲孟,劉建業(yè). 南方醫(yī)科大學(xué)學(xué)報. 2019(11)
[2]GWAS結(jié)合共表達網(wǎng)絡(luò)分析挖掘影響油菜種子硫苷積累的作用位點[J]. 劉蔚,姚敏,康郁,王美,解盼,何昕,劉忠松,官春云,錢偉,華瑋,錢論文. 農(nóng)業(yè)生物技術(shù)學(xué)報. 2019(10)
[3]半監(jiān)督聚類綜述[J]. 秦悅,丁世飛. 計算機科學(xué). 2019(09)
[4]HMGB1基因多態(tài)性與肺結(jié)核易感性的關(guān)系[J]. 袁樂永,柯尊瓊. 實用醫(yī)學(xué)雜志. 2019(14)
[5]不平衡分類的數(shù)據(jù)采樣方法綜述[J]. 劉定祥,喬少杰,張永清,韓楠,魏軍林,張榕珂,黃萍. 重慶理工大學(xué)學(xué)報(自然科學(xué)). 2019(07)
[6]MUC6基因多態(tài)性與幽門螺旋桿菌感染的關(guān)聯(lián)性研究[J]. 高芳,秦金東,馬立聰,劉得利,李晶晶,賈彥彬. 重慶醫(yī)學(xué). 2019(06)
[7]面向大數(shù)據(jù)挖掘的Hadoop框架K均值聚類算法[J]. 李爽,陳瑞瑞,林楠. 計算機工程與設(shè)計. 2018(12)
[8]K近鄰協(xié)同過濾推薦算法中的最優(yōu)近鄰參數(shù)[J]. 李曉瑜. 計算機與數(shù)字工程. 2018(08)
[9]K最近鄰算法理論與應(yīng)用綜述[J]. 毋雪雁,王水花,張煜東. 計算機工程與應(yīng)用. 2017(21)
[10]基于樣本密度的全局優(yōu)化K均值聚類算法[J]. 薛印璽,許鴻文,李羚. 計算機工程與應(yīng)用. 2018(14)
博士論文
[1]單體型組裝問題參數(shù)化建模及算法研究[D]. 謝民主.中南大學(xué) 2008
碩士論文
[1]二倍體單體型重建問題研究[D]. 鄔慧敏.廣西師范大學(xué) 2017
本文編號:3036678
【文章來源】:湖南師范大學(xué)湖南省 211工程院校
【文章頁數(shù)】:55 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 生物學(xué)理論基礎(chǔ)
1.2.1 染色體
1.2.2 DNA與基因
1.2.3 單體型與基因型
1.3 單體型組裝問題
1.4 研究現(xiàn)狀
1.5 主要研究內(nèi)容
第2章 基于半監(jiān)督學(xué)習(xí)的單體型組裝K均值算法
2.1 半監(jiān)督學(xué)習(xí)策略
2.1.1 半監(jiān)督學(xué)習(xí)策略的生物信息領(lǐng)域應(yīng)用
2.2 K均值算法
2.2.1 K均值算法原理
2.3 基于半監(jiān)督學(xué)習(xí)的單體型組裝K均值算法
2.3.1 預(yù)處理階段
2.3.2 基于半監(jiān)督學(xué)習(xí)的K均值聚類階段
2.3.3 單體型組裝階段
2.4 本章小結(jié)
第3章 基于半監(jiān)督學(xué)習(xí)的單體型組裝K最近鄰算法
3.1 K最近鄰算法
3.1.1 K最近鄰算法原理
3.2 基于半監(jiān)督學(xué)習(xí)的單體型組裝K最近鄰算法
3.2.1 預(yù)處理階段
3.2.2 基于半監(jiān)督學(xué)習(xí)的SKNN分類階段
3.2.3 單體型組裝階段
3.3 本章小結(jié)
第4章 實驗設(shè)計與結(jié)果分析
4.1 模擬數(shù)據(jù)的生成
4.2 模擬數(shù)據(jù)實驗結(jié)果與分析
4.3 真實數(shù)據(jù)實驗結(jié)果與分析
4.4 本章小結(jié)
總結(jié)與展望
1 總結(jié)
2 展望
參考文獻
致謝
【參考文獻】:
期刊論文
[1]重構(gòu)腫瘤克隆單體型的改進生成樹算法[J]. 耿彧,趙仲孟,劉建業(yè). 南方醫(yī)科大學(xué)學(xué)報. 2019(11)
[2]GWAS結(jié)合共表達網(wǎng)絡(luò)分析挖掘影響油菜種子硫苷積累的作用位點[J]. 劉蔚,姚敏,康郁,王美,解盼,何昕,劉忠松,官春云,錢偉,華瑋,錢論文. 農(nóng)業(yè)生物技術(shù)學(xué)報. 2019(10)
[3]半監(jiān)督聚類綜述[J]. 秦悅,丁世飛. 計算機科學(xué). 2019(09)
[4]HMGB1基因多態(tài)性與肺結(jié)核易感性的關(guān)系[J]. 袁樂永,柯尊瓊. 實用醫(yī)學(xué)雜志. 2019(14)
[5]不平衡分類的數(shù)據(jù)采樣方法綜述[J]. 劉定祥,喬少杰,張永清,韓楠,魏軍林,張榕珂,黃萍. 重慶理工大學(xué)學(xué)報(自然科學(xué)). 2019(07)
[6]MUC6基因多態(tài)性與幽門螺旋桿菌感染的關(guān)聯(lián)性研究[J]. 高芳,秦金東,馬立聰,劉得利,李晶晶,賈彥彬. 重慶醫(yī)學(xué). 2019(06)
[7]面向大數(shù)據(jù)挖掘的Hadoop框架K均值聚類算法[J]. 李爽,陳瑞瑞,林楠. 計算機工程與設(shè)計. 2018(12)
[8]K近鄰協(xié)同過濾推薦算法中的最優(yōu)近鄰參數(shù)[J]. 李曉瑜. 計算機與數(shù)字工程. 2018(08)
[9]K最近鄰算法理論與應(yīng)用綜述[J]. 毋雪雁,王水花,張煜東. 計算機工程與應(yīng)用. 2017(21)
[10]基于樣本密度的全局優(yōu)化K均值聚類算法[J]. 薛印璽,許鴻文,李羚. 計算機工程與應(yīng)用. 2018(14)
博士論文
[1]單體型組裝問題參數(shù)化建模及算法研究[D]. 謝民主.中南大學(xué) 2008
碩士論文
[1]二倍體單體型重建問題研究[D]. 鄔慧敏.廣西師范大學(xué) 2017
本文編號:3036678
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3036678.html
最近更新
教材專著