天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于半監(jiān)督學(xué)習(xí)的單體型組裝算法

發(fā)布時(shí)間:2021-02-16 17:20
  單體型組裝(Haplotype Assembly)是根據(jù)測(cè)序得到的DNA片段通過(guò)各種模型算法來(lái)重建出生物個(gè)體的單體型。隨著人類基因組計(jì)劃(Human Genome Project,HGP)的逐漸完成,人們已經(jīng)認(rèn)識(shí)到個(gè)體之間基因序列的差異是造成個(gè)體之間各種表型差異的主要原因,如發(fā)色、體型、罹患疾病的不同風(fēng)險(xiǎn)程度等。因此分析個(gè)體的單體型在遺傳領(lǐng)域有非常重要的意義,其主要應(yīng)用有疾病診斷、藥物研究等。如果能僅通過(guò)生物手段就獲得個(gè)體正確的完整DNA序列,那么單體型組裝問(wèn)題是容易解決的。然而,在實(shí)際過(guò)程中,由于生物實(shí)驗(yàn)的的限制,通常僅能得到一些較短的DNA片段,并且實(shí)驗(yàn)中會(huì)不可避免地發(fā)生一些測(cè)序錯(cuò)誤。因此,根據(jù)一些有測(cè)序錯(cuò)誤的DNA片段并結(jié)合計(jì)算機(jī)技術(shù)來(lái)組裝出錯(cuò)誤最少甚至是正確的個(gè)體單體型既是目標(biāo),也是挑戰(zhàn)。機(jī)器學(xué)習(xí)領(lǐng)域的半監(jiān)督學(xué)習(xí)策略是一種科學(xué)利用無(wú)類標(biāo)簽數(shù)據(jù)的學(xué)習(xí)模式,由于有標(biāo)簽樣本僅占少數(shù),因此結(jié)合少量有標(biāo)簽數(shù)據(jù)和大量無(wú)標(biāo)簽數(shù)據(jù)來(lái)提高模型的學(xué)習(xí)性能是非常有必要的;谝陨,本文提出兩種結(jié)合半監(jiān)督學(xué)習(xí)的單體型組裝算法。K均值算法(K-Means)是機(jī)器學(xué)習(xí)中非常經(jīng)典的聚類算法,算法在迭代過(guò)程中... 

【文章來(lái)源】:湖南師范大學(xué)湖南省 211工程院校

【文章頁(yè)數(shù)】:55 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景及意義
    1.2 生物學(xué)理論基礎(chǔ)
        1.2.1 染色體
        1.2.2 DNA與基因
        1.2.3 單體型與基因型
    1.3 單體型組裝問(wèn)題
    1.4 研究現(xiàn)狀
    1.5 主要研究?jī)?nèi)容
第2章 基于半監(jiān)督學(xué)習(xí)的單體型組裝K均值算法
    2.1 半監(jiān)督學(xué)習(xí)策略
        2.1.1 半監(jiān)督學(xué)習(xí)策略的生物信息領(lǐng)域應(yīng)用
    2.2 K均值算法
        2.2.1 K均值算法原理
    2.3 基于半監(jiān)督學(xué)習(xí)的單體型組裝K均值算法
        2.3.1 預(yù)處理階段
        2.3.2 基于半監(jiān)督學(xué)習(xí)的K均值聚類階段
        2.3.3 單體型組裝階段
    2.4 本章小結(jié)
第3章 基于半監(jiān)督學(xué)習(xí)的單體型組裝K最近鄰算法
    3.1 K最近鄰算法
        3.1.1 K最近鄰算法原理
    3.2 基于半監(jiān)督學(xué)習(xí)的單體型組裝K最近鄰算法
        3.2.1 預(yù)處理階段
        3.2.2 基于半監(jiān)督學(xué)習(xí)的SKNN分類階段
        3.2.3 單體型組裝階段
    3.3 本章小結(jié)
第4章 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
    4.1 模擬數(shù)據(jù)的生成
    4.2 模擬數(shù)據(jù)實(shí)驗(yàn)結(jié)果與分析
    4.3 真實(shí)數(shù)據(jù)實(shí)驗(yàn)結(jié)果與分析
    4.4 本章小結(jié)
總結(jié)與展望
    1 總結(jié)
    2 展望
參考文獻(xiàn)
致謝


【參考文獻(xiàn)】:
期刊論文
[1]重構(gòu)腫瘤克隆單體型的改進(jìn)生成樹算法[J]. 耿彧,趙仲孟,劉建業(yè).  南方醫(yī)科大學(xué)學(xué)報(bào). 2019(11)
[2]GWAS結(jié)合共表達(dá)網(wǎng)絡(luò)分析挖掘影響油菜種子硫苷積累的作用位點(diǎn)[J]. 劉蔚,姚敏,康郁,王美,解盼,何昕,劉忠松,官春云,錢偉,華瑋,錢論文.  農(nóng)業(yè)生物技術(shù)學(xué)報(bào). 2019(10)
[3]半監(jiān)督聚類綜述[J]. 秦悅,丁世飛.  計(jì)算機(jī)科學(xué). 2019(09)
[4]HMGB1基因多態(tài)性與肺結(jié)核易感性的關(guān)系[J]. 袁樂(lè)永,柯尊瓊.  實(shí)用醫(yī)學(xué)雜志. 2019(14)
[5]不平衡分類的數(shù)據(jù)采樣方法綜述[J]. 劉定祥,喬少杰,張永清,韓楠,魏軍林,張榕珂,黃萍.  重慶理工大學(xué)學(xué)報(bào)(自然科學(xué)). 2019(07)
[6]MUC6基因多態(tài)性與幽門螺旋桿菌感染的關(guān)聯(lián)性研究[J]. 高芳,秦金東,馬立聰,劉得利,李晶晶,賈彥彬.  重慶醫(yī)學(xué). 2019(06)
[7]面向大數(shù)據(jù)挖掘的Hadoop框架K均值聚類算法[J]. 李爽,陳瑞瑞,林楠.  計(jì)算機(jī)工程與設(shè)計(jì). 2018(12)
[8]K近鄰協(xié)同過(guò)濾推薦算法中的最優(yōu)近鄰參數(shù)[J]. 李曉瑜.  計(jì)算機(jī)與數(shù)字工程. 2018(08)
[9]K最近鄰算法理論與應(yīng)用綜述[J]. 毋雪雁,王水花,張煜東.  計(jì)算機(jī)工程與應(yīng)用. 2017(21)
[10]基于樣本密度的全局優(yōu)化K均值聚類算法[J]. 薛印璽,許鴻文,李羚.  計(jì)算機(jī)工程與應(yīng)用. 2018(14)

博士論文
[1]單體型組裝問(wèn)題參數(shù)化建模及算法研究[D]. 謝民主.中南大學(xué) 2008

碩士論文
[1]二倍體單體型重建問(wèn)題研究[D]. 鄔慧敏.廣西師范大學(xué) 2017



本文編號(hào):3036678

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3036678.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5ff13***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com