低覆蓋基因組測序數(shù)據(jù)填充策略研究
發(fā)布時(shí)間:2022-02-14 18:49
基因型填充技術(shù),即利用現(xiàn)有的基因型信息,對未測定或者不完整的基因型進(jìn)行計(jì)算推斷,從而獲得更多的基因組信息。其基本原理是根據(jù)參考群體或群體內(nèi)其他個(gè)體與目標(biāo)群體的基因型數(shù)據(jù)內(nèi)的連鎖不平衡信息和重組率等構(gòu)建共有的單倍型片段,然后利用單倍型片段信息對目標(biāo)群體內(nèi)未分型位點(diǎn)進(jìn)行估算并填充完整;蛐吞畛渥鳛榛蚪M數(shù)據(jù)處理的重要工具,填充結(jié)果的好壞直接影響后續(xù)分析,為了得到好的填充結(jié)果,需要制定完善的填充策略。本研究模擬出四個(gè)親緣關(guān)系由遠(yuǎn)及近的群體共20000個(gè)個(gè)體、染色體長度為10Mb的基因組數(shù)據(jù)。將模擬后的數(shù)據(jù)按目標(biāo)群體與參考群體劃分并剔除MAF<0.01的位點(diǎn)。其中,填充驗(yàn)證(目標(biāo))群體固定為群體1內(nèi)的1 000個(gè)個(gè)體,而參考群體大小為100、1 000、3 000、5 000、10 000個(gè)個(gè)體共五個(gè)水平。按芯片數(shù)據(jù)和全基因組測序數(shù)據(jù)兩種數(shù)據(jù)類型對驗(yàn)證群體的位點(diǎn)進(jìn)行刪除,分別保留原位點(diǎn)數(shù)量的1、5、10、30、50、90%的位點(diǎn),即目標(biāo)群體位點(diǎn)占參考群體位點(diǎn)比例/SNP覆蓋度。使用Beagle5.1和Minimac4兩種軟件進(jìn)行填充,填充后計(jì)算填充可靠性、填充錯(cuò)誤率和填充耗時(shí)。比較不同...
【文章來源】:中國農(nóng)業(yè)科學(xué)院北京市
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同因素對填充可靠性的影響
中國農(nóng)業(yè)科學(xué)院碩士學(xué)位論文第二章基因型填充策略研究16大小需要達(dá)到3000以上,且目標(biāo)群體標(biāo)記比例需達(dá)到10%;利用Minimac4填充時(shí)需要標(biāo)記比例達(dá)到90%以上。注:三角形標(biāo)志虛線代表Beagle5.1,圓形標(biāo)志實(shí)線代表Minimac4。不同顏色的標(biāo)志代表不同水平。Note:ThedottedlinewithatrianglesignrepresentsBeagle5.1,andthesolidlinewitharoundsignrepresentsMinimac4.Differentcoloredsignsrepresentdifferentlevels.圖2-3.不同因素對填充錯(cuò)誤率的影響(A)參考群體大小對填充錯(cuò)誤率的影響;(B)目標(biāo)群體位點(diǎn)比例對填充錯(cuò)誤率的影響;(C)參考群體和目標(biāo)群體間的遺傳距離對填充錯(cuò)誤率的影響。Fig.2-3Theinfluenceofdifferentfactorsonimputationerrorrate(A)theinfluenceofreferencepopulationsizeonimputationerrorrate;(B)theinfluenceoftargetpopulationsiteratioonimputationerrorrate;(C)theinfluenceofgeneticdistancebetweenreferencepopulationandtargetpopulationonimputationerrorrate.表2-6不同水平填充錯(cuò)誤率統(tǒng)計(jì)信息Table2-6Thesummaryofimputationerrorrateatdifferentlevels填充軟件參考群體大小目標(biāo)群體標(biāo)記比例/%1510305090Beagle5.110017.017.614.812.011.110.7100015.610.88.27.98.99.9
中國農(nóng)業(yè)科學(xué)院碩士學(xué)位論文第二章基因型填充策略研究19注:三角形標(biāo)志虛線代表Beagle5.1,圓形標(biāo)志實(shí)線代表Minimac4。不同顏色的標(biāo)志代表不同水平。Note:ThedottedlinewithatrianglesignrepresentsBeagle5.1,andthesolidlinewitharoundsignrepresentsMinimac4.Differentcoloredsignsrepresentdifferentlevels.圖2-4.不同因素對填充可靠性的影響(A)參考群體大小對填充可靠性的影響;(B)目標(biāo)群體位點(diǎn)比例對填充可靠性的影響;(C)參考群體和目標(biāo)群體間的遺傳距離對填充可靠性的影響。Fig.2-4Theinfluenceofdifferentfactorsonimputationreliability(A)theinfluenceofreferencepopulationsizeonimputationreliability;(B)theinfluenceoftargetpopulationsiteratioonimputationreliability;(C)theinfluenceofgeneticdistancebetweenreferencepopulationandtargetpopulationonimputationreliability.表2-8不同水平填充可靠性統(tǒng)計(jì)信息Table2-8Thesummaryofimputationreliabilityatdifferentlevels填充軟件參考群體大小SNP覆蓋度/%1510305090Beagle5.11000.210.560.800.970.991.0010000.250.780.940.991.001.0030000.260.900.970.991.001.0050000.260.940.981.001.001.00
【參考文獻(xiàn)】:
期刊論文
[1]鴨胸肌肉色性狀全基因組關(guān)聯(lián)分析[J]. 劉大鵬,凡文磊,唐靜,周正奎,侯水生. 中國畜牧獸醫(yī). 2020(05)
[2]全基因組關(guān)聯(lián)分析在畜禽中的研究進(jìn)展[J]. 湯香,何俊,蔣雋. 畜牧與獸醫(yī). 2020(05)
[3]畜禽生長發(fā)育相關(guān)性狀的全基因組關(guān)聯(lián)分析研究進(jìn)展[J]. 陶林,賀小云,狄冉,劉秋月,胡文萍,王翔宇,儲明星. 中國畜牧雜志. 2019(11)
[4]北京地區(qū)大白豬基因組聯(lián)合育種研究[J]. 張金鑫,唐韶青,宋海亮,高虹,蔣堯,江一凡,彌世榮,孟慶利,于凡,肖煒,云鵬,張勤,丁向東. 中國農(nóng)業(yè)科學(xué). 2019(12)
[5]Imputation from SNP chip to sequence: a case study in a Chinese indigenous chicken population[J]. Shaopan Ye,Xiaolong Yuan,Xiran Lin,Ning Gao,Yuanyu Luo,Zanmou Chen,Jiaqi Li,Xiquan Zhang,Zhe Zhang. Journal of Animal Science and Biotechnology. 2018(02)
[6]基于育種值預(yù)測的基因組選擇方法的比較(英文)[J]. 王欣,楊澤峰,徐辰武. Science Bulletin. 2015(10)
[7]基因型填充方法介紹及比較[J]. 何桑,丁向東,張勤. 中國畜牧雜志. 2013(23)
[8]Application of imputation methods to genomic selection in Chinese Holstein cattle[J]. Ziqing Weng, Zhe Zhang, Xiangdong Ding, Weixuan Fu, Peipei Ma, Chonglong Wang and Qin Zhang * Key Laboratory of Animal Genetics Breeding and Reproduction, Ministry of Agriculture, College of Animal Science and Technology, China Agricultural University, Beijing, China. Journal of Animal Science and Biotechnology. 2012(01)
博士論文
[1]豬耳面積性狀全基因組關(guān)聯(lián)分析及主效基因探索[D]. 梁晶.中國農(nóng)業(yè)科學(xué)院 2015
碩士論文
[1]豬肋骨數(shù)性狀全基因組關(guān)聯(lián)分析及LTBP2基因的克隆與表達(dá)[D]. 岳靜偉.中國農(nóng)業(yè)科學(xué)院 2017
本文編號:3625081
【文章來源】:中國農(nóng)業(yè)科學(xué)院北京市
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【部分圖文】:
不同因素對填充可靠性的影響
中國農(nóng)業(yè)科學(xué)院碩士學(xué)位論文第二章基因型填充策略研究16大小需要達(dá)到3000以上,且目標(biāo)群體標(biāo)記比例需達(dá)到10%;利用Minimac4填充時(shí)需要標(biāo)記比例達(dá)到90%以上。注:三角形標(biāo)志虛線代表Beagle5.1,圓形標(biāo)志實(shí)線代表Minimac4。不同顏色的標(biāo)志代表不同水平。Note:ThedottedlinewithatrianglesignrepresentsBeagle5.1,andthesolidlinewitharoundsignrepresentsMinimac4.Differentcoloredsignsrepresentdifferentlevels.圖2-3.不同因素對填充錯(cuò)誤率的影響(A)參考群體大小對填充錯(cuò)誤率的影響;(B)目標(biāo)群體位點(diǎn)比例對填充錯(cuò)誤率的影響;(C)參考群體和目標(biāo)群體間的遺傳距離對填充錯(cuò)誤率的影響。Fig.2-3Theinfluenceofdifferentfactorsonimputationerrorrate(A)theinfluenceofreferencepopulationsizeonimputationerrorrate;(B)theinfluenceoftargetpopulationsiteratioonimputationerrorrate;(C)theinfluenceofgeneticdistancebetweenreferencepopulationandtargetpopulationonimputationerrorrate.表2-6不同水平填充錯(cuò)誤率統(tǒng)計(jì)信息Table2-6Thesummaryofimputationerrorrateatdifferentlevels填充軟件參考群體大小目標(biāo)群體標(biāo)記比例/%1510305090Beagle5.110017.017.614.812.011.110.7100015.610.88.27.98.99.9
中國農(nóng)業(yè)科學(xué)院碩士學(xué)位論文第二章基因型填充策略研究19注:三角形標(biāo)志虛線代表Beagle5.1,圓形標(biāo)志實(shí)線代表Minimac4。不同顏色的標(biāo)志代表不同水平。Note:ThedottedlinewithatrianglesignrepresentsBeagle5.1,andthesolidlinewitharoundsignrepresentsMinimac4.Differentcoloredsignsrepresentdifferentlevels.圖2-4.不同因素對填充可靠性的影響(A)參考群體大小對填充可靠性的影響;(B)目標(biāo)群體位點(diǎn)比例對填充可靠性的影響;(C)參考群體和目標(biāo)群體間的遺傳距離對填充可靠性的影響。Fig.2-4Theinfluenceofdifferentfactorsonimputationreliability(A)theinfluenceofreferencepopulationsizeonimputationreliability;(B)theinfluenceoftargetpopulationsiteratioonimputationreliability;(C)theinfluenceofgeneticdistancebetweenreferencepopulationandtargetpopulationonimputationreliability.表2-8不同水平填充可靠性統(tǒng)計(jì)信息Table2-8Thesummaryofimputationreliabilityatdifferentlevels填充軟件參考群體大小SNP覆蓋度/%1510305090Beagle5.11000.210.560.800.970.991.0010000.250.780.940.991.001.0030000.260.900.970.991.001.0050000.260.940.981.001.001.00
【參考文獻(xiàn)】:
期刊論文
[1]鴨胸肌肉色性狀全基因組關(guān)聯(lián)分析[J]. 劉大鵬,凡文磊,唐靜,周正奎,侯水生. 中國畜牧獸醫(yī). 2020(05)
[2]全基因組關(guān)聯(lián)分析在畜禽中的研究進(jìn)展[J]. 湯香,何俊,蔣雋. 畜牧與獸醫(yī). 2020(05)
[3]畜禽生長發(fā)育相關(guān)性狀的全基因組關(guān)聯(lián)分析研究進(jìn)展[J]. 陶林,賀小云,狄冉,劉秋月,胡文萍,王翔宇,儲明星. 中國畜牧雜志. 2019(11)
[4]北京地區(qū)大白豬基因組聯(lián)合育種研究[J]. 張金鑫,唐韶青,宋海亮,高虹,蔣堯,江一凡,彌世榮,孟慶利,于凡,肖煒,云鵬,張勤,丁向東. 中國農(nóng)業(yè)科學(xué). 2019(12)
[5]Imputation from SNP chip to sequence: a case study in a Chinese indigenous chicken population[J]. Shaopan Ye,Xiaolong Yuan,Xiran Lin,Ning Gao,Yuanyu Luo,Zanmou Chen,Jiaqi Li,Xiquan Zhang,Zhe Zhang. Journal of Animal Science and Biotechnology. 2018(02)
[6]基于育種值預(yù)測的基因組選擇方法的比較(英文)[J]. 王欣,楊澤峰,徐辰武. Science Bulletin. 2015(10)
[7]基因型填充方法介紹及比較[J]. 何桑,丁向東,張勤. 中國畜牧雜志. 2013(23)
[8]Application of imputation methods to genomic selection in Chinese Holstein cattle[J]. Ziqing Weng, Zhe Zhang, Xiangdong Ding, Weixuan Fu, Peipei Ma, Chonglong Wang and Qin Zhang * Key Laboratory of Animal Genetics Breeding and Reproduction, Ministry of Agriculture, College of Animal Science and Technology, China Agricultural University, Beijing, China. Journal of Animal Science and Biotechnology. 2012(01)
博士論文
[1]豬耳面積性狀全基因組關(guān)聯(lián)分析及主效基因探索[D]. 梁晶.中國農(nóng)業(yè)科學(xué)院 2015
碩士論文
[1]豬肋骨數(shù)性狀全基因組關(guān)聯(lián)分析及LTBP2基因的克隆與表達(dá)[D]. 岳靜偉.中國農(nóng)業(yè)科學(xué)院 2017
本文編號:3625081
本文鏈接:http://sikaile.net/projectlw/swxlw/3625081.html
最近更新
教材專著