基于全基因組SNP位點(diǎn)的羊的品種鑒別方法研究
發(fā)布時(shí)間:2020-12-22 12:22
在實(shí)際生活中,品種鑒別有著多種多樣的應(yīng)用,同時(shí)具有重要的研究價(jià)值。但是近年來針對羊的品種鑒別的相關(guān)研究較少,如今生物技術(shù)正在飛速發(fā)展中,越來越多的羊的基因表達(dá)信息可以被測定。這使得研究者能夠利用基因數(shù)據(jù)對未知品種的羊進(jìn)行分類。文中選用基因芯片技術(shù)測定羊的基因,是因?yàn)榛蛐酒夹g(shù)發(fā)展迅速現(xiàn)在已經(jīng)能夠在短時(shí)間內(nèi)迅速的獲取成千上萬的基因數(shù)據(jù)。然而此方法存在以下問題:樣本的個(gè)數(shù)不能和基因數(shù)據(jù)相匹配,導(dǎo)致用這種方法獲取的基因數(shù)據(jù)存在本高維小樣本的特點(diǎn)。本文利用的單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)數(shù)據(jù)為基因數(shù)據(jù)的一種也存在同樣的弊端,這使得眾多學(xué)者將怎樣高效的處理此類數(shù)據(jù)作為了研究的重點(diǎn)與難點(diǎn)。本文主要研究內(nèi)容為:挑選出高信息量SNP位點(diǎn)以此為特征對未知的羊的品種正確分類。在研究中主要存在兩個(gè)難點(diǎn):(1)怎樣從高維的數(shù)據(jù)中選取有效的特征;(2)如何選擇適合本文數(shù)據(jù)類型的分類算法。本文首先利用傳統(tǒng)的LSBL統(tǒng)計(jì)方法對少數(shù)樣本進(jìn)行實(shí)驗(yàn),探尋數(shù)據(jù)中蘊(yùn)含的規(guī)律并對其實(shí)現(xiàn)方法進(jìn)行改進(jìn)。最終達(dá)到降低實(shí)現(xiàn)復(fù)雜度提高計(jì)算效率的目的。由于傳統(tǒng)分析方法中沒有考慮到本...
【文章來源】:新疆大學(xué)新疆維吾爾自治區(qū) 211工程院校
【文章頁數(shù)】:63 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
SNP發(fā)生轉(zhuǎn)化示意圖
2.2.3 品種鑒別檢驗(yàn)軟件的實(shí)現(xiàn)在上一節(jié)中對 SNP 位點(diǎn)篩選后,在驗(yàn)證時(shí)利用 EXCEL 計(jì)算不同品種的對數(shù)比對不同品種作出判斷。這種驗(yàn)證方法實(shí)現(xiàn)過程較為繁瑣容易引入人為誤為了節(jié)省計(jì)算時(shí)間減少人為的錯(cuò)誤,提高運(yùn)行速度本文以 Maltab 平臺(tái)為基計(jì)了一款品種鑒別驗(yàn)證軟件。軟件界面如圖 2.2 所示。
33(a)(b)圖 4.3:(a)為 PC1 與 PC2 構(gòu)成的主成分分析圖(b)為 PC1 與 PC3 構(gòu)成的主成分分析圖4.3 利用 KNN 算法進(jìn)行品種分類在第 3.3.1 節(jié)中可以得知對于 KNN 算法其中 K 值選擇的問題尤為重要。所以我們先要將由 PCA 篩選出來的 520 個(gè) SNP 位點(diǎn)為分類特征,利用訓(xùn)練集研究
【參考文獻(xiàn)】:
期刊論文
[1]利用50K芯片數(shù)據(jù)分析中國11個(gè)地方綿羊群體的遺傳結(jié)構(gòu)[J]. 袁澤湖,王慧華,胡師金,朱才業(yè),趙福平,張莉,杜立新,魏彩虹. 畜牧獸醫(yī)學(xué)報(bào). 2016(05)
[2]SNP的研究進(jìn)展及其在家畜育種中的應(yīng)用[J]. 石磊,岳文斌. 畜禽業(yè). 2007(03)
[3]一種新的分子標(biāo)記——單核苷酸多態(tài)(SNP)[J]. 曾燕如,黃敏仁,王明庥. 南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2003(03)
[4]單核苷酸多態(tài)性的研究進(jìn)展及其應(yīng)用[J]. 包廣宇. 國外醫(yī)學(xué).遺傳學(xué)分冊. 2003(01)
[5]單核苷酸多態(tài)性的研究進(jìn)展[J]. 楊昭慶,洪坤學(xué). 國外醫(yī)學(xué).遺傳學(xué)分冊. 2000(01)
本文編號(hào):2931763
【文章來源】:新疆大學(xué)新疆維吾爾自治區(qū) 211工程院校
【文章頁數(shù)】:63 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
SNP發(fā)生轉(zhuǎn)化示意圖
2.2.3 品種鑒別檢驗(yàn)軟件的實(shí)現(xiàn)在上一節(jié)中對 SNP 位點(diǎn)篩選后,在驗(yàn)證時(shí)利用 EXCEL 計(jì)算不同品種的對數(shù)比對不同品種作出判斷。這種驗(yàn)證方法實(shí)現(xiàn)過程較為繁瑣容易引入人為誤為了節(jié)省計(jì)算時(shí)間減少人為的錯(cuò)誤,提高運(yùn)行速度本文以 Maltab 平臺(tái)為基計(jì)了一款品種鑒別驗(yàn)證軟件。軟件界面如圖 2.2 所示。
33(a)(b)圖 4.3:(a)為 PC1 與 PC2 構(gòu)成的主成分分析圖(b)為 PC1 與 PC3 構(gòu)成的主成分分析圖4.3 利用 KNN 算法進(jìn)行品種分類在第 3.3.1 節(jié)中可以得知對于 KNN 算法其中 K 值選擇的問題尤為重要。所以我們先要將由 PCA 篩選出來的 520 個(gè) SNP 位點(diǎn)為分類特征,利用訓(xùn)練集研究
【參考文獻(xiàn)】:
期刊論文
[1]利用50K芯片數(shù)據(jù)分析中國11個(gè)地方綿羊群體的遺傳結(jié)構(gòu)[J]. 袁澤湖,王慧華,胡師金,朱才業(yè),趙福平,張莉,杜立新,魏彩虹. 畜牧獸醫(yī)學(xué)報(bào). 2016(05)
[2]SNP的研究進(jìn)展及其在家畜育種中的應(yīng)用[J]. 石磊,岳文斌. 畜禽業(yè). 2007(03)
[3]一種新的分子標(biāo)記——單核苷酸多態(tài)(SNP)[J]. 曾燕如,黃敏仁,王明庥. 南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2003(03)
[4]單核苷酸多態(tài)性的研究進(jìn)展及其應(yīng)用[J]. 包廣宇. 國外醫(yī)學(xué).遺傳學(xué)分冊. 2003(01)
[5]單核苷酸多態(tài)性的研究進(jìn)展[J]. 楊昭慶,洪坤學(xué). 國外醫(yī)學(xué).遺傳學(xué)分冊. 2000(01)
本文編號(hào):2931763
本文鏈接:http://sikaile.net/yixuelunwen/dongwuyixue/2931763.html
最近更新
教材專著