基于Kullback-Leibler距離對致病位點位置的識別

發(fā)布時間：2020-11-19 06:24

　　通過對KullbackLeibler距離的研究,計算出基因位點分布之間的KullbackLeibler距離,根據(jù)KullbackLeibler距離值找出某種疾病最有可能的一個或幾個致病位點的位置信息,實現(xiàn)對致病位點的位置信息的快速識別,為遺傳學中發(fā)現(xiàn)遺傳病或性狀的遺傳機理方法做出參考.
【部分圖文】：

頻數(shù)圖,頻數(shù),取值,縱坐標

Ｉ，Ｘ２，?Ｘ３分別是后５Ｑ０個患者每個位點的每種堿基組合編碼情況出現(xiàn)的次數(shù)，這里把有病??和沒病的人們相應位點出現(xiàn)的頻率作為位點的分布概率，并結(jié)合Ｒ．統(tǒng)計軟件計算出對應的??ＫｕｌｌｂａｃｋＬｅｉｂｌｅｒ距離，然后根據(jù)ＫＬ值的大小，很快地識別出疾病最有可能的一個或幾個致??病位點的位置信息．最后將這兩組數(shù)據(jù)按照ＫＬ距離的公式進行處理，我們分析得到當兩組??樣本數(shù)據(jù)的ＫＬ距離越大的位點信息越是可能導致患病的位點信息．用Ｒ軟件來畫出ＫＬ值??的頻數(shù)分布圖和ＫＬ值的箱圖，如下圖所示：??圖１的縱坐標表示ＫＬ值出現(xiàn)的頻數(shù)，橫坐標表示ＫＬ的取值，可以很直觀的看出大部??分位點的ＫＬ值都非常小，我們得知只有少數(shù)的一些位點對該病的影響較大；圖２從下至上??的五條水平線依次表示最小值、第一四分位點、中位數(shù)、第三四分位點、最大值．同時，我們??通過Ｒ，語言中的函數(shù)可以看出具體的數(shù)值．Ｘ朽十算得到的ＫＬ值，按照其值的大??小進行降序排列，以第一四分位點作為閾值來篩選樣本位點．這樣，我們就將原先的雑４５個??位點信息，壓縮到７０８２個位點，完成了對樣本信息的降維處理，按照計算出的ＫＬ值的大小??降序排列，僅截取前２０個位點信息結(jié)果如表２．??
【相似文獻】

相關期刊論文前4條

1 王日生;R上的保持某些距離值不變的映射[J];南開大學學報(自然科學版);2003年03期

2 張世平;;一種快速識別離散系統(tǒng)階數(shù)的方法[J];吉林化工學院學報;1986年03期

3 周影輝;倪中新;謝琳;;泊松序列中變點的快速識別方法[J];統(tǒng)計與決策;2013年11期

4 張偉業(yè);魏翠萍;;基于猶豫模糊語言信息的EDAS決策方法[J];曲阜師范大學學報(自然科學版);2017年01期

本文編號：2889823

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/yixuelunwen/jichuyixue/2889823.html

上一篇：單細胞長鏈非編碼RNA圖譜繪制結(jié)合功能篩選揭示H19對于造血干細胞發(fā)育至關重要
下一篇：單鉗道內(nèi)鏡下經(jīng)自然腔道胃空腸吻合術在胃出口道梗阻中的初步探索

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于Kullback-Leibler距離對致病位點位置的識別