基于Kullback-Leibler距離對致病位點位置的識別
發(fā)布時間:2020-11-19 06:24
通過對KullbackLeibler距離的研究,計算出基因位點分布之間的KullbackLeibler距離,根據KullbackLeibler距離值找出某種疾病最有可能的一個或幾個致病位點的位置信息,實現(xiàn)對致病位點的位置信息的快速識別,為遺傳學中發(fā)現(xiàn)遺傳病或性狀的遺傳機理方法做出參考.
【部分圖文】:
I,X2,?X3分別是后5Q0個患者每個位點的每種堿基組合編碼情況出現(xiàn)的次數,這里把有病??和沒病的人們相應位點出現(xiàn)的頻率作為位點的分布概率,并結合R.統(tǒng)計軟件計算出對應的??KullbackLeibler距離,然后根據KL值的大小,很快地識別出疾病最有可能的一個或幾個致??病位點的位置信息.最后將這兩組數據按照KL距離的公式進行處理,我們分析得到當兩組??樣本數據的KL距離越大的位點信息越是可能導致患病的位點信息.用R軟件來畫出KL值??的頻數分布圖和KL值的箱圖,如下圖所示:??圖1的縱坐標表示KL值出現(xiàn)的頻數,橫坐標表示KL的取值,可以很直觀的看出大部??分位點的KL值都非常小,我們得知只有少數的一些位點對該病的影響較大;圖2從下至上??的五條水平線依次表示最小值、第一四分位點、中位數、第三四分位點、最大值.同時,我們??通過R,語言中的函數可以看出具體的數值.X朽十算得到的KL值,按照其值的大??小進行降序排列,以第一四分位點作為閾值來篩選樣本位點.這樣,我們就將原先的雑45個??位點信息,壓縮到7082個位點,完成了對樣本信息的降維處理,按照計算出的KL值的大小??降序排列,僅截取前20個位點信息結果如表2.??
【相似文獻】
本文編號:2889823
【部分圖文】:
I,X2,?X3分別是后5Q0個患者每個位點的每種堿基組合編碼情況出現(xiàn)的次數,這里把有病??和沒病的人們相應位點出現(xiàn)的頻率作為位點的分布概率,并結合R.統(tǒng)計軟件計算出對應的??KullbackLeibler距離,然后根據KL值的大小,很快地識別出疾病最有可能的一個或幾個致??病位點的位置信息.最后將這兩組數據按照KL距離的公式進行處理,我們分析得到當兩組??樣本數據的KL距離越大的位點信息越是可能導致患病的位點信息.用R軟件來畫出KL值??的頻數分布圖和KL值的箱圖,如下圖所示:??圖1的縱坐標表示KL值出現(xiàn)的頻數,橫坐標表示KL的取值,可以很直觀的看出大部??分位點的KL值都非常小,我們得知只有少數的一些位點對該病的影響較大;圖2從下至上??的五條水平線依次表示最小值、第一四分位點、中位數、第三四分位點、最大值.同時,我們??通過R,語言中的函數可以看出具體的數值.X朽十算得到的KL值,按照其值的大??小進行降序排列,以第一四分位點作為閾值來篩選樣本位點.這樣,我們就將原先的雑45個??位點信息,壓縮到7082個位點,完成了對樣本信息的降維處理,按照計算出的KL值的大小??降序排列,僅截取前20個位點信息結果如表2.??
【相似文獻】
相關期刊論文 前4條
1 王日生;R上的保持某些距離值不變的映射[J];南開大學學報(自然科學版);2003年03期
2 張世平;;一種快速識別離散系統(tǒng)階數的方法[J];吉林化工學院學報;1986年03期
3 周影輝;倪中新;謝琳;;泊松序列中變點的快速識別方法[J];統(tǒng)計與決策;2013年11期
4 張偉業(yè);魏翠萍;;基于猶豫模糊語言信息的EDAS決策方法[J];曲阜師范大學學報(自然科學版);2017年01期
本文編號:2889823
本文鏈接:http://sikaile.net/yixuelunwen/jichuyixue/2889823.html
最近更新
教材專著