基于先驗決策模型的缺失數(shù)據(jù)譜系樹構建方法研究

發(fā)布時間：2018-08-31 09:05

【摘要】：譜系樹用來表示物種之間的親緣關系,是生命科學研究的重要內(nèi)容,而形態(tài)學數(shù)據(jù)是構建古生物譜系樹的重要基礎。但是,古生物形態(tài)學數(shù)據(jù)常有缺失信息,造成傳統(tǒng)譜系樹構建算法失效,針對該問題本文提出了基于先驗決策模型的缺失數(shù)據(jù)譜系樹構建方法。具體研究內(nèi)容如下:(1)針對含有缺失數(shù)據(jù)譜系樹構建的問題,提出了基于先驗決策模型的譜系樹構建方法。首先,利用較完整數(shù)據(jù)的物種集構建初始譜系樹;然后,運用屬性約簡原理得到?jīng)Q策點,進而建立先驗決策模型;最后,根據(jù)模型確定缺失數(shù)據(jù)比例較高的物種在初始譜系樹中的位置,通過物種嫁接完成譜系樹的構建。實驗結(jié)果表明,當單個物種缺失數(shù)據(jù)比例大于10%時,相比最大簡約法在平均準確率方面高出10%左右。(2)決策點中屬性決策組集合的生成是一個屬性組合優(yōu)化問題,提出了運用遺傳算法的屬性決策組集合構建方法。該方法結(jié)合待約簡屬性個數(shù)與組合類別劃分,提出了特有的編碼方式、相應的適應度函數(shù)和交叉變異方式。進一步提高了缺失數(shù)據(jù)物種在譜系樹中嫁接位置的準確性和穩(wěn)定性。實驗結(jié)果表明,本方法所構建的譜系樹在物種平均準確率方面相比簡單啟發(fā)式方法最多高出3.4%。(3)為了消除因多次嫁接而產(chǎn)生的并系子樹,提出了一種基于權值擬合層次聚類的并系子樹預測方法。首先利用最小二乘法對初始譜系樹進行屬性權值的擬合,進而對并系物種屬性進行加權,最后運用有權值層次聚類的方法構建子樹。實驗結(jié)果表明,本方法能夠?qū)Σ⑾底訕溥M行預測,最終消除了譜系樹中的并系子樹。
[Abstract]:Pedigree is an important part of life science research, and morphological data is an important basis for constructing paleontology pedigree. However, paleontology data often have missing information, resulting in the failure of traditional pedigree construction algorithm. To solve this problem, this paper proposes a priori decision-making model based on the lack of information. The specific research contents are as follows: (1) To solve the problem of constructing missing data pedigrees, a method of constructing pedigrees based on a prior decision model is proposed. Firstly, the original pedigrees are constructed by using a more complete set of species; then, the decision points are obtained by using attribute reduction principle, and then a prior decision is made. Finally, the position of the species with high missing data proportion in the initial pedigree tree is determined according to the model, and the pedigree tree is constructed by species grafting. The experimental results show that the average accuracy of the attribute decision-making set is about 10% higher than that of the maximum reduction method when the missing data proportion of a single species is greater than 10%. Combining the number of attributes to be reduced with the classification of combinatorial classes, a special encoding method, the corresponding fitness function and the crossover mutation method are proposed, which further improves the grafting of missing data species in the pedigree tree. The experimental results show that the average accuracy of species is up to 3.4% higher than that of the simple heuristic method. (3) In order to eliminate the parallel subtree caused by multiple grafting, a new method based on weight fitting hierarchical clustering is proposed to predict the parallel subtree. The least squares method is used to fit the attribute weights of the initial pedigree tree, and then weights the attributes of the merged species. Finally, a subtree is constructed by using the weighted hierarchical clustering method. The experimental results show that this method can predict the merged subtrees and eliminate the merged subtrees in the pedigree tree.
【學位授予單位】：西北大學
【學位級別】：碩士
【學位授予年份】：2017
【分類號】：Q11;TP18

【相似文獻】

相關期刊論文前10條

1 金勇進;調(diào)查中的數(shù)據(jù)缺失及處理(Ⅰ)——缺失數(shù)據(jù)及其影響[J];數(shù)理統(tǒng)計與管理;2001年01期

2 金勇進;缺失數(shù)據(jù)的加權調(diào)整(系列之Ⅳ)[J];數(shù)理統(tǒng)計與管理;2001年05期

3 趙慧秀;馬文卿;;帶有缺失數(shù)據(jù)的估計方程[J];曲阜師范大學學報(自然科學版);2009年03期

4 龐新生;;缺失數(shù)據(jù)處理方法的比較[J];統(tǒng)計與決策;2010年24期

5 楊金英;崔朝杰;;圖模型方法用于二值變量相關性分析中缺失數(shù)據(jù)的估計[J];中國衛(wèi)生統(tǒng)計;2012年05期

6 帥平;李曉松;周曉華;劉玉萍;;缺失數(shù)據(jù)統(tǒng)計處理方法的研究進展[J];中國衛(wèi)生統(tǒng)計;2013年01期

7 金勇進;缺失數(shù)據(jù)的偏差校正(系列三)[J];數(shù)理統(tǒng)計與管理;2001年04期

8 畢華,李濟洪;帶有缺失數(shù)據(jù)的聚類分析方法[J];華北工學院學報;2003年05期

9 李開燦;;有缺失數(shù)據(jù)的META-MARKOV模型的局部計算[J];應用數(shù)學學報;2007年03期

10 周偉萍;張德然;楊興瓊;;具有部分缺失數(shù)據(jù)時兩個幾何總體的估計[J];長春大學學報;2008年02期

相關會議論文前10條

1 耿直;葛丹丹;;縱向研究非隨機缺失數(shù)據(jù)分析[A];中國現(xiàn)場統(tǒng)計研究會第12屆學術年會論文集[C];2005年

2 管河山;姜青山;Steven X.Wei;;一種處理缺失數(shù)據(jù)的新方法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集（技術報告篇）[C];2004年

3 陳楠;劉紅云;;基于增長模型的缺失數(shù)據(jù)處理方法之比較[A];心理學與創(chuàng)新能力提升——第十六屆全國心理學學術會議論文集[C];2013年

4 肖進;賀昌政;;面向缺失數(shù)據(jù)的客戶價值區(qū)分集成模型研究[A];中國企業(yè)運籌學[2010(1)][C];2010年

5 曾莉;張淑梅;辛濤;;IRT模型中缺失數(shù)據(jù)處理方法比較[A];第十一屆全國心理學學術會議論文摘要集[C];2007年

6 孫玲;劉浩;袁長亮;;北京市城市快速路微波檢測缺失數(shù)據(jù)分析[A];2008第四屆中國智能交通年會論文集[C];2008年

7 張香云;;基于EM算法缺失數(shù)據(jù)下混合模型的參數(shù)估計[A];第十三屆中國管理科學學術年會論文集[C];2011年

8 李曉煦;侯杰泰;;結(jié)構方程中缺失數(shù)據(jù)的處理:FIML,EM與MI[A];全國教育與心理統(tǒng)計測量學術年會論文摘要集[C];2006年

9 張敬才;張國伍;;運用模糊數(shù)學建立投資決策模型[A];模糊數(shù)學和系統(tǒng)成果會論文集[C];1991年

10 黃漫宇;;零售商引入自有品牌的決策模型分析[A];首屆中部地區(qū)商業(yè)經(jīng)濟論壇論文集[C];2007年

相關重要報紙文章前1條

1 趙瑩;拋棄決策模型使用決策模型[N];中國經(jīng)營報;2007年

相關博士學位論文前10條

1 馬友;基于QoS缺失數(shù)據(jù)預測的個性化Web服務推薦方法研究[D];北京郵電大學;2015年

2 彭清艷;廣義函數(shù)型回歸模型及缺失數(shù)據(jù)模型[D];云南大學;2016年

3 龔奇源;面向數(shù)據(jù)發(fā)布的數(shù)據(jù)匿名技術研究[D];東南大學;2016年

4 駱汝九;多指標綜合評價的非參數(shù)方法和缺失數(shù)據(jù)的聚類方法研究[D];揚州大學;2011年

5 祝麗萍;幾種缺失數(shù)據(jù)和高維數(shù)據(jù)模型的統(tǒng)計分析[D];山東大學;2012年

6 賈博婷;缺失數(shù)據(jù)下一類整值時間序列的統(tǒng)計推斷[D];吉林大學;2014年

7 劉旭;在完全和缺失數(shù)據(jù)下基于非光滑估計方程的統(tǒng)計推斷與變量選擇問題[D];云南大學;2010年

8 趙鵬飛;混沌數(shù)據(jù)恢復與非線性系統(tǒng)的模型參考控制[D];吉林大學;2010年

9 陸福忠;數(shù)據(jù)缺失下的分布函數(shù)估計問題[D];復旦大學;2007年

10 趙慧秀;可交換的兩值數(shù)據(jù)的統(tǒng)計分析[D];東北師范大學;2009年

相關碩士學位論文前10條

1 楊利華;缺失數(shù)據(jù)的處理方法研究及應用[D];景德鎮(zhèn)陶瓷學院;2011年

2 袁中萸;多元線性回歸模型中缺失數(shù)據(jù)填補方法的效果比較[D];中南大學;2008年

3 褚培肖;缺失數(shù)據(jù)下的有限混合計數(shù)數(shù)據(jù)模型的統(tǒng)計推斷研究[D];昆明理工大學;2015年

4 申寧寧;縱向研究缺失數(shù)據(jù)多重填補及混合效應模型分析[D];山西醫(yī)科大學;2015年

5 李少瓊;縱向研究二分類缺失數(shù)據(jù)處理及加權估計方程的應用[D];山西醫(yī)科大學;2015年

6 高宇釗;比值缺失數(shù)據(jù)的多重估算與心臟康復二級預防干預效果評價及應用[D];山西醫(yī)科大學;2015年

7 李順靜;基于EM算法的缺失數(shù)據(jù)的統(tǒng)計分析及應用[D];重慶工商大學;2015年

8 汪靜波;Logistic回歸模型中缺失數(shù)據(jù)的處理[D];南京大學;2015年

9 朱建斐;數(shù)據(jù)集缺失數(shù)據(jù)恢復算法研究[D];西安電子科技大學;2015年

10 母建熊;基于飽和模型的帶有缺失的可交換兩值數(shù)據(jù)分析[D];東南大學;2015年

，

本文編號：2214532

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2214532.html

上一篇：紡絲生產(chǎn)線控制系統(tǒng)設計及智能控制算法研究
下一篇：適配體生物傳感器在赭曲霉毒素檢測中的應用

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于先驗決策模型的缺失數(shù)據(jù)譜系樹構建方法研究