基于先驗(yàn)決策模型的缺失數(shù)據(jù)譜系樹構(gòu)建方法研究
[Abstract]:Pedigree is an important part of life science research, and morphological data is an important basis for constructing paleontology pedigree. However, paleontology data often have missing information, resulting in the failure of traditional pedigree construction algorithm. To solve this problem, this paper proposes a priori decision-making model based on the lack of information. The specific research contents are as follows: (1) To solve the problem of constructing missing data pedigrees, a method of constructing pedigrees based on a prior decision model is proposed. Firstly, the original pedigrees are constructed by using a more complete set of species; then, the decision points are obtained by using attribute reduction principle, and then a prior decision is made. Finally, the position of the species with high missing data proportion in the initial pedigree tree is determined according to the model, and the pedigree tree is constructed by species grafting. The experimental results show that the average accuracy of the attribute decision-making set is about 10% higher than that of the maximum reduction method when the missing data proportion of a single species is greater than 10%. Combining the number of attributes to be reduced with the classification of combinatorial classes, a special encoding method, the corresponding fitness function and the crossover mutation method are proposed, which further improves the grafting of missing data species in the pedigree tree. The experimental results show that the average accuracy of species is up to 3.4% higher than that of the simple heuristic method. (3) In order to eliminate the parallel subtree caused by multiple grafting, a new method based on weight fitting hierarchical clustering is proposed to predict the parallel subtree. The least squares method is used to fit the attribute weights of the initial pedigree tree, and then weights the attributes of the merged species. Finally, a subtree is constructed by using the weighted hierarchical clustering method. The experimental results show that this method can predict the merged subtrees and eliminate the merged subtrees in the pedigree tree.
【學(xué)位授予單位】:西北大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:Q11;TP18
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 金勇進(jìn);調(diào)查中的數(shù)據(jù)缺失及處理(Ⅰ)——缺失數(shù)據(jù)及其影響[J];數(shù)理統(tǒng)計(jì)與管理;2001年01期
2 金勇進(jìn);缺失數(shù)據(jù)的加權(quán)調(diào)整(系列之Ⅳ)[J];數(shù)理統(tǒng)計(jì)與管理;2001年05期
3 趙慧秀;馬文卿;;帶有缺失數(shù)據(jù)的估計(jì)方程[J];曲阜師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期
4 龐新生;;缺失數(shù)據(jù)處理方法的比較[J];統(tǒng)計(jì)與決策;2010年24期
5 楊金英;崔朝杰;;圖模型方法用于二值變量相關(guān)性分析中缺失數(shù)據(jù)的估計(jì)[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2012年05期
6 帥平;李曉松;周曉華;劉玉萍;;缺失數(shù)據(jù)統(tǒng)計(jì)處理方法的研究進(jìn)展[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2013年01期
7 金勇進(jìn);缺失數(shù)據(jù)的偏差校正(系列三)[J];數(shù)理統(tǒng)計(jì)與管理;2001年04期
8 畢華,李濟(jì)洪;帶有缺失數(shù)據(jù)的聚類分析方法[J];華北工學(xué)院學(xué)報(bào);2003年05期
9 李開燦;;有缺失數(shù)據(jù)的META-MARKOV模型的局部計(jì)算[J];應(yīng)用數(shù)學(xué)學(xué)報(bào);2007年03期
10 周偉萍;張德然;楊興瓊;;具有部分缺失數(shù)據(jù)時(shí)兩個(gè)幾何總體的估計(jì)[J];長(zhǎng)春大學(xué)學(xué)報(bào);2008年02期
相關(guān)會(huì)議論文 前10條
1 耿直;葛丹丹;;縱向研究非隨機(jī)缺失數(shù)據(jù)分析[A];中國(guó)現(xiàn)場(chǎng)統(tǒng)計(jì)研究會(huì)第12屆學(xué)術(shù)年會(huì)論文集[C];2005年
2 管河山;姜青山;Steven X.Wei;;一種處理缺失數(shù)據(jù)的新方法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年
3 陳楠;劉紅云;;基于增長(zhǎng)模型的缺失數(shù)據(jù)處理方法之比較[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文集[C];2013年
4 肖進(jìn);賀昌政;;面向缺失數(shù)據(jù)的客戶價(jià)值區(qū)分集成模型研究[A];中國(guó)企業(yè)運(yùn)籌學(xué)[2010(1)][C];2010年
5 曾莉;張淑梅;辛濤;;IRT模型中缺失數(shù)據(jù)處理方法比較[A];第十一屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2007年
6 孫玲;劉浩;袁長(zhǎng)亮;;北京市城市快速路微波檢測(cè)缺失數(shù)據(jù)分析[A];2008第四屆中國(guó)智能交通年會(huì)論文集[C];2008年
7 張香云;;基于EM算法缺失數(shù)據(jù)下混合模型的參數(shù)估計(jì)[A];第十三屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2011年
8 李曉煦;侯杰泰;;結(jié)構(gòu)方程中缺失數(shù)據(jù)的處理:FIML,EM與MI[A];全國(guó)教育與心理統(tǒng)計(jì)測(cè)量學(xué)術(shù)年會(huì)論文摘要集[C];2006年
9 張敬才;張國(guó)伍;;運(yùn)用模糊數(shù)學(xué)建立投資決策模型[A];模糊數(shù)學(xué)和系統(tǒng)成果會(huì)論文集[C];1991年
10 黃漫宇;;零售商引入自有品牌的決策模型分析[A];首屆中部地區(qū)商業(yè)經(jīng)濟(jì)論壇論文集[C];2007年
相關(guān)重要報(bào)紙文章 前1條
1 趙瑩;拋棄決策模型 使用決策模型[N];中國(guó)經(jīng)營(yíng)報(bào);2007年
相關(guān)博士學(xué)位論文 前10條
1 馬友;基于QoS缺失數(shù)據(jù)預(yù)測(cè)的個(gè)性化Web服務(wù)推薦方法研究[D];北京郵電大學(xué);2015年
2 彭清艷;廣義函數(shù)型回歸模型及缺失數(shù)據(jù)模型[D];云南大學(xué);2016年
3 龔奇源;面向數(shù)據(jù)發(fā)布的數(shù)據(jù)匿名技術(shù)研究[D];東南大學(xué);2016年
4 駱汝九;多指標(biāo)綜合評(píng)價(jià)的非參數(shù)方法和缺失數(shù)據(jù)的聚類方法研究[D];揚(yáng)州大學(xué);2011年
5 祝麗萍;幾種缺失數(shù)據(jù)和高維數(shù)據(jù)模型的統(tǒng)計(jì)分析[D];山東大學(xué);2012年
6 賈博婷;缺失數(shù)據(jù)下一類整值時(shí)間序列的統(tǒng)計(jì)推斷[D];吉林大學(xué);2014年
7 劉旭;在完全和缺失數(shù)據(jù)下基于非光滑估計(jì)方程的統(tǒng)計(jì)推斷與變量選擇問題[D];云南大學(xué);2010年
8 趙鵬飛;混沌數(shù)據(jù)恢復(fù)與非線性系統(tǒng)的模型參考控制[D];吉林大學(xué);2010年
9 陸福忠;數(shù)據(jù)缺失下的分布函數(shù)估計(jì)問題[D];復(fù)旦大學(xué);2007年
10 趙慧秀;可交換的兩值數(shù)據(jù)的統(tǒng)計(jì)分析[D];東北師范大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 楊利華;缺失數(shù)據(jù)的處理方法研究及應(yīng)用[D];景德鎮(zhèn)陶瓷學(xué)院;2011年
2 袁中萸;多元線性回歸模型中缺失數(shù)據(jù)填補(bǔ)方法的效果比較[D];中南大學(xué);2008年
3 褚培肖;缺失數(shù)據(jù)下的有限混合計(jì)數(shù)數(shù)據(jù)模型的統(tǒng)計(jì)推斷研究[D];昆明理工大學(xué);2015年
4 申寧寧;縱向研究缺失數(shù)據(jù)多重填補(bǔ)及混合效應(yīng)模型分析[D];山西醫(yī)科大學(xué);2015年
5 李少瓊;縱向研究二分類缺失數(shù)據(jù)處理及加權(quán)估計(jì)方程的應(yīng)用[D];山西醫(yī)科大學(xué);2015年
6 高宇釗;比值缺失數(shù)據(jù)的多重估算與心臟康復(fù)二級(jí)預(yù)防干預(yù)效果評(píng)價(jià)及應(yīng)用[D];山西醫(yī)科大學(xué);2015年
7 李順靜;基于EM算法的缺失數(shù)據(jù)的統(tǒng)計(jì)分析及應(yīng)用[D];重慶工商大學(xué);2015年
8 汪靜波;Logistic回歸模型中缺失數(shù)據(jù)的處理[D];南京大學(xué);2015年
9 朱建斐;數(shù)據(jù)集缺失數(shù)據(jù)恢復(fù)算法研究[D];西安電子科技大學(xué);2015年
10 母建熊;基于飽和模型的帶有缺失的可交換兩值數(shù)據(jù)分析[D];東南大學(xué);2015年
,本文編號(hào):2214532
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2214532.html