天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

數(shù)據(jù)挖掘技術在區(qū)域死因登記數(shù)據(jù)中的應用研究

發(fā)布時間:2020-06-22 15:49
【摘要】:衛(wèi)生計生系統(tǒng)的死因登記數(shù)據(jù)存在巨大的價值,如何有效的挖掘出區(qū)域死因登記數(shù)據(jù)中的價值值得研究。本文主要研究如何將數(shù)據(jù)挖掘技術應用于死因登記數(shù)據(jù),包括探索性研究、傳統(tǒng)方法改進和驗證性研究等三方面,主要工作如下:1.依據(jù)數(shù)據(jù)挖掘通用流程,對死因登記數(shù)據(jù)展開探索性研究。通過對死因分布的分析挖掘,發(fā)現(xiàn)癌癥、腦血管病以及心血管病死亡占比較高,進而對于高死亡占比的重大疾病的死亡情況進行時間序列建模,并對模型的預測應用進行了討論。2.死因登記數(shù)據(jù)同時包含有序型分類變量和無序型分類變量,屬于混合型分類數(shù)據(jù)。針對傳統(tǒng)K-modes聚類算法不足,提出一種適用于混合型分類數(shù)據(jù)的K-modes聚類改進算法。改進算法對于有序型分類變量和無序型分類變量分別采用不同的距離度量,并用平均熵給變量賦予相應權重。實驗表明改進算法在聚類正確率和聚類距離指標上表現(xiàn)更優(yōu)。3.基于死因登記數(shù)據(jù)開展驗證性挖掘,研究出生日期的啟示性。研究表明“生日即忌日”現(xiàn)象廣泛存在于多種劃分的子人群中,利用隨機森林算法選擇影響該現(xiàn)象的重要特征變量發(fā)現(xiàn)最高診斷醫(yī)院、死因、受教育程度這三個重要性排在最前。關聯(lián)規(guī)則挖掘的結果也驗證了這一結果。
【學位授予單位】:南京郵電大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:R195;TP311.13
【圖文】:

流程圖,數(shù)據(jù)挖掘,流程圖,挖掘模型


業(yè)學位碩士研究生學位論文 第三章 死因登記數(shù)據(jù)挖掘流程及時間與探索性數(shù)據(jù)分析經(jīng)常交叉進行,探索性數(shù)據(jù)分析可以幫助為數(shù)據(jù)預處理找到處理的方向。此外對不同的挖掘方向,提供不同的數(shù)據(jù),要想建立好的挖掘模型也需要對數(shù)據(jù)進行預處理、探索性數(shù)據(jù)分析、挖掘模型建立這 3 步是反復進 3.1。因登記數(shù)據(jù)挖掘出有意義的知識,重在初期的探索性數(shù)據(jù)分行一些挖掘主題的確立。實際上,對于多年的死因登記數(shù)據(jù)慮,例如對于各死因的死亡人數(shù)或比例進行預測,以便政府化趨勢,此外對于一些已知的現(xiàn)象結論可從多年歷史數(shù)據(jù)分掘更加靈活,無法像前者一樣形成可重復利用的程序。

時序圖,占比,時序圖,平穩(wěn)序列


南京郵電大學專業(yè)學位碩士研究生學位論文 第三章 死因登記數(shù)據(jù)挖掘流程及時間序列建模實例這與實際更加貼近。對于非平穩(wěn)的序列,進行一階差分使其平穩(wěn),若檢驗仍不平穩(wěn),則繼續(xù)進行差分直至其檢驗平穩(wěn)。檢驗結果見表 3.5,從中可知癌癥死亡人數(shù)序列為非平穩(wěn)序列,一階差分后變?yōu)槠椒(wěn)序列,而癌癥死亡占比序列為平穩(wěn)序列。表 3.4 癌癥死亡人口建模數(shù)據(jù)(部分)日期 癌癥死亡人數(shù) 死亡總人數(shù) 癌癥死亡人數(shù)占比(%)2002-01 37 158 23.422002-02 32 92 34.782002-03 35 97 36.08… … … …2014-10 35 104 33.652014-11 38 91 41.762014-12 35 121 28.93

【參考文獻】

相關期刊論文 前10條

1 熊擁軍;劉衛(wèi)國;歐鵬杰;;模糊C-均值聚類算法的優(yōu)化[J];計算機工程與應用;2015年11期

2 王德青;朱建平;陳志強;;2000—2010年福建省人口死亡統(tǒng)計分析[J];西北人口;2014年04期

3 王歡;黃健元;;全年齡人口死亡模型構建及應用——以江蘇省為例[J];南方人口;2013年03期

4 李明江;唐穎;周力軍;;數(shù)據(jù)挖掘技術及應用[J];中國新通信;2012年22期

5 梁吉業(yè);白亮;曹付元;;基于新的距離度量的K-Modes聚類算法[J];計算機研究與發(fā)展;2010年10期

6 王宏雁;王琪;;多層多維關聯(lián)規(guī)則在交通事故研究中的應用[J];交通科學與工程;2009年01期

7 白亮;梁吉業(yè);曹付元;;基于粗糙集的改進K-Modes聚類算法[J];計算機科學;2009年01期

8 任麗君;周脈耕;王黎君;;死因登記報告系統(tǒng)現(xiàn)狀與發(fā)展[J];疾病監(jiān)測;2008年01期

9 張曉磊;;2000年以來中國人口死亡水平分死因研究[J];中國人口科學;2007年02期

10 尚威;尚寧;覃明貴;崔中發(fā);崔巖;朱揚勇;;交通事故的多維關聯(lián)規(guī)則分析[J];計算機應用與軟件;2006年02期

相關博士學位論文 前1條

1 趙春;基于數(shù)據(jù)挖掘技術的財務風險分析與預警研究[D];北京化工大學;2012年

相關碩士學位論文 前4條

1 馮龍飛;基于數(shù)據(jù)挖掘的戰(zhàn)略管理會計若干問題研究[D];集美大學;2015年

2 劉謀忠;基于數(shù)據(jù)挖掘技術的交通安全分析[D];上海交通大學;2014年

3 周怡;基于GIS的實有人口數(shù)據(jù)挖掘與可視化分析研究[D];華東師范大學;2010年

4 李瑞錄;數(shù)據(jù)挖掘技術在人口信息系統(tǒng)中的應用[D];吉林大學;2005年



本文編號:2725887

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2725887.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶92e56***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com