天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

數據挖掘在統(tǒng)計工作中的應用研究

發(fā)布時間:2020-05-27 23:52
【摘要】: 論文從理論論證和實例研究兩方面展開,試圖通過對相關問題的深入研究,探索數據挖掘技術運用于政府統(tǒng)計的主要過程和一般分析方法。 經過多年的積累,當前政府統(tǒng)計工作面臨“數據豐富,但信息貧乏”的問題,且忽視了對歷史數據中隱性規(guī)律的挖掘分析,然而將基于數據倉庫的數據挖掘技術運用于政府統(tǒng)計能夠很好的解決這一問題。本文通過對統(tǒng)計數據特點的分析,提出了統(tǒng)計數據倉庫建設的原則,并據此提出了基于數據倉庫與數據挖掘技術的統(tǒng)計分析系統(tǒng)的實現架構、構建了便于進行分析的統(tǒng)計多維數據模型,并把它們應用于實證分析。在實證分析階段,將關聯(lián)及聚類算法應用于決策樹算法分析的基礎之上,算法的結合很好的保證了所分析指標的相關性及有效性。
【圖文】:

邏輯結構圖,農村經濟,哈爾濱,邏輯結構


圖 4-2 哈爾濱縣(市)農村經濟主題的星(座)型邏輯結構二、物理模型的構建物理模型設計解決的是關系模型的實現細節(jié)問題。在得到邏輯模型后,就可以著手進行對應的物理模型設計了。物理模型設計階段,詳細的定義每一個字段的類型及表之間的關系。表 4-1 至表 4-5 所示的是根據以上的邏輯模型所構造出的相應的物理模型。表 4-1 事實表:fact 農村經濟與收入列名 數據類型 允許空時間 ID Nvarchar(255) N地點 ID Nvarchar(255) N指標 ID Nvarchar(255) N農民人均純收入(元) Float Y

評估圖,決策樹,準確性


在模型評估階段,不僅要利用工具來評估模型的精確性,,還必須與統(tǒng)計業(yè)務人員討論所發(fā)現模式的意義。有時模型不包括有用的模式,這可能是由幾個原因引起的:首先,數據是完全隨機的;其次,模型中一組變量不是最適合的,可能需要反復地執(zhí)行數據清理和轉換步驟,以便派生出更有意義的變量。數據挖掘是一個循環(huán)的過程,通常要經過幾次循環(huán)才能找到適合的模型。圖 4-3 顯示的是以上十個模型的挖掘準確性比較:
【學位授予單位】:黑龍江大學
【學位級別】:碩士
【學位授予年份】:2007
【分類號】:C81

【引證文獻】

相關碩士學位論文 前2條

1 石萌;數據挖掘在醫(yī)療保險參保人員老齡化問題中的應用研究[D];貴州財經學院;2010年

2 何瑋;杭州市經濟普查數據庫系統(tǒng)設計與實現[D];浙江工業(yè)大學;2012年



本文編號:2684346

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/2684346.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶78946***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com