中國經(jīng)濟(jì)普查的數(shù)據(jù)挖掘方法研究
本文關(guān)鍵詞:中國經(jīng)濟(jì)普查的數(shù)據(jù)挖掘方法研究,由筆耕文化傳播整理發(fā)布。
【摘要】: 第一次全國經(jīng)濟(jì)普查是我國經(jīng)濟(jì)發(fā)展進(jìn)入21世紀(jì)后進(jìn)行的一項重大國情國力調(diào)查,是黨中央、國務(wù)院為正確認(rèn)識國情、準(zhǔn)確把握國力、科學(xué)制定國策而采取的一項重要舉措。只有通過經(jīng)濟(jì)普查,才能比較準(zhǔn)確地把握中國經(jīng)濟(jì)變化的規(guī)律和趨勢,正確制定經(jīng)濟(jì)政策和社會經(jīng)濟(jì)發(fā)展規(guī)劃,進(jìn)一步控制經(jīng)濟(jì)增長,提高經(jīng)濟(jì)發(fā)展速度,促進(jìn)經(jīng)濟(jì)和社會協(xié)調(diào)發(fā)展,推動可持續(xù)發(fā)展戰(zhàn)略的實施。在這次經(jīng)濟(jì)普查中,從國民經(jīng)濟(jì)行業(yè)分類的具體構(gòu)成來看,涉及到19個大的行業(yè)歸類,875個行業(yè)小類。可以說這次經(jīng)濟(jì)普查提供的數(shù)據(jù)是非常完整的。面對普查之后的海量數(shù)據(jù)存儲,國家更需要有力的數(shù)據(jù)分析工具以及方法將豐富的數(shù)據(jù)轉(zhuǎn)換成有價值的知識,否則大量的數(shù)據(jù)將成為數(shù)據(jù)豐富,但信息貧乏的“數(shù)據(jù)墳?zāi)埂薄?數(shù)據(jù)挖掘技術(shù)正是從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取有潛在應(yīng)用價值的信息或模式,旨在幫助人們從海量數(shù)據(jù)中發(fā)現(xiàn)有價值的信息。如何從歷史數(shù)據(jù)中及時發(fā)現(xiàn)有用的知識,從而挖掘出其潛在的價值,提高其利用率,是信息處理技術(shù)研究領(lǐng)域的一項重要課題。 本論文把視角放在中國經(jīng)濟(jì)普查的數(shù)據(jù)挖掘的方法研究上去,,所以論文研究的主要內(nèi)容是借助一般數(shù)據(jù)挖掘和數(shù)據(jù)倉庫理論以及相關(guān)回歸等理論,探索出符合中國經(jīng)濟(jì)普查的數(shù)據(jù)挖掘技術(shù)的方法。論文全面闡述第一次全國經(jīng)濟(jì)普查統(tǒng)計分類標(biāo)準(zhǔn)與數(shù)據(jù)表的審核關(guān)系以及數(shù)據(jù)處理方案,建立經(jīng)濟(jì)普查數(shù)據(jù)倉庫及算法的選擇,并以SQL工具對經(jīng)濟(jì)普查數(shù)據(jù)挖掘系統(tǒng)進(jìn)行具體實現(xiàn)與運行,并提出維護(hù)好數(shù)據(jù)挖掘系統(tǒng)的建議。
【關(guān)鍵詞】:經(jīng)濟(jì)普查 數(shù)據(jù)挖掘 數(shù)據(jù)倉庫
【學(xué)位授予單位】:東北林業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2007
【分類號】:F222
【目錄】:
- 摘要3-4
- Abstract4-8
- 1 緒論8-18
- 1.1 研究背景及問題的提出8-9
- 1.2 研究的目的和意義9-11
- 1.2.1 研究的目的9
- 1.2.2 研究的意義9-11
- 1.3 國內(nèi)外研究現(xiàn)狀11-15
- 1.3.1 國內(nèi)外數(shù)據(jù)挖掘技術(shù)研究現(xiàn)狀11-13
- 1.3.2 國內(nèi)外數(shù)據(jù)挖掘技術(shù)應(yīng)用現(xiàn)狀13-14
- 1.3.3 國內(nèi)外經(jīng)濟(jì)普查實踐與數(shù)據(jù)開發(fā)現(xiàn)狀14-15
- 1.4 研究的思路和方法15-16
- 1.5 研究內(nèi)容16
- 1.6 技術(shù)路線16
- 1.7 本章小結(jié)16-18
- 2 相關(guān)理論基礎(chǔ)及概念界定18-32
- 2.1 數(shù)據(jù)挖掘理論18-24
- 2.1.1 知識發(fā)現(xiàn)中的數(shù)據(jù)挖掘18-19
- 2.1.2 數(shù)據(jù)挖掘的內(nèi)涵19
- 2.1.3 數(shù)據(jù)挖掘的基本技術(shù)19-20
- 2.1.4 數(shù)據(jù)挖掘概念與其他概念的區(qū)分20-22
- 2.1.5 Analysis Services數(shù)據(jù)分析工具22-23
- 2.1.6 SQL Server數(shù)據(jù)倉庫環(huán)境23-24
- 2.2 數(shù)據(jù)倉庫理論24-26
- 2.2.1 數(shù)據(jù)倉庫的定義24
- 2.2.2 數(shù)據(jù)倉庫的主要特征24
- 2.2.3 聯(lián)機(jī)分析處理24-25
- 2.2.4 數(shù)據(jù)倉庫與 OLAP解決方案25-26
- 2.3 相關(guān)回歸理論26-31
- 2.3.1 相關(guān)分析26-28
- 2.3.2 回歸分析28-30
- 2.3.3 多變量數(shù)據(jù)分析30-31
- 2.3.4 多元回歸分析與數(shù)據(jù)挖掘31
- 2.4 本章小結(jié)31-32
- 3 第一次全國經(jīng)濟(jì)普查的實施與基礎(chǔ)數(shù)據(jù)32-39
- 3.1 第一次全國經(jīng)濟(jì)普查目的及意義32
- 3.2 第一次全國經(jīng)濟(jì)普查調(diào)查對象及方法32-33
- 3.3 統(tǒng)計分類標(biāo)準(zhǔn)與經(jīng)濟(jì)普查統(tǒng)計指標(biāo)解釋33-34
- 3.3.1 統(tǒng)計分類標(biāo)準(zhǔn)33-34
- 3.3.2 第一次全國經(jīng)濟(jì)普查統(tǒng)計指標(biāo)解釋34
- 3.4 第一次全國經(jīng)濟(jì)普查數(shù)據(jù)處理工作方案34-35
- 3.5 中國經(jīng)濟(jì)普查基礎(chǔ)數(shù)據(jù)資料35-38
- 3.6 普查數(shù)據(jù)質(zhì)量情況38
- 3.7 本章小結(jié)38-39
- 4 經(jīng)濟(jì)普查數(shù)據(jù)挖掘倉庫的構(gòu)建與算法選擇39-46
- 4.1 一般經(jīng)濟(jì)普查數(shù)據(jù)庫分析39
- 4.2 經(jīng)濟(jì)普查數(shù)據(jù)挖掘倉庫的要求39-40
- 4.3 經(jīng)濟(jì)普查數(shù)據(jù)挖掘倉庫的構(gòu)建40-43
- 4.3.1 確定挖掘?qū)ο?/span>40-41
- 4.3.2 數(shù)據(jù)準(zhǔn)備41
- 4.3.3 經(jīng)濟(jì)普查數(shù)據(jù)挖掘倉庫的數(shù)據(jù)組織方式41
- 4.3.4 數(shù)據(jù)預(yù)處理41-42
- 4.3.5 數(shù)據(jù)抽取42
- 4.3.6 數(shù)據(jù)轉(zhuǎn)換42-43
- 4.3.7 數(shù)據(jù)凈化43
- 4.3.8 數(shù)據(jù)匯總43
- 4.4 數(shù)據(jù)挖掘算法的選擇43-45
- 4.4.1 采用決策樹算法的原因44
- 4.4.2 決策樹的表示形式44-45
- 4.4.3 創(chuàng)建微軟決策樹45
- 4.5 本章小結(jié)45-46
- 5 經(jīng)濟(jì)普查數(shù)據(jù)挖掘系統(tǒng)實現(xiàn)46-54
- 5.1 經(jīng)濟(jì)普查數(shù)據(jù)挖掘系統(tǒng)的實現(xiàn)過程46-51
- 5.1.1 目標(biāo)確定46
- 5.1.2 注冊服務(wù)器46
- 5.1.3 建立數(shù)據(jù)倉庫46-47
- 5.1.4 創(chuàng)建表和索引47-48
- 5.1.5 創(chuàng)建數(shù)據(jù)源并鏈接48-49
- 5.1.6 創(chuàng)建挖掘模型以及算法選擇49-51
- 5.2 系統(tǒng)的測試與運行51-52
- 5.3 系統(tǒng)的更新和維護(hù)52-53
- 5.4 本章小結(jié)53-54
- 結(jié)論54-55
- 參考文獻(xiàn)55-58
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文58-59
- 致謝59-60
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 高韜,謝昆青,馬修軍,陳冠華;SDML:基于空間數(shù)據(jù)庫的空間數(shù)據(jù)挖掘語言[J];北京大學(xué)學(xué)報(自然科學(xué)版);2004年03期
2 郝先臣,張德干,高光來,趙海;數(shù)據(jù)挖掘工具和應(yīng)用中的問題[J];東北大學(xué)學(xué)報;2001年02期
3 劉海虹,劉伯瑩;數(shù)據(jù)挖掘技術(shù)[J];丹東紡專學(xué)報;2001年01期
4 楊城;數(shù)據(jù)挖掘的實施分析[J];電腦開發(fā)與應(yīng)用;2002年11期
5 劉斌,盧增祥,瞿艷,馮翱,路海明;Bookmark——智能化網(wǎng)絡(luò)信息服務(wù)系統(tǒng)[J];高技術(shù)通訊;1999年06期
6 楊會志;數(shù)據(jù)挖掘技術(shù)的主要方法及其發(fā)展方向[J];河北科技大學(xué)學(xué)報;2000年03期
7 許憲春;關(guān)于經(jīng)濟(jì)普查年度GDP核算方案的思考[J];經(jīng)濟(jì)科學(xué);2005年04期
8 惲爽,胡南軍,董浚,陳道蓄;數(shù)據(jù)挖掘軟件現(xiàn)狀研究[J];計算機(jī)工程與應(yīng)用;2003年08期
9 易敏昕,汪勝,張有仁,陳寶樹;Web使用數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理的研究[J];計算機(jī)工程與應(yīng)用;2003年24期
10 湯效琴,戴汝源,徐琪;數(shù)據(jù)挖掘中變量聚類方法的應(yīng)用研究[J];計算機(jī)工程與應(yīng)用;2004年24期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 梁偉;Web使用挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];天津大學(xué);2004年
本文關(guān)鍵詞:中國經(jīng)濟(jì)普查的數(shù)據(jù)挖掘方法研究,由筆耕文化傳播整理發(fā)布。
本文編號:255203
本文鏈接:http://sikaile.net/jingjilunwen/jjtj/255203.html