企業(yè)與自然人數(shù)據(jù)歸集的設(shè)計與實現(xiàn)
發(fā)布時間:2023-02-09 09:24
國家稅務(wù)總局作為統(tǒng)籌全國稅務(wù)數(shù)據(jù)的負責單位,在金稅三期工程在全國范圍內(nèi)順利推廣上線之后,提出了將全國稅務(wù)數(shù)據(jù)集中予以挖掘分析以及利用,因此金稅三期子項目即大數(shù)據(jù)云平臺項目應(yīng)運而生。大數(shù)據(jù)技術(shù)在各行各業(yè)的不斷普及應(yīng)用,使得運用大數(shù)據(jù)技術(shù)解決稅務(wù)問題已經(jīng)成為稅收現(xiàn)代化建設(shè)的重要指標之一。全國稅務(wù)數(shù)據(jù)范圍覆蓋國、地稅70+個上線單位的源頭數(shù)據(jù)、總局和各省局的外部門交換數(shù)據(jù)以及從互聯(lián)網(wǎng)渠道獲取的開放數(shù)據(jù)?紤]這些數(shù)據(jù)量大冗雜的特性,本文系根據(jù)國家稅務(wù)總局提出的關(guān)于數(shù)據(jù)歸集的實際需求,完成了企業(yè)與自然人數(shù)據(jù)歸集系統(tǒng)的設(shè)計與實現(xiàn)。本文基于軟件工程處理問題的思想,描述系統(tǒng)的需求分析和設(shè)計實現(xiàn)的語言采用的是UML(統(tǒng)一建模語言),采用RUP(統(tǒng)一過程)的軟件開發(fā)方法,利用阿里搭建的稅務(wù)專有云平臺為框架,全面分析了企業(yè)與自然人數(shù)據(jù)歸集系統(tǒng)的6個子系統(tǒng),并且對各個子系統(tǒng)進行了詳細的設(shè)計與實現(xiàn)。目前,系統(tǒng)完成了包括數(shù)據(jù)同步配置文件產(chǎn)出管理、datax腳本調(diào)用管理、同步任務(wù)執(zhí)行管理、編碼轉(zhuǎn)換管理、數(shù)據(jù)預(yù)處理管理、數(shù)據(jù)相似度計算管理以歸集MapReduce實現(xiàn)管理等在內(nèi)的一系列功能模塊。應(yīng)用于稅務(wù)專有云平臺開發(fā)...
【文章頁數(shù)】:101 頁
【學位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.1.1 研究的背景
1.1.2 項目實施的意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文解決的主要問題
1.4 本文的主要工作及組織結(jié)構(gòu)
1.4.1 本文的主要工作
1.4.2 本文的組織結(jié)構(gòu)
第2章 系統(tǒng)需求分析
2.1 系統(tǒng)主要使用者及邊界
2.2 系統(tǒng)的功能需求
2.2.1 金三系統(tǒng)稅務(wù)數(shù)據(jù)同步至MAXCOMPUTE平臺需求分析
2.2.2 MAXCOMPUTE平臺編碼問題處理需求分析
2.2.3 歸集數(shù)據(jù)預(yù)處理的需求分析
2.2.4 歸集數(shù)據(jù)相似度計算的需求分析
2.2.5 歸集方式MapReduce實現(xiàn)的需求分析
2.2.6 數(shù)據(jù)歸集結(jié)果篩選的需求分析
2.3 系統(tǒng)性能需求
2.3.1 云平臺運行環(huán)境要求
2.3.2 客戶端計算機的要求
第3章 系統(tǒng)的概要設(shè)計
3.1 企業(yè)與自然人數(shù)據(jù)歸集的設(shè)計目標與設(shè)計原則
3.1.1 系統(tǒng)的設(shè)計原則
3.1.2 系統(tǒng)的設(shè)計目標
3.2 系統(tǒng)技術(shù)架構(gòu)設(shè)計
3.3 系統(tǒng)網(wǎng)絡(luò)架構(gòu)設(shè)計
3.4 系統(tǒng)功能架構(gòu)設(shè)計
3.5 系統(tǒng)安全架構(gòu)設(shè)計
第4章 系統(tǒng)的詳細設(shè)計
4.1 核心業(yè)務(wù)的詳細設(shè)計
4.1.1 相似度計算功能子系統(tǒng)詳細設(shè)計
4.1.2 歸集的MR實現(xiàn)子系統(tǒng)詳細設(shè)計
4.2 數(shù)據(jù)庫設(shè)計
第5章 系統(tǒng)的實現(xiàn)與測試
5.1 系統(tǒng)實現(xiàn)
5.1.1 數(shù)據(jù)采集層的實現(xiàn)
5.1.2 數(shù)據(jù)處理層的實現(xiàn)
5.1.3 數(shù)據(jù)歸集層的實現(xiàn)
5.2 系統(tǒng)測試
5.2.1 系統(tǒng)測試方案
5.2.2 系統(tǒng)功能性測試
5.2.3 系統(tǒng)性能測試
第6章 總結(jié)與展望
參考文獻
致謝
學位論文評閱及答辯情況表
本文編號:3738639
【文章頁數(shù)】:101 頁
【學位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.1.1 研究的背景
1.1.2 項目實施的意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文解決的主要問題
1.4 本文的主要工作及組織結(jié)構(gòu)
1.4.1 本文的主要工作
1.4.2 本文的組織結(jié)構(gòu)
第2章 系統(tǒng)需求分析
2.1 系統(tǒng)主要使用者及邊界
2.2 系統(tǒng)的功能需求
2.2.1 金三系統(tǒng)稅務(wù)數(shù)據(jù)同步至MAXCOMPUTE平臺需求分析
2.2.2 MAXCOMPUTE平臺編碼問題處理需求分析
2.2.3 歸集數(shù)據(jù)預(yù)處理的需求分析
2.2.4 歸集數(shù)據(jù)相似度計算的需求分析
2.2.5 歸集方式MapReduce實現(xiàn)的需求分析
2.2.6 數(shù)據(jù)歸集結(jié)果篩選的需求分析
2.3 系統(tǒng)性能需求
2.3.1 云平臺運行環(huán)境要求
2.3.2 客戶端計算機的要求
第3章 系統(tǒng)的概要設(shè)計
3.1 企業(yè)與自然人數(shù)據(jù)歸集的設(shè)計目標與設(shè)計原則
3.1.1 系統(tǒng)的設(shè)計原則
3.1.2 系統(tǒng)的設(shè)計目標
3.2 系統(tǒng)技術(shù)架構(gòu)設(shè)計
3.3 系統(tǒng)網(wǎng)絡(luò)架構(gòu)設(shè)計
3.4 系統(tǒng)功能架構(gòu)設(shè)計
3.5 系統(tǒng)安全架構(gòu)設(shè)計
第4章 系統(tǒng)的詳細設(shè)計
4.1 核心業(yè)務(wù)的詳細設(shè)計
4.1.1 相似度計算功能子系統(tǒng)詳細設(shè)計
4.1.2 歸集的MR實現(xiàn)子系統(tǒng)詳細設(shè)計
4.2 數(shù)據(jù)庫設(shè)計
第5章 系統(tǒng)的實現(xiàn)與測試
5.1 系統(tǒng)實現(xiàn)
5.1.1 數(shù)據(jù)采集層的實現(xiàn)
5.1.2 數(shù)據(jù)處理層的實現(xiàn)
5.1.3 數(shù)據(jù)歸集層的實現(xiàn)
5.2 系統(tǒng)測試
5.2.1 系統(tǒng)測試方案
5.2.2 系統(tǒng)功能性測試
5.2.3 系統(tǒng)性能測試
第6章 總結(jié)與展望
參考文獻
致謝
學位論文評閱及答辯情況表
本文編號:3738639
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3738639.html
最近更新
教材專著