企業(yè)與自然人數(shù)據(jù)歸集的設計與實現(xiàn)
發(fā)布時間:2023-02-09 09:24
國家稅務總局作為統(tǒng)籌全國稅務數(shù)據(jù)的負責單位,在金稅三期工程在全國范圍內順利推廣上線之后,提出了將全國稅務數(shù)據(jù)集中予以挖掘分析以及利用,因此金稅三期子項目即大數(shù)據(jù)云平臺項目應運而生。大數(shù)據(jù)技術在各行各業(yè)的不斷普及應用,使得運用大數(shù)據(jù)技術解決稅務問題已經成為稅收現(xiàn)代化建設的重要指標之一。全國稅務數(shù)據(jù)范圍覆蓋國、地稅70+個上線單位的源頭數(shù)據(jù)、總局和各省局的外部門交換數(shù)據(jù)以及從互聯(lián)網(wǎng)渠道獲取的開放數(shù)據(jù)?紤]這些數(shù)據(jù)量大冗雜的特性,本文系根據(jù)國家稅務總局提出的關于數(shù)據(jù)歸集的實際需求,完成了企業(yè)與自然人數(shù)據(jù)歸集系統(tǒng)的設計與實現(xiàn)。本文基于軟件工程處理問題的思想,描述系統(tǒng)的需求分析和設計實現(xiàn)的語言采用的是UML(統(tǒng)一建模語言),采用RUP(統(tǒng)一過程)的軟件開發(fā)方法,利用阿里搭建的稅務專有云平臺為框架,全面分析了企業(yè)與自然人數(shù)據(jù)歸集系統(tǒng)的6個子系統(tǒng),并且對各個子系統(tǒng)進行了詳細的設計與實現(xiàn)。目前,系統(tǒng)完成了包括數(shù)據(jù)同步配置文件產出管理、datax腳本調用管理、同步任務執(zhí)行管理、編碼轉換管理、數(shù)據(jù)預處理管理、數(shù)據(jù)相似度計算管理以歸集MapReduce實現(xiàn)管理等在內的一系列功能模塊。應用于稅務專有云平臺開發(fā)...
【文章頁數(shù)】:101 頁
【學位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.1.1 研究的背景
1.1.2 項目實施的意義
1.2 國內外研究現(xiàn)狀
1.3 本文解決的主要問題
1.4 本文的主要工作及組織結構
1.4.1 本文的主要工作
1.4.2 本文的組織結構
第2章 系統(tǒng)需求分析
2.1 系統(tǒng)主要使用者及邊界
2.2 系統(tǒng)的功能需求
2.2.1 金三系統(tǒng)稅務數(shù)據(jù)同步至MAXCOMPUTE平臺需求分析
2.2.2 MAXCOMPUTE平臺編碼問題處理需求分析
2.2.3 歸集數(shù)據(jù)預處理的需求分析
2.2.4 歸集數(shù)據(jù)相似度計算的需求分析
2.2.5 歸集方式MapReduce實現(xiàn)的需求分析
2.2.6 數(shù)據(jù)歸集結果篩選的需求分析
2.3 系統(tǒng)性能需求
2.3.1 云平臺運行環(huán)境要求
2.3.2 客戶端計算機的要求
第3章 系統(tǒng)的概要設計
3.1 企業(yè)與自然人數(shù)據(jù)歸集的設計目標與設計原則
3.1.1 系統(tǒng)的設計原則
3.1.2 系統(tǒng)的設計目標
3.2 系統(tǒng)技術架構設計
3.3 系統(tǒng)網(wǎng)絡架構設計
3.4 系統(tǒng)功能架構設計
3.5 系統(tǒng)安全架構設計
第4章 系統(tǒng)的詳細設計
4.1 核心業(yè)務的詳細設計
4.1.1 相似度計算功能子系統(tǒng)詳細設計
4.1.2 歸集的MR實現(xiàn)子系統(tǒng)詳細設計
4.2 數(shù)據(jù)庫設計
第5章 系統(tǒng)的實現(xiàn)與測試
5.1 系統(tǒng)實現(xiàn)
5.1.1 數(shù)據(jù)采集層的實現(xiàn)
5.1.2 數(shù)據(jù)處理層的實現(xiàn)
5.1.3 數(shù)據(jù)歸集層的實現(xiàn)
5.2 系統(tǒng)測試
5.2.1 系統(tǒng)測試方案
5.2.2 系統(tǒng)功能性測試
5.2.3 系統(tǒng)性能測試
第6章 總結與展望
參考文獻
致謝
學位論文評閱及答辯情況表
本文編號:3738639
【文章頁數(shù)】:101 頁
【學位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.1.1 研究的背景
1.1.2 項目實施的意義
1.2 國內外研究現(xiàn)狀
1.3 本文解決的主要問題
1.4 本文的主要工作及組織結構
1.4.1 本文的主要工作
1.4.2 本文的組織結構
第2章 系統(tǒng)需求分析
2.1 系統(tǒng)主要使用者及邊界
2.2 系統(tǒng)的功能需求
2.2.1 金三系統(tǒng)稅務數(shù)據(jù)同步至MAXCOMPUTE平臺需求分析
2.2.2 MAXCOMPUTE平臺編碼問題處理需求分析
2.2.3 歸集數(shù)據(jù)預處理的需求分析
2.2.4 歸集數(shù)據(jù)相似度計算的需求分析
2.2.5 歸集方式MapReduce實現(xiàn)的需求分析
2.2.6 數(shù)據(jù)歸集結果篩選的需求分析
2.3 系統(tǒng)性能需求
2.3.1 云平臺運行環(huán)境要求
2.3.2 客戶端計算機的要求
第3章 系統(tǒng)的概要設計
3.1 企業(yè)與自然人數(shù)據(jù)歸集的設計目標與設計原則
3.1.1 系統(tǒng)的設計原則
3.1.2 系統(tǒng)的設計目標
3.2 系統(tǒng)技術架構設計
3.3 系統(tǒng)網(wǎng)絡架構設計
3.4 系統(tǒng)功能架構設計
3.5 系統(tǒng)安全架構設計
第4章 系統(tǒng)的詳細設計
4.1 核心業(yè)務的詳細設計
4.1.1 相似度計算功能子系統(tǒng)詳細設計
4.1.2 歸集的MR實現(xiàn)子系統(tǒng)詳細設計
4.2 數(shù)據(jù)庫設計
第5章 系統(tǒng)的實現(xiàn)與測試
5.1 系統(tǒng)實現(xiàn)
5.1.1 數(shù)據(jù)采集層的實現(xiàn)
5.1.2 數(shù)據(jù)處理層的實現(xiàn)
5.1.3 數(shù)據(jù)歸集層的實現(xiàn)
5.2 系統(tǒng)測試
5.2.1 系統(tǒng)測試方案
5.2.2 系統(tǒng)功能性測試
5.2.3 系統(tǒng)性能測試
第6章 總結與展望
參考文獻
致謝
學位論文評閱及答辯情況表
本文編號:3738639
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3738639.html
最近更新
教材專著