數(shù)據(jù)清洗在統(tǒng)計調查實踐中的應用
發(fā)布時間:2022-10-29 11:47
高質量的數(shù)據(jù)是進行各種分析的基本條件,而數(shù)據(jù)采集、數(shù)據(jù)整理、數(shù)據(jù)存儲以及數(shù)據(jù)分析過程中,數(shù)據(jù)清洗是一個重要環(huán)節(jié),是保證數(shù)據(jù)質量的有效手段。本文重點探討統(tǒng)計調查實踐中數(shù)據(jù)清洗對象、數(shù)據(jù)清洗的基本思路和流程,針對實際工作中出現(xiàn)的數(shù)據(jù)錯誤類型提出清洗方案及建議。
【文章頁數(shù)】:3 頁
【文章目錄】:
一、引言
二、數(shù)據(jù)清洗的概念及對象
三、調查數(shù)據(jù)清洗的基本流程
1. 清洗前數(shù)據(jù)準備及備份。
2. 數(shù)據(jù)審核清洗。
3. 清洗后驗證評估。
4. 數(shù)據(jù)清洗后入庫。
四、目前實際工作中數(shù)據(jù)清洗的基本思路
1. 人工清洗。
2. 計算機清洗。
3. 人工和計算機結合清洗。
4. 審核及評估。
五、針對不同問題的數(shù)據(jù)清洗方案
1. 異常值的處理。
2. 缺失值的處理。
3. 重復樣本的處理。
4. 其他錯誤類型數(shù)據(jù)的處理。
六、數(shù)據(jù)清洗主要存在的問題及建議
【參考文獻】:
期刊論文
[1]數(shù)據(jù)質量和數(shù)據(jù)清洗研究綜述[J]. 郭志懋,周傲英. 軟件學報. 2002(11)
[2]數(shù)據(jù)清洗及其一般性系統(tǒng)框架[J]. 曹建軍,刁興春,陳爽,邵衍振. 計算機科學. 2012(S3)
[3]數(shù)據(jù)倉庫中數(shù)據(jù)清洗技術分析[J]. 羅強,何利力,王曉菲. 電腦編程技巧與維護. 2015(02)
[4]一種基于數(shù)據(jù)質量維度的數(shù)據(jù)清洗方法[J]. 李琳. 科技創(chuàng)新與應用. 2017(21)
[5]大數(shù)據(jù)時代的社情民意調查:機遇、挑戰(zhàn)與趨勢[J]. 白萬平. 現(xiàn)代經(jīng)濟信息. 2016(19)
本文編號:3697631
【文章頁數(shù)】:3 頁
【文章目錄】:
一、引言
二、數(shù)據(jù)清洗的概念及對象
三、調查數(shù)據(jù)清洗的基本流程
1. 清洗前數(shù)據(jù)準備及備份。
2. 數(shù)據(jù)審核清洗。
3. 清洗后驗證評估。
4. 數(shù)據(jù)清洗后入庫。
四、目前實際工作中數(shù)據(jù)清洗的基本思路
1. 人工清洗。
2. 計算機清洗。
3. 人工和計算機結合清洗。
4. 審核及評估。
五、針對不同問題的數(shù)據(jù)清洗方案
1. 異常值的處理。
2. 缺失值的處理。
3. 重復樣本的處理。
4. 其他錯誤類型數(shù)據(jù)的處理。
六、數(shù)據(jù)清洗主要存在的問題及建議
【參考文獻】:
期刊論文
[1]數(shù)據(jù)質量和數(shù)據(jù)清洗研究綜述[J]. 郭志懋,周傲英. 軟件學報. 2002(11)
[2]數(shù)據(jù)清洗及其一般性系統(tǒng)框架[J]. 曹建軍,刁興春,陳爽,邵衍振. 計算機科學. 2012(S3)
[3]數(shù)據(jù)倉庫中數(shù)據(jù)清洗技術分析[J]. 羅強,何利力,王曉菲. 電腦編程技巧與維護. 2015(02)
[4]一種基于數(shù)據(jù)質量維度的數(shù)據(jù)清洗方法[J]. 李琳. 科技創(chuàng)新與應用. 2017(21)
[5]大數(shù)據(jù)時代的社情民意調查:機遇、挑戰(zhàn)與趨勢[J]. 白萬平. 現(xiàn)代經(jīng)濟信息. 2016(19)
本文編號:3697631
本文鏈接:http://www.sikaile.net/guanlilunwen/tongjijuecelunwen/3697631.html
最近更新
教材專著