【摘要】:數(shù)據(jù)質(zhì)量檢驗在當今大數(shù)據(jù)發(fā)展的浪潮中的重要性愈發(fā)突顯。數(shù)據(jù)是信息的載體,當挖掘其中有價值的信息或?qū)⑵溥\用于某個領域的時候,數(shù)據(jù)的質(zhì)量都應該是人們最先考慮的因素。如果其準確性、真實性不能得到相對應的保證,出現(xiàn)數(shù)據(jù)缺失、數(shù)據(jù)錯誤、數(shù)據(jù)邏輯存在混亂等情況時,不僅僅是影響我們對信息的判斷,很大可能會使得人們對事物未來發(fā)展的預期出現(xiàn)判斷上的偏差,從而導致經(jīng)濟上的損失或者決策上的失誤。清洗數(shù)據(jù)、提高數(shù)據(jù)質(zhì)量,對于以數(shù)據(jù)作為切入口的研究和分析有著重要的意義。本文的選題初衷來自于近些年來我校一直參與的中國農(nóng)村人口退貧核查項目,本人也多次跟隨核查隊伍,走訪了百余家貧困戶,統(tǒng)計并分析了收集得到了大量的數(shù)據(jù)。數(shù)據(jù)的質(zhì)量一直也是我們學院應用統(tǒng)計中心最為關心的問題之一,而Benford法則被用于數(shù)據(jù)質(zhì)量檢驗已有逾幾十年的歷史,但在該法則被運用于數(shù)據(jù)質(zhì)量檢驗的過程中,因受其局限性而發(fā)展較緩,因此本文就將基于Benford法則結合SVM算法對數(shù)據(jù)質(zhì)量的檢驗提供新的思路,使數(shù)據(jù)在整理階段依托Benford法則有新的法來檢驗數(shù)據(jù)的質(zhì)量。本文的研究工作主要體現(xiàn)在以下5個方面:1、研究國內(nèi)外數(shù)據(jù)質(zhì)量檢驗和基于Benford法則進行數(shù)據(jù)質(zhì)量檢驗的研究現(xiàn)狀,在最新的研究方向上進行總結歸納。2、從Benford法則出發(fā),發(fā)掘Benford法則的優(yōu)劣并分別進行分析。3、用Benford與擬合優(yōu)度檢驗相結合的方式解決Benford法則在實際應用中出現(xiàn)的局限性問題。4、基于Benford法則的檢驗結果結合SVM算法,針對傳統(tǒng)Benford法則只能單純定位數(shù)據(jù)首位數(shù)的這一問題進行突破。5、在對Benford法則和SVM算法結合過程中的不足進行總結,為數(shù)據(jù)質(zhì)量評估提供了新的思路。論文的主要成果是抓住Benford法則的優(yōu)勢結合SVM算法去彌補Benford法則局限于首位數(shù)字去定位數(shù)據(jù)異常樣本的問題,提升了Benford法則在實際應用中的運用效果。
【學位授予單位】:江西財經(jīng)大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:C81
【參考文獻】
相關期刊論文 前10條
1 解繼超;鄧曉盈;朱海濤;;基于SVM的房地產(chǎn)財務決策風險預測及敏感性分析[J];價值工程;2014年29期
2 淦艷;魏延;楊有;;結合PCA的SVM方法在學校財務風險預警中的運用[J];重慶科技學院學報(自然科學版);2014年04期
3 董曉萌;南方雀;;企業(yè)統(tǒng)計數(shù)據(jù)質(zhì)量的實證檢驗分析[J];渭南師范學院學報;2014年07期
4 王飛成;郭其友;;經(jīng)濟增長對環(huán)境污染的影響及區(qū)域性差異——基于省際動態(tài)面板數(shù)據(jù)模型的研究[J];山西財經(jīng)大學學報;2014年04期
5 金彩紅;畢夢昭;;我國城鄉(xiāng)居民消費結構升級趨勢分析——基于面板數(shù)據(jù)模型[J];江蘇商論;2014年01期
6 張海波;;對外直接投資對母國出口貿(mào)易品技術含量的影響——基于跨國動態(tài)面板數(shù)據(jù)模型的實證研究[J];國際貿(mào)易問題;2014年02期
7 廖小蘭;;基于Benford模型下的財務舞弊行為發(fā)現(xiàn)的分析[J];湖北第二師范學院學報;2014年02期
8 呂莉莉;劉春紅;;我國糧食總產(chǎn)量數(shù)據(jù)質(zhì)量評估方法[J];統(tǒng)計與決策;2013年23期
9 劉長庚;田龍鵬;陳彬;戴克明;;農(nóng)村金融排斥與城鄉(xiāng)收入差距——基于我國省級面板數(shù)據(jù)模型的實證研究[J];經(jīng)濟理論與經(jīng)濟管理;2013年10期
10 劉云霞;曾五一;;關于綜合利用Benford法則與其他方法評估統(tǒng)計數(shù)據(jù)質(zhì)量的進一步研究[J];統(tǒng)計研究;2013年08期
相關碩士學位論文 前2條
1 王媛媛;基于因子分析與支持向量機的上市公司財務危機預警研究[D];西安電子科技大學;2012年
2 張s,
本文編號:2667224
本文鏈接:http://www.sikaile.net/jingjilunwen/fangdichanjingjilunwen/2667224.html