數(shù)據(jù)開采的數(shù)據(jù)質量問題
本文選題:數(shù)據(jù)開采 + 數(shù)據(jù)質量; 參考:《管理工程學報》2002年01期
【摘要】:數(shù)據(jù)質量是影響數(shù)據(jù)開采效果的重要因素 ,這個問題并未受到人們的充分重視。本文針對數(shù)據(jù)質量在數(shù)據(jù)開采中的地位 ,給出了數(shù)據(jù)質量評價的幾個主要尺度。并且結合統(tǒng)計學和機器學習的理論 ,分析了解決數(shù)據(jù)質量的方法 ,強調提高數(shù)據(jù)質量的出發(fā)點在于控制數(shù)據(jù)源的質量。
[Abstract]:Data quality is an important factor affecting the effect of data mining, which has not been paid enough attention to. According to the status of data quality in data mining, this paper gives several main scales of data quality evaluation. Combined with the theory of statistics and machine learning, this paper analyzes the methods of data quality, and emphasizes that the starting point of improving data quality is to control the quality of data sources.
【作者單位】: 東南大學經管學院 合肥工業(yè)大學
【基金】:江蘇省自然科學基金資助項目 ( 76 0 5 730 0 72 )
【分類號】:F222
【共引文獻】
相關期刊論文 前10條
1 楊萍,楊明;基于VPRS的重要屬性評價方法研究[J];安徽工程科技學院學報(自然科學版);2003年01期
2 林成龍,孫即祥;粗糙集理論在決策判斷中的應用[J];電光與控制;2005年01期
3 李龍澍,程慧霞,盧冰原;基于凸Rough集的數(shù)據(jù)約簡和規(guī)則發(fā)現(xiàn)研究[J];東南大學學報(自然科學版);2002年02期
4 許少華,趙萬平,廖太平,魯?shù)?李欣;一類模式識別及其在地層對比中的應用[J];大慶石油學院學報;2002年01期
5 葉東毅;Jelonek屬性約簡算法的一個改進[J];電子學報;2000年12期
6 葉東毅,陳昭炯;一個新的差別矩陣及其求核方法[J];電子學報;2002年07期
7 楊明,孫志揮;改進的差別矩陣及其求核方法[J];復旦學報(自然科學版);2004年05期
8 葉東毅;基于粗糙隸屬函數(shù)的規(guī)則組合可信度計算與推理[J];福州大學學報(自然科學版);2002年03期
9 緱錦,葉東毅;基于概念格的求所有絕對屬性約簡的一個算法[J];福州大學學報(自然科學版);2002年03期
10 葉東毅,陳昭炯;不相容決策表屬性約簡計算的一個可辨識矩陣方法[J];福州大學學報(自然科學版);2005年01期
相關會議論文 前6條
1 游鳳荷;游汛;;粗糙集的約簡算法在渦流傳感器設計中的應用[A];2007'湖北·武漢NDT學術年會論文集[C];2007年
2 張錚;蘇旭武;張道德;陳學鋒;;裝載機故障診斷屬性約簡算法[A];湖北省機械工程學會青年分會2006年年會暨第2屆機械學院院長(系主任)會議論文集(下)[C];2006年
3 李仁璞;黃道;高茂庭;;一種快速的決策規(guī)則抽取方法[A];2005中國控制與決策學術年會論文集(下)[C];2005年
4 馬翠;劉瓊蓀;周先東;;基于相對區(qū)分矩陣的遺傳模擬退火屬性約簡算法[A];第九屆中國青年信息與管理學者大會論文集[C];2007年
5 王丹;吳孟達;劉銀山;;屬性約簡的一種簡單算法[A];第12屆全國模糊系統(tǒng)與模糊數(shù)學學術年會論文集[C];2004年
6 楊善林;劉業(yè)政;馬溪駿;;基于β-δ_0粗糙集模型的屬性約簡算法[A];2003年中國管理科學學術會議論文集[C];2003年
相關博士學位論文 前10條
1 許志興;粗集理論的若干技術及其應用研究[D];南京航空航天大學;2001年
2 劉沐宇;基于范例推理的邊坡穩(wěn)定性智能評價方法研究[D];武漢理工大學;2002年
3 何離慶;網(wǎng)絡環(huán)境下的智能化農業(yè)信息平臺研究[D];重慶大學;2002年
4 蘇健;基于粗糙集的數(shù)據(jù)挖掘與決策支持方法研究[D];浙江大學;2002年
5 吳濤;構造性知識發(fā)現(xiàn)方法研究[D];安徽大學;2003年
6 張小剛;關聯(lián)規(guī)則挖掘及其在復雜工業(yè)過程控制中的應用研究[D];湖南大學;2002年
7 賽英;粗糙集擴展模型及其在數(shù)據(jù)挖掘中的應用研究[D];中國人民解放軍國防科學技術大學;2002年
8 趙軍;基于粗集理論的KDD技術研究[D];重慶大學;2003年
9 許琦;粗糙集理論在旋轉機械故障診斷技術上應用的研究[D];南京工業(yè)大學;2003年
10 譚天樂;基于粗糙集的過程建模、控制與故障診斷[D];浙江大學;2003年
相關碩士學位論文 前10條
1 鄒先霞;基于C/S模式數(shù)據(jù)挖掘的研究及其在AEFS中的應用[D];華中師范大學;2001年
2 緱錦;基于概念格的屬性約簡算法及粗糙集在聚類分析中的應用探討[D];福州大學;2002年
3 康勝武;基于粗集理論的屬性處理方法和模糊規(guī)則提取及應用研究[D];廈門大學;2001年
4 仲維國;信息系統(tǒng)中粗糙集理論若干問題的研究[D];南京理工大學;2002年
5 張新霞;基于統(tǒng)計相關性的有趣關聯(lián)規(guī)則的挖掘[D];武漢科技大學;2002年
6 孫巍巍;基于多指標群決策理論的股票預測系統(tǒng)研究[D];昆明理工大學;2002年
7 彭云;ARMRDB模型中的聚類分析和規(guī)則提取[D];江西師范大學;2002年
8 陳云化;基于粗糙集理論的增量算法的研究和應用[D];福州大學;2003年
9 趙士亮;粗糙集理論中若干問題的研究及應用[D];福州大學;2003年
10 劉成鋼;基于粗糙集理論的不確定決策問題的研究與應用[D];南京航空航天大學;2003年
【相似文獻】
相關期刊論文 前10條
1 葛萌萌;彭現(xiàn)美;王有剛;;住戶調查樣本選擇及數(shù)據(jù)誤差問題探討[J];安徽農學通報(下半月刊);2011年16期
2 鄭向群;張鐵亮;姚秀榮;;我國農業(yè)資源環(huán)境信息統(tǒng)計的歷史回顧與未來展望[J];農業(yè)環(huán)境與發(fā)展;2011年03期
3 劉虹;;淺析企業(yè)會計與統(tǒng)計在市場經濟條件下的相互適應性[J];中國集體經濟;2011年19期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
相關會議論文 前4條
1 曹會平;;縣級GDP核算工作面臨的問題與思考[A];2005—2006山西省統(tǒng)計科研成果匯編[C];2006年
2 竇志達;耿愛蓮;李文選;;關于縮小國家與地區(qū)GDP核算差異方法的思考[A];2005—2006山西省統(tǒng)計科研成果匯編[C];2006年
3 霍成義;莫琳;許加宏;;2006年1季度山東省銀行家問卷調查分析報告[A];社會主義新農村建設與金融支持學術研討會論文集[C];2006年
4 高新萍;;縱觀經濟普查全過程,淺談基層普查的組織工作[A];北京市第十三次統(tǒng)計科學討論會論文選編[C];2006年
相關重要報紙文章 前10條
1 ;國務院經普辦數(shù)據(jù)質量抽查工作在浙遼陜順次展開[N];中國信息報;2009年
2 高立業(yè);臨朐縣嚴控經普登記數(shù)據(jù)質量[N];中國信息報;2009年
3 ;采取多種舉措確保數(shù)據(jù)質量[N];鄭州日報;2009年
4 李艷;華寧確保經普數(shù)據(jù)質量[N];玉溪日報;2009年
5 本報記者 趙曉赤;黑龍江扎實開展農村數(shù)據(jù)質量檢查[N];中國信息報;2005年
6 海南省統(tǒng)計局局長 張恒;堅持依法統(tǒng)計 提高數(shù)據(jù)質量[N];中國信息報;2002年
7 本報記者 王布剛;視數(shù)據(jù)質量為生命[N];中國信息報;2003年
8 ;大連市“四四一”確保單位清查數(shù)據(jù)質量[N];中國信息報;2008年
9 ;按要求做好經普數(shù)據(jù)質量抽查工作[N];中國信息報;2009年
10 張新沙;提高數(shù)據(jù)質量的“五招”[N];中國信息報;2003年
相關碩士學位論文 前4條
1 黃麗莎;非國有經濟統(tǒng)計指標體系與調查方法研究[D];東北林業(yè)大學;2007年
2 周光洪;基于國際可比性的我國GDP數(shù)據(jù)質量研究[D];湖南大學;2009年
3 渠田田;GDP數(shù)據(jù)質量的統(tǒng)計診斷[D];江蘇大學;2010年
4 張敏敏;中國經濟普查的數(shù)據(jù)挖掘方法研究[D];東北林業(yè)大學;2007年
,本文編號:1902711
本文鏈接:http://www.sikaile.net/weiguanjingjilunwen/1902711.html