天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

不一致數(shù)據(jù)上精確決策樹(shù)生成算法

發(fā)布時(shí)間:2018-11-11 17:23
【摘要】:近年來(lái),隨著現(xiàn)實(shí)生活中數(shù)據(jù)量的不斷增大,不一致數(shù)據(jù)的出現(xiàn)也越發(fā)頻繁,這使得人工修正不一致數(shù)據(jù)變得更加耗時(shí).而且,人工修正數(shù)據(jù)方法本身也存在著不可避免的人為操作錯(cuò)誤,因此,這種修正方法不再可行.如何不提前修復(fù)不一致數(shù)據(jù),直接在不一致數(shù)據(jù)上進(jìn)行分類(lèi),是該文的核心研究?jī)?nèi)容.對(duì)決策樹(shù)生成算法的目標(biāo)函數(shù)進(jìn)行改進(jìn),使其能夠直接對(duì)不一致數(shù)據(jù)進(jìn)行分類(lèi),并得到較好的分類(lèi)結(jié)果.對(duì)約束條件中的特征對(duì)分類(lèi)結(jié)果的影響進(jìn)行了多方面衡量,從而調(diào)整該特征的影響因子,使得決策樹(shù)的節(jié)點(diǎn)分割更加精確,分類(lèi)效果更優(yōu).
[Abstract]:In recent years, with the increasing amount of data in real life, inconsistent data appear more and more frequently, which makes the artificial correction of inconsistent data become more time-consuming. Moreover, there are inevitable human errors in the data correction method, so this method is no longer feasible. How to classify inconsistent data directly without repairing inconsistent data in advance is the core of this paper. The objective function of the decision tree generation algorithm is improved so that the inconsistent data can be classified directly and a better classification result is obtained. The influence of the feature in the constraint condition on the classification result is measured in many aspects, and the influence factor of the feature is adjusted to make the node segmentation of the decision tree more accurate and the classification effect better.
【作者單位】: 哈爾濱工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系;
【分類(lèi)號(hào)】:TP301.6

【相似文獻(xiàn)】

相關(guān)會(huì)議論文 前10條

1 陳長(zhǎng)清;馮劍琳;向隆剛;馮玉才;;維之間帶函數(shù)依賴(lài)關(guān)系的數(shù)據(jù)立方的有效計(jì)算[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

2 張忠平;曹順良;李榮;朱揚(yáng)勇;;基于約束的XML模式規(guī)范化研究[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年

3 馬垣;張小平;白雪;王旭;劉楊;楊鴻雁;;函數(shù)依賴(lài)作用域及分類(lèi)規(guī)則的挖掘[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

4 趙相國(guó);王國(guó)仁;張恩德;丁大斌;霍歡;;XML函數(shù)依賴(lài)的定義及分析[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年

5 馬垣;;動(dòng)態(tài)Fuzzy函數(shù)依賴(lài)[A];第十二屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集[C];1994年

6 劉云峰;楊冬青;唐世渭;王騰蛟;;基于XML數(shù)據(jù)交換中的函數(shù)依賴(lài)轉(zhuǎn)換方法[A];第二十屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2003年

7 張忠平;余靖;朱揚(yáng)勇;;基于函數(shù)依賴(lài)的XML鍵的推理及其求解算法[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年

8 張小峰;張福增;趙永升;李明;;基于函數(shù)依賴(lài)關(guān)系的約簡(jiǎn)算法研究[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2005年

9 彭玉青;何華;顧軍華;;基于粗集理論的歸納依賴(lài)關(guān)系的研究[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2000年

10 岳昆;郭志懋;胥正川;周傲英;;從XML鍵到關(guān)系數(shù)據(jù)庫(kù)函數(shù)依賴(lài)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年

相關(guān)重要報(bào)紙文章 前1條

1 記者 何屹;美籍華裔科學(xué)家獲英計(jì)算機(jī)最高獎(jiǎng)[N];科技日?qǐng)?bào);2008年

相關(guān)博士學(xué)位論文 前1條

1 呂騰;XML文檔的規(guī)范化問(wèn)題研究[D];復(fù)旦大學(xué);2003年

相關(guān)碩士學(xué)位論文 前10條

1 吳佳;多態(tài)依賴(lài)蘊(yùn)含判定方法的研究[D];北京工業(yè)大學(xué);2015年

2 葉杰敏;不確定數(shù)據(jù)庫(kù)及相關(guān)理論研究[D];東華大學(xué);2014年

3 李高仕;XML數(shù)據(jù)庫(kù)的規(guī)范化理論研究[D];湖南師范大學(xué);2008年

4 閆淵;基于信息論和函數(shù)依賴(lài)的半監(jiān)督學(xué)習(xí)[D];吉林大學(xué);2013年

5 覃事東;基于函數(shù)依賴(lài)改進(jìn)隱含樸素貝葉斯的性能和魯棒性[D];吉林大學(xué);2014年

6 蘇杰;基于編輯距離和條件函數(shù)依賴(lài)的酒店數(shù)據(jù)清洗方法研究[D];南昌大學(xué);2014年

7 張峰;XML不完全信息的動(dòng)態(tài)發(fā)現(xiàn)[D];山東大學(xué);2009年

8 侯林嬌;基于函數(shù)依賴(lài)的成批處理模式挖掘方法研究[D];湖南科技大學(xué);2011年

9 曹穎;云計(jì)算環(huán)境下分布式數(shù)據(jù)不一致的研究[D];中國(guó)海洋大學(xué);2013年

10 周莉;帶約束的XML與RDB數(shù)據(jù)轉(zhuǎn)換關(guān)鍵技術(shù)的研究[D];江西師范大學(xué);2005年

,

本文編號(hào):2325599

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2325599.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)fd7c3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com