天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 科研管理論文 >

基于分類模型的知識(shí)發(fā)現(xiàn)過程研究

發(fā)布時(shí)間:2020-08-09 08:05
【摘要】: 數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Databases, KDD)是從大量數(shù)據(jù)中發(fā)現(xiàn)潛在規(guī)律、提取有用知識(shí)的方法和技術(shù)。近年來,數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)KDD受到了國內(nèi)外的普遍關(guān)注,已經(jīng)成為信息系統(tǒng)和計(jì)算機(jī)科學(xué)領(lǐng)域研究中最活躍的前沿領(lǐng)域。 本文以國家自然科學(xué)基金項(xiàng)目“管理決策中數(shù)據(jù)倉庫與數(shù)據(jù)挖掘新技術(shù)研究”為背景,在深入調(diào)研與分析國內(nèi)外知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘相關(guān)理論與應(yīng)用和技術(shù)文獻(xiàn)的基礎(chǔ)上,歸納總結(jié)了該領(lǐng)域的主要研究內(nèi)容和關(guān)鍵技術(shù),詳細(xì)評(píng)述了基于分類數(shù)據(jù)知識(shí)發(fā)現(xiàn)的相關(guān)理論與技術(shù)的研究現(xiàn)狀、存在問題與發(fā)展趨勢,利用UCI(Irvine大學(xué)機(jī)器學(xué)習(xí)數(shù)據(jù)庫)數(shù)據(jù)庫作為實(shí)驗(yàn)數(shù)據(jù),主要研究了知識(shí)發(fā)現(xiàn)過程中以下幾個(gè)問題:知識(shí)發(fā)現(xiàn)過程模型、知識(shí)發(fā)現(xiàn)的一種數(shù)據(jù)預(yù)處理方法——屬性選擇方法,數(shù)據(jù)挖掘算法與數(shù)據(jù)庫的接口——數(shù)據(jù)抽取器,數(shù)據(jù)挖掘方法——多變量決策樹和組合近鄰模型。 本文的主要研究工作和成果為: 1.針對目前的知識(shí)發(fā)現(xiàn)過程模型在實(shí)際應(yīng)用中存在挖掘周期長,對大型數(shù)據(jù)庫的知識(shí)發(fā)現(xiàn)支持不夠的問題,提出了基于數(shù)據(jù)抽取器的知識(shí)發(fā)現(xiàn)模型。在模型中,將知識(shí)發(fā)現(xiàn)過程分成數(shù)據(jù)預(yù)處理、數(shù)據(jù)抽取、數(shù)據(jù)挖掘和結(jié)果分析四個(gè)階段。該模型利用標(biāo)準(zhǔn)的SQL語言構(gòu)造數(shù)據(jù)抽取器,為不同的學(xué)習(xí)算法準(zhǔn)備數(shù)據(jù),可以加快知識(shí)發(fā)現(xiàn)過程,提高數(shù)據(jù)挖掘效率。 2.針對知識(shí)發(fā)現(xiàn)過程的預(yù)處理問題,研究了屬性選擇的理論和技術(shù),提出了一種利用信息理論和概率論,結(jié)合了屬性選擇過濾法和打包法的屬性選擇算法,通過去除屬性集中的不相關(guān)屬性,降低數(shù)據(jù)維數(shù),減少數(shù)據(jù)量,從而提高數(shù)據(jù)挖掘的精度,加快知識(shí)發(fā)現(xiàn)的過程。 3.針對知識(shí)發(fā)現(xiàn)過程的數(shù)據(jù)抽取問題,設(shè)計(jì)了數(shù)據(jù)庫管理系統(tǒng)和數(shù)據(jù)挖掘算法的接口——數(shù)據(jù)抽取器。該接口利用一組基于SQL語言的數(shù)據(jù)抽取器實(shí)現(xiàn)為數(shù)據(jù)挖掘算法抽取必要的統(tǒng)計(jì)數(shù)據(jù),避免了直接對大型數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行調(diào)用,使得對大型數(shù)據(jù)庫進(jìn)行快速數(shù)據(jù)挖掘成為可能。并提出了SQL_C4.5算法,利用數(shù)據(jù)抽取器實(shí)現(xiàn)C4.5決策樹的構(gòu)建。 4.針對數(shù)據(jù)挖掘的多變量決策樹問題,研究了構(gòu)造多變量決策樹的理論和方法。提出了一種利用線性判別法構(gòu)造決策樹的擴(kuò)展屬性,采用C4.5決策樹的分枝準(zhǔn)則生長樹的多變量決策樹算法。該方法能有效的減少?zèng)Q策樹的復(fù)雜度,為多變量決策樹的研究 國防科學(xué)技術(shù)大學(xué)研究生院學(xué)位論文 提供了新的途徑和思路。 5.針對數(shù)據(jù)挖掘的組合模型問題,研究了組合模型的理論和技術(shù),分析了組合理 論在近鄰法的應(yīng)用現(xiàn)狀,提出了一種組合近鄰模型的算法,該算法通過使用隨機(jī)的屬性 子集組合近鄰模型,提高了分類精度。 最后,本文設(shè)計(jì)了一個(gè)醫(yī)療數(shù)據(jù)知識(shí)發(fā)現(xiàn)原型系統(tǒng)。利用本文提出的知識(shí)發(fā)現(xiàn)過程 模型和關(guān)鍵技術(shù),完成了一個(gè)醫(yī)療診斷系統(tǒng)應(yīng)用實(shí)例的知識(shí)發(fā)現(xiàn)過程,獲得了較好的效 果。 本文針對上述研究內(nèi)容,進(jìn)行了大量的實(shí)驗(yàn)研究和論證,結(jié)果表明,本文的理論。 方法與技術(shù)正確有效,達(dá)到了加快知識(shí)發(fā)現(xiàn)過程,提高知識(shí)發(fā)現(xiàn)精度與效率的目的,實(shí) 現(xiàn)了利用分類技術(shù)優(yōu)化知識(shí)發(fā)現(xiàn)過程的目的,具有良好的實(shí)際應(yīng)用前景。
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2002
【分類號(hào)】:G302
【圖文】:

相關(guān)性,屬性選擇,性選擇,屬性


性就是非相關(guān)屬性。完全無關(guān)屬性圖3.1互3.、撇繆粼拳}蘸薰黑{{撰鱷黝黝屬性的相關(guān)性2屬性選擇方法3.2.1屬性選擇的一般程序有許多種屬性選擇方法。屬性選擇方法通常要面對的問題是:(1)怎樣才能搜尋到“最好”的屬性?(2)用什么準(zhǔn)則來確定最好的屬性子集己經(jīng)被找到?(3)在什么情第46頁

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 文化;;知識(shí)管理:騰訊持續(xù)創(chuàng)新的秘密[J];企業(yè)文化;2010年05期

2 肖自茹;;會(huì)計(jì)計(jì)量屬性的選擇[J];武漢冶金管理干部學(xué)院學(xué)報(bào);2011年02期

3 李惠蓉;;試論現(xiàn)行準(zhǔn)則下的金融資產(chǎn)分類與IFRS9改進(jìn)后的新金融資產(chǎn)分類[J];中國證券期貨;2011年08期

4 吳俊英;;智力資源會(huì)計(jì)計(jì)量對象與計(jì)量屬性的選擇[J];生產(chǎn)力研究;2011年06期

5 孫艷萍;;淺談森林生態(tài)效益外部性公允價(jià)值計(jì)量模式[J];中國鄉(xiāng)鎮(zhèn)企業(yè)會(huì)計(jì);2011年06期

6 王敏;;關(guān)于會(huì)計(jì)計(jì)量屬性的應(yīng)用選擇分析[J];時(shí)代金融;2011年21期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相關(guān)會(huì)議論文 前10條

1 楊光飛;黨延忠;;不完美數(shù)據(jù)中的知識(shí)發(fā)現(xiàn)研究綜述[A];第六屆(2011)中國管理學(xué)年會(huì)——商務(wù)智能分會(huì)場論文集[C];2011年

2 董伯儒;林少培;王永文;;工程建設(shè)MIS中的知識(shí)發(fā)現(xiàn)和深化[A];中國土木工程學(xué)會(huì)計(jì)算機(jī)應(yīng)用分會(huì)第七屆年會(huì)論文集[C];1999年

3 張世海;劉曉燕;涂慶;歐進(jìn)萍;王光遠(yuǎn);;知識(shí)發(fā)現(xiàn)及其在高層結(jié)構(gòu)智能選型中應(yīng)用[A];計(jì)算機(jī)技術(shù)在工程建設(shè)中的應(yīng)用——第十二屆全國工程建設(shè)計(jì)算機(jī)應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2004年

4 萬家華;劉冰;江早;;知識(shí)發(fā)現(xiàn)中的可視化技術(shù)[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年

5 蒙應(yīng)杰;張文;吳超;;基于粗集的數(shù)據(jù)庫水印屬性選擇優(yōu)化問題[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年

6 趙榮珍;楊娟;黃顯華;;粗糙集理論的故障知識(shí)發(fā)現(xiàn)及其工程應(yīng)用模式研究[A];第十二屆全國設(shè)備故障診斷學(xué)術(shù)會(huì)議論文集[C];2010年

7 董伯儒;林少培;王永文;;工程建設(shè)MIS中的知識(shí)發(fā)現(xiàn)和深化[A];中國土木工程學(xué)會(huì)計(jì)算機(jī)應(yīng)用分會(huì)第七屆年會(huì)土木工程計(jì)算機(jī)應(yīng)用文集[C];1999年

8 段培俊;周東岱;;數(shù)據(jù)挖掘研究綜述[A];2003年中國智能自動(dòng)化會(huì)議論文集(下冊)[C];2003年

9 閆光輝;李戰(zhàn)懷;吳海軍;;基于Z-Ordering技術(shù)的分形屬性選擇方法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年

10 張文修;徐萍;米據(jù)生;吳偉志;;知識(shí)系統(tǒng)與知識(shí)發(fā)現(xiàn)[A];中國系統(tǒng)工程學(xué)會(huì)模糊數(shù)學(xué)與模糊系統(tǒng)委員會(huì)第十一屆年會(huì)論文選集[C];2002年

相關(guān)重要報(bào)紙文章 前10條

1 劉向晨;讓文件捉迷藏[N];中國電腦教育報(bào);2003年

2 張德政;信息挖掘商業(yè)智能之“芯”[N];中國計(jì)算機(jī)報(bào);2002年

3 蒼蒼;教你兩手[N];中國電腦教育報(bào);2004年

4 中國科學(xué)院計(jì)算技術(shù)研究所 劉毅勇 何雄 李金山 廖浩均 孟亮 鄧柱中;空間數(shù)據(jù)挖掘:變數(shù)據(jù)為知識(shí)[N];計(jì)算機(jī)世界;2005年

5 柳濤;秋季更需護(hù)理肌膚[N];中華工商時(shí)報(bào);2002年

6 零和千;練習(xí)使用黑白網(wǎng)點(diǎn)[N];電腦報(bào);2005年

7 胡虎;突出信息化貢獻(xiàn)水平 處理好三個(gè)關(guān)系[N];人民郵電;2007年

8 陳志楠;挖掘“不為人知的藝術(shù)”[N];科技日報(bào);2009年

9 尤紅梅;蔡雪晴:優(yōu)勢在于執(zhí)行[N];中國企業(yè)報(bào);2004年

10 湯天浩;人工智能技術(shù):未來船舶系統(tǒng)的靈魂[N];中國船舶報(bào);2005年

相關(guān)博士學(xué)位論文 前10條

1 陳元;基于分類模型的知識(shí)發(fā)現(xiàn)過程研究[D];國防科學(xué)技術(shù)大學(xué);2002年

2 謝宗霞;太陽寧靜區(qū)磁場流場特性知識(shí)發(fā)現(xiàn)的方法研究[D];哈爾濱工業(yè)大學(xué);2010年

3 張?jiān)浦?基于形式概念分析的Folksonomy知識(shí)發(fā)現(xiàn)研究[D];吉林大學(xué);2012年

4 楊立;基于領(lǐng)域知識(shí)的知識(shí)發(fā)現(xiàn)研究[D];中國科學(xué)院研究生院(軟件研究所);2005年

5 李初民;基于網(wǎng)絡(luò)管理數(shù)據(jù)庫中性能數(shù)據(jù)的知識(shí)發(fā)現(xiàn)(KDD)研究[D];重慶大學(xué);2001年

6 李剛;知識(shí)發(fā)現(xiàn)的圖模型方法[D];中國科學(xué)院軟件研究所;2001年

7 謝志鵬;基于概念格模型的知識(shí)發(fā)現(xiàn)研究[D];合肥工業(yè)大學(xué);2001年

8 吳濤;構(gòu)造性知識(shí)發(fā)現(xiàn)方法研究[D];安徽大學(xué);2003年

9 劉剛;數(shù)據(jù)挖掘技術(shù)與分類算法研究[D];中國人民解放軍信息工程大學(xué);2004年

10 湯永川;關(guān)于不確定性推理理論與知識(shí)發(fā)現(xiàn)的研究[D];西南交通大學(xué);2002年

相關(guān)碩士學(xué)位論文 前10條

1 張冬艷;基于粗糙集合理論的決策樹構(gòu)造算法研究[D];合肥工業(yè)大學(xué);2006年

2 薛靜;專家信息管理系統(tǒng)在CRM中的研究與應(yīng)用——基于java技術(shù)的構(gòu)架[D];西北工業(yè)大學(xué);2001年

3 陳紅葉;Web信息提取及知識(shí)發(fā)現(xiàn)方法研究[D];合肥工業(yè)大學(xué);2002年

4 遲慶云;基于決策樹的分類算法研究和應(yīng)用[D];山東師范大學(xué);2005年

5 王益玲;基于DCS實(shí)時(shí)信息的智能故障診斷系統(tǒng)的研究與設(shè)計(jì)[D];南京工業(yè)大學(xué);2003年

6 李長源;關(guān)聯(lián)規(guī)則挖掘算法研究[D];哈爾濱工程大學(xué);2005年

7 郭國印;數(shù)據(jù)挖掘技術(shù)的研究及其在PLM中的應(yīng)用[D];西北工業(yè)大學(xué);2005年

8 谷宏群;數(shù)據(jù)挖掘中可視化方法研究[D];武漢大學(xué);2005年

9 梁利莉;數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2005年

10 劉娟;中藥藥對的量化分析與知識(shí)發(fā)現(xiàn)[D];成都中醫(yī)藥大學(xué);2005年



本文編號(hào):2786842

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/keyanlw/2786842.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶45c84***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com