天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

集成學(xué)習(xí)結(jié)構(gòu)多樣性研究

發(fā)布時間:2021-03-20 18:20
  集成學(xué)習(xí)是一類著名的機(jī)器學(xué)習(xí)方法,通過構(gòu)建并結(jié)合多個學(xué)習(xí)器來完成學(xué)習(xí)任務(wù),?色@得比單一學(xué)習(xí)器顯著優(yōu)越的泛化性能,在諸多實(shí)際應(yīng)用中取得了成功。學(xué)習(xí)器之間的多樣性是構(gòu)建集成學(xué)習(xí)模型的一個關(guān)鍵因素。如何理解和度量多樣性是集成學(xué)習(xí)中非常基礎(chǔ)但尚未解決的問題。本文對集成學(xué)習(xí)中多樣性進(jìn)行了研究,主要取得了以下創(chuàng)新成果:1)提出了結(jié)構(gòu)多樣性概念,為集成學(xué)習(xí)多樣性研究提供了一個新方向。以往的多樣性度量僅考慮分類器預(yù)測行為的差異,而忽視了分類器本身結(jié)構(gòu)之間的差異。本文針對決策樹提出了一種結(jié)構(gòu)多樣性度量,并通過實(shí)驗驗證了其效用。2)提出了一種嵌入結(jié)構(gòu)多樣性的新型選擇性集成學(xué)習(xí)算法DRSE(Di-versity Regularized Selective Ensemble)。該算法的基本思想是同時考慮集成誤差、行為多樣性和結(jié)構(gòu)多樣性,使用DCA算法求解。實(shí)驗結(jié)果表明,該算法的性能顯著優(yōu)于現(xiàn)有選擇性集成算法。3)提出了一種基于聯(lián)結(jié)樹的多元信息多樣性(multi-information diversity)估計方法。多元信息多樣性基于信息論來刻畫集成多樣性,其面臨的困難是高階信息通常難以估計。本文方法通過聯(lián)結(jié)... 

【文章來源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:71 頁

【學(xué)位級別】:碩士

【部分圖文】:

集成學(xué)習(xí)結(jié)構(gòu)多樣性研究


圖2.1:判斷西瓜是好瓜還是壞瓜問題的一棵決策樹

決策樹,度量值,多樣性,結(jié)點(diǎn)


E56l??)??①,CS>?I?bn<5?]?Cm)?念)??Pairwise?TMD?、、CH)?(^)?Cm)??ZaRTKMK:[]網(wǎng)??丄丄丄丄?I??r:?1?0?3?4?10?[cs^\?I?CT<4?1?^?Insertion???,^<7 ̄、?/v????Deletion??7^?4?3?0?I?9???Relabel???(T)?CM)?BN<5?(m)??A?土丄丄丄丄??r,-?9?lo?9?9__〇_?Cb)??>??圖2.2:五棵決策樹。箭頭指示了匹配兩棵決策樹所需要的操作,圖中同時列出了成對樹匹??配多樣性度量值。??入一個結(jié)點(diǎn)、刪除一個結(jié)點(diǎn)和替換一個結(jié)點(diǎn)的分枝屬性。需要的操作數(shù)最多是??兩棵決策樹內(nèi)部結(jié)點(diǎn)個數(shù)之和。這種定義和樹編輯距離聯(lián)系密切,可以通過動??態(tài)規(guī)劃或者更高效的分解方法計算| ̄。這個度量值越大,說明兩棵樹的結(jié)構(gòu)差??異越大。集成的樹匹配多樣性度量定義為集成中所有成對樹匹配多樣性度景的??均值,并用集成中最大的成對樹匹配多樣性度量值ij丨一化。??平個例廣,闖2.2展。叩某!曦校担咭浴叮罚ǎ保埽罚浚迹海叮贰模窂模撸ǎd7>7數(shù)掘集上訓(xùn)練??得到的5棵決策樹。數(shù)1W?乜含9個厲性,依次是Clump?Thickness?(CT)、Cel丨??Size?Uniformity?(CSI)、Cell?Shape?Uniformity?(CSH)、Marginal?Adhesion?(MA)、??Single?Epithelial?Cell?Size?(SE)、Bare?Nuclei?(BN)、Bland?Chromatin?(BC)、Nor

決策樹,多樣性


14?第二章結(jié)構(gòu)多樣性??考慮在第一章中提到的預(yù)測是否y?2?X的任務(wù)。圖2.3畫出了三棵決策樹,??樹1和樹2的決策區(qū)域分別與圖1.1中的決策區(qū)域一致。假設(shè)我們己經(jīng)有兩棵決??策樹,樹1和樹3,我們希望從樹1和樹3中再選擇一棵添加到樹1和樹2中??進(jìn)行集成。沒有一個已有的行為多樣性度量可以區(qū)分樹1和樹2,因為它們在??樣本上的預(yù)測結(jié)果完全一致;相比之下,樹匹配多樣性度量會傾向于選擇一個??具有不同結(jié)構(gòu)的樹2而不是另一個樹1。假設(shè)X和7均勻地分布在[0,10],添??加樹1得到的集成誤差的期望值為0.17,而添加樹2得到的集成誤差的期望值??為0.13。在實(shí)際應(yīng)用中,分類器的預(yù)測行為可能會差別很大,因此需要同時考??慮結(jié)構(gòu)多樣性和行為多樣性以得到一個性能好的集成。??T]?|2?3??I?X<3?1?I?X<3?|?[?X<5?1??y/\n??CD?I?Y<J?1???I?Y<3?1?CD????CD???CE>?1?x<7)??⑦?I?Y<7?1??CD???圖2.3:三棵預(yù)測是否:F之X?(X,7?e?[0,10])的決策樹。給定樹1、樹3和圖1.1中的8個樣??本,樹匹配多樣性度量(基于結(jié)構(gòu)多樣性)建議添加樹2而非另一個樹1進(jìn)行集成,然而??已有的多樣性度量(基于行為多樣性)無法區(qū)分樹1和樹2。??2.4實(shí)驗測試??2.4.1集成中分類器基于結(jié)構(gòu)多樣性排序??得到的集成中分類器按照適當(dāng)?shù)捻樞蚺帕泻,集成誤差通常會在中等集成??大小取得最低值[27]。那么,如果集成誤差通過適當(dāng)?shù)呐判蚰軌蚪档停判驑?biāo)準(zhǔn)??對于降低集成誤差也應(yīng)當(dāng)是有益的。??圖2.4繪出了兩個二分類數(shù)據(jù)集和以及兩個多分類數(shù)據(jù)


本文編號:3091451

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3091451.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7170c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com